Контекстный MAB, или как вдохнуть мотивацию в LLM.
Одна из главных проблем LLM в взаимодействии с человеком - отсутствие настоящего интереса и мотивации вести диалог осознанно.
Для чего это важно/нужно?
Например, в продажах.
Живой менеджер продаёт не только по инструкции: у него есть конкретные цели и мотивация - заработать на хлеб, машину, ипотеку, порадовать жену, решить проблему со здоровьем.
У ИИ такой мотивации нет - он лишь реагирует на внешние триггеры, но не проявляет инициативу, потому что хочется, например, железо своё проапрейдить.
Решить это можно с помощью контекстного MAB - инструмента, который обычно применяют в рекомендательных системах, не задумываясь, что он может стать одним из компонентов поведенческой оркестрации.
Arms в этом случае - это динамически подгружаемые гайдлайны поведения, которые инжектятся в генерацию ответа в зависимости от ситуации.
MAB может самообучаться, гибко подстраиваться и “давить на газ” там, где это нужно для результата.
P.S. Чтобы приблизить поведенческие способности ИИ в коммуникации к человеческим - нужно научиться жарить блины на дне сковородки:)