Контекстный MAB, или как вдохнуть мотивацию в LLM.

Одна из главных проблем LLM в взаимодействии с человеком - отсутствие настоящего интереса и мотивации вести диалог осознанно.

Для чего это важно/нужно?

Например, в продажах.

Живой менеджер продаёт не только по инструкции: у него есть конкретные цели и мотивация - заработать на хлеб, машину, ипотеку, порадовать жену, решить проблему со здоровьем.

У ИИ такой мотивации нет - он лишь реагирует на внешние триггеры, но не проявляет инициативу, потому что хочется, например, железо своё проапрейдить.

Решить это можно с помощью контекстного MAB - инструмента, который обычно применяют в рекомендательных системах, не задумываясь, что он может стать одним из компонентов поведенческой оркестрации.

Arms в этом случае - это динамически подгружаемые гайдлайны поведения, которые инжектятся в генерацию ответа в зависимости от ситуации.

MAB может самообучаться, гибко подстраиваться и “давить на газ” там, где это нужно для результата.

P.S. Чтобы приблизить поведенческие способности ИИ в коммуникации к человеческим - нужно научиться жарить блины на дне сковородки:)