LLM в RecSys только начинают использовать. В полноценных рекомендательных системах это пока выглядит слишком дорого. Так или иначе, всю базу айтемов в контекст не положить, а значит, их нужно предварительно ранжировать, что возвращает нас к классическим методам.
• OneRec / MiniOneRec (Kuaishou, 2025): Интересное решение и в open-source. Авторы первыми объединили все стадии RecSys в единую генеративную нейросеть. Проблема миллиардов ID решается через Semantic IDs (документ кодируется короткой последовательностью из 3-4 токенов с помощью RQ-VAE). Работает на 25% трафика в системе с 400 млн DAU.
• PLUM (YouTube / Google, 2025): Адаптация предобученных LLM для видеорекомендаций. Элементы кодируются как Semantic IDs, затем проводится дообучение (CPT - continued pre-training) на доменных данных. Как итог - получение более качественных эмбеддингов на огромных датасетах.
• RecAI / InteRecAgent (Microsoft, 2025-2026) и RecGPT / RecGPT-V2 (Taobao, 2025): Использование LLM в качестве оркестратора классических моделей. Решение от Taobao выглядит интереснее: там применяется мета-промптинг, дообучение с помощью модели LLM-as-a-reward, а также LLM-as-a-judge для проверки качества тегов. В целом, это наиболее приближенное к реальности решение, которое вполне можно внедрять по частям
• PinRec (Pinterest, 2025) и LinkedIn Retrieval (2025): LLM выступает как dual-encoder для юзеров и контента. Сюда же можно отнести UniRec (2026), добавляющую мультимодальность.
• Опасности и уязвимости - RoLLMRec (2026): Продавцы могут внедрять промпт-инъекции в описания товаров и, как следствие, ломать выдачу LLM-рекомендаций. В статье рассматривается защита через RAG-валидацию и модули фильтрации
PS На картинке как раз решение от taobao