А что там по RAGу и кто это такая ваша векторизация? 🤔

Сидишь, смотришь на все эти модные буквы: LLM, AI, AGI... А потом вспоминаешь, как нейросеть бодро сочинила тебе документацию по несуществующему API. Классно, но не очень полезно.

Так вот, RAG (Retrieval-Augmented Generation) — это, если просто, пришить мозгу-шаблону внешнюю память.

Раньше: Задал вопрос → LLM порылась в своих застывших знаниях (которые могли устареть вчера) → выдала ответ. Иногда гениальный, иногда — галлюцинацию.

А как стало с RAG:

1. Векторизация: Беру всю свою документацию, отчетность, законы РФ, что угодно — и превращаю в эти самые векторы. По сути, цифровые «отпечатки» смысла. Похожие по смыслу тексты имеют похожие векторы (об этом лучше в другом посте🙃) 2. Поиск: Когда вы задаёте вопрос, система не тыкает пальцем в небо и ничего не придумывает. Она ищет самые релевантные куски текста из вашей базы — те самые, у которых «отпечатки» ближе всего к вопросу. 3. Генерация: И вот эти, найденные, свежие и проверенные данные, мы засовываем в промпт к любой выбранной LLM и говорим: «Друг, ответ на вопрос лежит вот здесь, теперь перескажи это человеческим языком».

Итог: Нейросеть перестаёт фантазировать и начинает работать с вашими данными. Точность высокая, но актуальность — на вашей совести 😅

Кто уже использовал RAG в умных помощниках, чат-ботах для анализа внутренней документации? Поделитесь кейсами👇

#RAG #LLM #Векторизация #AI #NLP #МашинноеОбучение #Разработка

А что там по RAGу и кто это такая ваша векторизация? 🤔 | Сетка — социальная сеть от hh.ru