Владимир Панов пишет:

🎓 ИИ с нуля. Урок 11/16

RAG - нейросеть читает твои документы

В прошлом уроке модели научились работать не только с текстом, но и с картинками и звуком. Сегодня сдвиг в другом: не в типе файлов, а в источнике знаний. Что если модель отвечает не из памяти, а по твоим конкретным документам?

Проблема: модель знает много, но не знает твоего Про что-то из своего обучения нейронка отвечает уверенно. Но спроси про внутренние документы компании, договор трёхмесячной давности или отчёт за прошлую неделю, и она не знает: этого в обучении не было.

Первое решение: загрузить файл в чат. Работает, но только если файл небольшой и ты знаешь, где ответ. Загрузить 200 договоров и спросить «какие штрафы обсуждали с клиентом Х» уже не выйдет.

Как работает RAG RAG (от английского Retrieval-Augmented Generation, что можно перевести как «генерация с поиском и дополнением») решает эту задачу иначе.

Представь помощника с доступом к твоему шкафу с папками. Ты задаёшь вопрос, он не выдумывает из головы: бежит к шкафу, находит нужную папку, достаёт нужный кусок и только потом отвечает, опираясь на это.

RAG устроен так же: перед ответом система ищет в твоей базе самые подходящие фрагменты, только их передаёт модели, и модель отвечает по ним, а не из общей памяти.

В этом и отличие от «просто загрузить файл»: RAG берёт большие наборы документов и вытаскивает только нужное, а не пихает всё целиком.

Где ты с этим уже встречался Три самых частых сценария: - Кнопка «чат с PDF» в ChatGPT или Claude. Загружаешь объёмный договор, задаёшь узкий вопрос, модель находит нужный раздел и цитирует его. - Корпоративный бот по базе знаний. Компания загружает инструкции, регламенты, часто задаваемые вопросы. Сотрудник спрашивает бота. Тот ищет по внутренним документам, а не по интернету. - Поиск по своим заметкам. Подключаешь Obsidian или Notion к специальному инструменту, и нейронка отвечает по твоим личным записям.

Где ограничения RAG сильно снижает галлюцинации по твоим данным, но не убирает их полностью. Если нужного фрагмента в базе нет или он найден неточно, модель может додумать.

Качество ответа зависит от качества документов: плохо структурированные тексты, нераспознанные сканы, противоречия между файлами ухудшают поиск.

А «из коробки» RAG не всегда заработает: под серьёзные задачи обычно нужна настройка.

Попробуй сейчас Открой ChatGPT или Claude, загрузи длинный документ с конкретной цифрой или датой, которую сложно найти глазами. Спроси прямо про неё, не подсказывая, в каком разделе она стоит.

Посмотри, сошлётся ли модель на конкретный раздел. Так увидишь поиск по документу в действии.

Завтра урок 12: агенты, когда модель не отвечает, а делает.

Ставь 🔥, если хочешь, чтобы нейросеть отвечала по твоим файлам. #курс #спросинейронку