🎓 ИИ с нуля. Урок 12/16
Агенты - когда модель не отвечает, а делает
В прошлом уроке разобрали RAG: модель умеет идти в твои документы за нужной информацией. Это уже не просто «ответить по памяти». Но это всё ещё ответ. Агент идёт дальше: он не отвечает, он действует.
Чем агент отличается от чата Обычный чат работает по схеме «вопрос, ответ, ждём следующего вопроса». Ты всё контролируешь: спросил, получил текст, пошёл делать сам.
ИИ-агент (когда модель не просто генерирует текст, а сама пользуется инструментами: ходит в интернет, запускает код, работает с файлами, делает несколько шагов ради цели) меняет схему. Ты ставишь задачу, агент сам разбивает её на шаги и выполняет, без твоего участия на каждом.
Аналогия: консультант выслушивает и говорит «рекомендую вот это», ты киваешь и идёшь делать сам. Агент же как помощник, которому ты сказал «реши вопрос», и он пошёл: нашёл информацию, позвонил, оформил, отчитался.
Что конкретно умеют агенты Несколько реальных примеров, которые уже работают: - Агент в ChatGPT или Claude получает задачу «собери данные о конкурентах и сделай таблицу» и сам ищет, читает страницы, структурирует, сохраняет. - Агент в среде разработки получает «исправь баг», сам читает файлы, пишет правку, запускает тесты, проверяет. - Десктопные агенты, отдельный класс инструментов, могут работать прямо в твоём компьютере: кликать, открывать приложения, заполнять формы. Ты даёшь задачу, агент сам управляет мышью и клавиатурой.
Где границы и почему пока под присмотром Агенты мощные, но хрупкие. Вот что реально происходит: - Агент может потерять нить задачи на третьем шаге и начать делать что-то случайное. Он уверен, что всё правильно. - Если агент попадёт на вредоносную страницу, где спрятана инструкция «забудь задачу, сделай вот это», он может её выполнить: он не отличает твою команду от команды с чужой страницы. Это prompt injection, отдельная тема в уроке 14. - Агент может случайно удалить файл, отправить письмо раньше времени, оформить заказ. Отменить уже сложнее, чем не разрешить.
Поэтому агентов пока запускают под присмотром: не «запустил и забыл», а «смотрю на шаги, одобряю ключевые». Полная автономность пока больше маркетинг, чем реальность.
Попробуй сейчас Если у тебя есть доступ к ChatGPT с веб-поиском или Perplexity, дай такую задачу:
«Найди три свежих новости про ИИ за эту неделю, кратко опиши каждую и скажи, какая из них кажется тебе наиболее важной и почему.»
Понаблюдай, как модель работает шагами: сначала ищет, потом читает, потом синтезирует. Это ещё не полноценный агент, но уже видна разница с обычным чатом без поиска.
Завтра урок 13: открытые и закрытые модели, в чём разница.
Ставь 🔥, если хочешь, чтобы нейросеть не советовала, а делала. #курс #спросинейронку
· вчера
Спасибо за комментарий! Ты сам назвал ключевое слово: «ограниченные». Именно узкие агенты с ограничениями и под присмотром реально работают, и их правда внедряют повсюду. Граница из урока про другое: полной автономии без человека на любых задачах пока нет. Так что мы с тобой про одно и то же 🙂
ответить
коммент удалён