«AI-инженерия. Построение приложений с использованием базовых моделей», Чип Хьюен
В последнее время я стараюсь поглубже влезть в такие темы, как ML и AI. Причина проста — в рабочем проекте активно используются и разрабатываются фичи на базе обоих видов технологий. А руководить разработкой того, в чём не разбираешься — задачка со звёздочкой (и без смысла).
Поэтому я с переменным успехом прохожу курс по ML. И по этой же причине я взял книгу о том, как строить приложения с использованием базовых моделей. Мне не очень интересно, как написать свой GPT, но разбираться в устройстве и принципах работы LLM — довольно полезно и увлекательно.
⭐️ О чём книга
Книга посвящена тому, как адаптировать базовые LLM (и LMM) модели для создания AI-приложений. Она помогает понять, стоит ли вообще разрабатывать приложение на базе AI, какая модель нужна, как её выбрать, что с ней потом делать и так далее.
В книге раскрываются следующие темы: ➡️ Как вообще появилась AI-инженерия ➡️ Как создаются и обучаются LLM-модели ➡️ Как оценивать качество работы AI-систем ➡️ Улучшение результатов работы приложения: промпт-инжиниринг, RAG, дообучение ➡️ Оптимизация AI-приложений
⭐️ 3 идеи из книги 🟡Первый шаг к системной разработке серьёзного AI-приложения — это не выбор модели, а разработка системы оценки качества работы. Без оценки, которая поможет отслеживать сбои, отклонения и неожиданные аномалии, будет невероятно сложно развивать продукт. Помножьте это на вероятностную природу самих LLM, и поймёте, насколько это непростой процесс. Между тем для бизнеса всё ещё важен ROI, и приложение должно доказывать свою полезность.
🟡Один из методов снизить косты на модель — разбить рабочий процесс на шаги и использовать более слабую модель для более простых задач. Чаще всего даже просто разбиение запроса на подзапросы увеличит эффективность, а использование более простой модели сделает обработку одного запроса дешевле.
🟡Дообучение модели может улучшить её способность решать одни задачи, но вместе с этим ухудшить способность решать другие задачи. Если модель используется универсально, для решения множества задач — дообучение может навредить многим рабочим процессам, поэтому заниматься им нужно внимательно и осторожно.
⭐️ Мои впечатления
Для новичка в теме AI книга может оказаться довольно сложной (да даже опытным ребятам она может здорово поломать мозг, я далеко не весь контент переварил). Хотя её толщина может отпугнуть, мне эта книга показалась хорошей, полной и полезной. Она помогла мне неплохо разобраться в том, как устроены модели «под капотом», что влияет на их производительность и сколько всё это удовольствие стоит.
Важно помнить, что эта книга в первую очередь предназначена для тех, кто разрабатывает приложения на базе готовых AI-моделей. Она не учит писать свой GPT или файнтюнить модели. Её задача — дать читателю базу понимания того, как нужно работать с моделями так, чтобы это было качественно и экономически выгодно.
Если вы делаете приложение на базе AI — я очень рекомендую изучить эту книгу. Даже если вы уже неплохо разбираетесь в вопросе, она поможет вам углубиться в важные детали работы LLM-ок, которые влияют на конечный результат вашего приложения.
Все мои обзоры книг доступны по тегу #обзор_книги и в этом посте.
А для тех, кто хочет читать с большей пользой, у меня есть статья с описанием моего процесса чтения и упражнениями.
➖➖➖➖➖➖➖➖➖➖➖ 📝 @ulshinblog 💬 Бэкап канала в Max
В этом посте были ссылки, но мы их удалили по правилам Сетки