Никита Ульшин про IT пишет:

«AI-инженерия. Построение приложений с использованием базовых моделей», Чип Хьюен

В последнее время я стараюсь поглубже влезть в такие темы, как ML и AI. Причина проста — в рабочем проекте активно используются и разрабатываются фичи на базе обоих видов технологий. А руководить разработкой того, в чём не разбираешься — задачка со звёздочкой (и без смысла).

Поэтому я с переменным успехом прохожу курс по ML. И по этой же причине я взял книгу о том, как строить приложения с использованием базовых моделей. Мне не очень интересно, как написать свой GPT, но разбираться в устройстве и принципах работы LLM — довольно полезно и увлекательно.

⭐️ О чём книга

Книга посвящена тому, как адаптировать базовые LLM (и LMM) модели для создания AI-приложений. Она помогает понять, стоит ли вообще разрабатывать приложение на базе AI, какая модель нужна, как её выбрать, что с ней потом делать и так далее.

В книге раскрываются следующие темы: ➡️ Как вообще появилась AI-инженерия ➡️ Как создаются и обучаются LLM-модели ➡️ Как оценивать качество работы AI-систем ➡️ Улучшение результатов работы приложения: промпт-инжиниринг, RAG, дообучение ➡️ Оптимизация AI-приложений

⭐️ 3 идеи из книги 🟡Первый шаг к системной разработке серьёзного AI-приложения — это не выбор модели, а разработка системы оценки качества работы. Без оценки, которая поможет отслеживать сбои, отклонения и неожиданные аномалии, будет невероятно сложно развивать продукт. Помножьте это на вероятностную природу самих LLM, и поймёте, насколько это непростой процесс. Между тем для бизнеса всё ещё важен ROI, и приложение должно доказывать свою полезность.

🟡Один из методов снизить косты на модель — разбить рабочий процесс на шаги и использовать более слабую модель для более простых задач. Чаще всего даже просто разбиение запроса на подзапросы увеличит эффективность, а использование более простой модели сделает обработку одного запроса дешевле.

🟡Дообучение модели может улучшить её способность решать одни задачи, но вместе с этим ухудшить способность решать другие задачи. Если модель используется универсально, для решения множества задач — дообучение может навредить многим рабочим процессам, поэтому заниматься им нужно внимательно и осторожно.

⭐️ Мои впечатления

Для новичка в теме AI книга может оказаться довольно сложной (да даже опытным ребятам она может здорово поломать мозг, я далеко не весь контент переварил). Хотя её толщина может отпугнуть, мне эта книга показалась хорошей, полной и полезной. Она помогла мне неплохо разобраться в том, как устроены модели «под капотом», что влияет на их производительность и сколько всё это удовольствие стоит.

Важно помнить, что эта книга в первую очередь предназначена для тех, кто разрабатывает приложения на базе готовых AI-моделей. Она не учит писать свой GPT или файнтюнить модели. Её задача — дать читателю базу понимания того, как нужно работать с моделями так, чтобы это было качественно и экономически выгодно.

Если вы делаете приложение на базе AI — я очень рекомендую изучить эту книгу. Даже если вы уже неплохо разбираетесь в вопросе, она поможет вам углубиться в важные детали работы LLM-ок, которые влияют на конечный результат вашего приложения.

Все мои обзоры книг доступны по тегу #обзор_книги и в этом посте.

А для тех, кто хочет читать с большей пользой, у меня есть статья с описанием моего процесса чтения и упражнениями.

➖➖➖➖➖➖➖➖➖➖➖ 📝 @ulshinblog 💬 Бэкап канала в Max

В этом посте были ссылки, но мы их удалили по правилам Сетки