🎓 ИИ с нуля. Урок 8/16: Температура, почему ответы разные

В прошлом уроке разобрали системный промпт: как невидимые инструкции задают модели роль и ограничения. Но даже с одинаковыми инструкциями и одним и тем же вопросом нейронка в разных чатах ответит по-разному. Почему?

Что такое температура Когда модель выбирает следующий токен, у неё под рукой список вариантов с вероятностями. Слово «кот» набрало 40%, «животное» 25%, «питомец» 20%, и дальше редкие варианты с мелкими долями.

Температура (параметр от 0 до 2 в большинстве моделей) регулирует, насколько строго модель следует этому рейтингу. При низкой температуре модель почти всегда выбирает самый вероятный вариант. Ответы повторяемы, предсказуемы, собранны. Запусти один и тот же запрос десять раз, получишь почти одинаковый результат. При высокой температуре вероятности как бы «выравниваются»: слабые варианты получают больший шанс на выход. Модель чаще выбирает неожиданные слова. Ответы живее и интереснее, но и ошибок больше.

Можно представить это как ручку-регулятор между двумя режимами. С одной стороны: «скучно, но надёжно». С другой: «творчески, но непредсказуемо».

Почему один вопрос каждый раз звучит по-разному Вот откуда знакомый эффект. Закрыл чат, открыл новый, задал тот же вопрос про «пять идей для подарка» и получил другой список. Не потому что модель «передумала». Просто каждый раз на развилках она случайно выбирает из нескольких достаточно вероятных вариантов, и цепочка уходит в другую сторону.

По умолчанию большинство сервисов держат температуру около 0.7: живо, но без ухода в выдумки.

Когда нужна низкая температура, а когда высокая Это не технический вопрос, а практический. Низкую температуру хочется там, где важна точность: факты, код, юридические формулировки, медицинские вопросы, финансовые расчёты. Любое случайное «украшение» ответа здесь вредно. Высокую температуру хочется там, где важна свежесть: брейншторм, слоганы, названия, сюжетные идеи, нестандартные углы на привычную тему. Пусть модель рискует словами.

В обычных чатах типа ChatGPT или Claude температура зашита и не регулируется. А через API или Playground есть ползунок, и её можно крутить вручную.

Попробуй сейчас Открой ChatGPT или любую другую нейронку. Начни новый чат и напиши: «Придумай три необычных названия для кафе с атмосферой советских санаториев. Только названия, без объяснений.» Закрой чат и начни ещё один, свежий. Отправь точно такой же запрос.

Сравни два ответа. Почти наверняка они будут разными, хотя вопрос одинаковый. Ты увидишь температуру в действии: модель каждый раз проходит по вероятностям заново и выбирает по-другому.

Завтра урок 9: reasoning, что значит «модель думает».

Ставь 🔥, если теперь понятно, почему ответы каждый раз разные. #курс #спросинейронку