Модельки уже чуть ли не каждый день выходят 😅 OpenAI выкатили o3 и o4-mini. Утверждают, что это их самые умные модели на сегодня, которые натренированы думать дольше перед ответом

Модельки уже чуть ли не каждый день выходят 😅

OpenAI выкатили o3 и o4-mini. Утверждают, что это их самые умные модели на сегодня, которые натренированы думать дольше перед ответом. Но нам важнее другое: как они справляются с кодом? 🐍

1. o3 называют самой мощной моделью для программирования на данный момент. Лучшие результаты на бенчмарках вроде Codeforces и SWE-bench. А o4-mini просто показывает отличные результаты для своей "весовой категории" и цены.

2. Агентное использование инструментов (Python внутри!). Вот это, пожалуй, самое интересное. Модели обучены использовать инструменты прямо во время размышления. Для нас это значит, что они могут не просто сгенерить кусок кода, а:

Запускать Python-код для анализа данных (в том числе из загруженных файлов).
Искать инфу в вебе по ходу решения задачи.
Анализировать визуальные входы (скриншоты ошибок, диаграммы архитектуры). Они сами решают, когда и какой инструмент применить для решения сложной, многошаговой задачи.

3. Новый инструмент — Codex CLI (опенсорсный CLI-агент для программирования). Штука работает локально в терминале и заточена под использование новых моделей. Можно скармливать скриншоты, код, диаграммы прямо из командной строки. Звучит как минималистичный, но потенциально мощный помощник.

Модели уже раскатывают для платных подписчиков ChatGPT, API тоже доступно. o4-mini смогут попробовать и бесплатные юзеры.

🍩 Поддержать канал 🫶

еще контент автора

еще контент автора

войдите, чтобы продолжить

мы не знаем, безопасна ли ссылка