Новости за последний час
DeepMind вместе с Шейном Леггом и Мэттью Ботвиником предложила фреймворк для оценки прогресса к AGI: интеллект разложили на 10 когнитивных способностей и добавили трёхэтапный протокол, чтобы строить профиль модели, а не спорить, «AGI это уже или нет».
Идея здравая именно потому, что нынешние тесты часто упираются в загрязнённые бенчмарки и слишком узкие академические задачи. Если подход приживётся, он может лучше показывать, где модель сильна, где ломается и как она сравнивается с людьми.
Компании тем временем начинают считать деньги на ИИ уже на уровне запросов: сотрудники запускают дорогие модели ради писем, перефразирования и прочей рутины, а бюджеты на это быстро тают. В ответ вводят лимиты, мониторинг и более дешёвые инструменты для простых задач.
Источники: gonzo-обзоры ML статей, TechCrunch
Все новости: ai.popovs.tech