Qwen представила open-weight модели Qwen-AgentWorld для симуляции реальных сред

Qwen выложила open-weight семейство Qwen-AgentWorld — модели для симуляции сред, в которых живут агенты: web, terminal, coding, search, OS и Android. Для агентных систем это полезнее очередного «умного чатбота»: тут речь уже о проверке поведения в более похожих на жизнь сценариях.

Флагман на 397B, по драфту, набрал 58,71 на новом агентном бенчмарке, а версия 35B MoE обошла Sonnet 4.6. Особенно заметен прирост в coding, web и terminal. Веса уже доступны на Hugging Face — то есть это не презентация на слайдах, а материал, с которым можно работать.

Источник: Machinelearning

Все новости: ai.popovs.tech

#HuggingFace #Claude #GitHub