Qwen продолжает радовать новыми моделями 🤓

На днях китайские коллеги выкатили Qwen3-235B-A22B-Instruct-2507 — очередную версию своей языковой модели. Цифры в названии говорят сами за себя: 235 миллиардов параметров, архитектура A22B и дата релиза 25.07.

Что интересно — модель показывает впечатляющие результаты в бенчмарках, особенно в задачах на рассуждение и логику. Напомню, что режим рассуждений — когда нейросеть пошагово решает сложные задачи. Модель поддерживает 119 языков и диалектов и обладает широкой базой знаний. Как говорят эксперты, что видно на экспериментах, она по некоторым метрикам даже обходит более именитых конкурентов.

Ребята из Поднебесной продолжают радовать — при всех имеющихся ограничениях умудряются выдавать качественные продукты на уровне мировых лидеров.

Модель доступна для тестирования через API, так что можете сами попробовать и оценить. Интересно будет посмотреть на реальные кейсы использования. Сейчас уже модель доступна и на российском рынке благодаря Yandex B2B Tech. На платформе Yandex Cloud AI Studio вообще доступны 24 модели. Это нейросети из семейств Qwen, DeepSeek и Gemma и другие в пакетном режиме.

А вообще радует и немного пугает, как быстро развивается эта область — буквально каждый день выходят новые модели с улучшенными показателями. Технологии не стоят на месте.

repost

896

input message

напишите коммент

А как вам Qwen3-Coder? Сильный агент программирования.

ответить

Наконец-то появилась функция генерации изображений))

ответить

еще контент в этом сообществе

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь