25.07
Qwen продолжает радовать новыми моделями 🤓
На днях китайские коллеги выкатили Qwen3-235B-A22B-Instruct-2507 — очередную версию своей языковой модели. Цифры в названии говорят сами за себя: 235 миллиардов параметров, архитектура A22B и дата релиза 25.07.
Что интересно — модель показывает впечатляющие результаты в бенчмарках, особенно в задачах на рассуждение и логику. Напомню, что режим рассуждений — когда нейросеть пошагово решает сложные задачи. Модель поддерживает 119 языков и диалектов и обладает широкой базой знаний. Как говорят эксперты, что видно на экспериментах, она по некоторым метрикам даже обходит более именитых конкурентов.
Ребята из Поднебесной продолжают радовать — при всех имеющихся ограничениях умудряются выдавать качественные продукты на уровне мировых лидеров.
Модель доступна для тестирования через API, так что можете сами попробовать и оценить. Интересно будет посмотреть на реальные кейсы использования. Сейчас уже модель доступна и на российском рынке благодаря Yandex B2B Tech. На платформе Yandex Cloud AI Studio вообще доступны 24 модели. Это нейросети из семейств Qwen, DeepSeek и Gemma и другие в пакетном режиме.
А вообще радует и немного пугает, как быстро развивается эта область — буквально каждый день выходят новые модели с улучшенными показателями. Технологии не стоят на месте.
еще контент в этом сообществе
еще контент в этом соообществе
25.07
войдите, чтобы увидеть
и подписаться на интересных профи