GPT OSS, новое семейство моделей с открытым исходным кодом

OpenAI делает значительный шаг к открытости, представив новое семейство моделей GPT OSS. Это мощные инструменты, которые делают передовые возможности ИИ доступными для более широкого круга разработчиков и компаний.

В новом семействе представлены две модели: gpt-oss-120b (117 млрд общих параметров) и gpt-oss-20b (21 млрд общих параметров). Обе модели используют инновационную архитектуру «Смесь экспертов» (MoE), что позволяет им эффективно обрабатывать запросы, выбирая наиболее подходящих «экспертов». Они специально обучены для выполнения сложных инструкций и логических рассуждений, поддерживая «ход мыслей».

Особое внимание уделено доступности: благодаря 4-битному квантованию в формате mxfp4, меньшая модель может работать на GPU с 16 ГБ памяти, а большая — на одной карте H100, что делает их пригодными даже для потребительского оборудования. Лицензия Apache 2.0 способствует их широкому и свободному использованию.

Для удобства развертывания предлагаются готовые решения через Hugging Face, Azure AI Model Catalog и Dell Enterprise Hub, а также инструменты для локального запуска, включая библиотеки transformers, llama.cpp и vLLM. Эта инициатива значительно расширяет возможности разработчиков и компаний, особенно для проектов, требующих конфиденциальности данных. Ожидается, что эти модели станут катализатором для дальнейших инноваций в индустрии ИИ.

Ссылка на оригинал - https://huggingface.co/blog/welcome-openai-gpt-oss

GPT OSS, новое семейство моделей с открытым исходным кодом | Сетка — социальная сеть от hh.ru
repost

33

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь