Yandex Cloud оптимизировал использование опенсорс-моделей для корпоративного сектораСегодня стало известно, что Yandex Cloud обновил свой сервис Foundation Models, добавив функцию запуска ML-моделей на выделенных вычислительных ресурсах по требованию клиента.
В режиме Dedicated Inference Endpoint теперь можно развернуть не только собственные модели YandexGPT, но и популярные опенсорс-решения, такие как Qwen, Mixtral, DeepSeek, LLaMa и прочие. При этом пользователю не придётся самостоятельно заниматься развёртыванием инфраструктуры, настройкой работы или мониторингом — все эти задачи могут быть поручены специалистам Яндекса.
Клиенту достаточно зарезервировать необходимые вычислительные мощности, что гарантирует стабильную работу сервиса даже при высоких нагрузках, а также позволяет фиксировать определённые версии нейросетей для решения конкретных бизнес-задач.
За консультационные услуги и подбор ресурсов дополнительная плата не взимается, а стоимость конфигурации будет рассчитываться индивидуально для каждого заказчика, так как стандартных тарифов пока не определено.
#УЦФОРС