🧠 NVIDIA выпустила Cosmos Reason 2 для физического ИИ
NVIDIA представила открытую модель виденья и рассуждений Cosmos Reason 2 для роботов и физических AI-агентов.
Модель обладает улучшенным пониманием пространства и времени, работает с контекстом до 256K токенов и точными временными метками. Поддерживает 2D/3D-локализацию, траектории, OCR и боксы. Доступна в версиях 2B и 8B параметров — от edge-устройств до облака. Уже используется в роботах, автопилотах и системах видеонаблюдения. Salesforce, Uber и Encord применяют её для анализа видео, аннотации AV-данных и планирования действий роботов.
На задачах аннотирования видео для автономных авто BLEU вырос на 10.6%, LingoQA — на 13.8%.
#nvidia #cosmos_reason #physical_ai #vlm #robotics #vision_language_model
· 06.01
Хорошая новость?
ответить
коммент удалён