Nemotron 3 Nano 4B: ИИ теперь на устройстве NVIDIA выпустила компактную модель 4B для локального запуска

Nemotron 3 Nano 4B: ИИ теперь на устройстве

NVIDIA выпустила компактную модель 4B для локального запуска. Это значит, что ИИ можно держать на устройстве с низкой задержкой и приватностью и стоит протестировать для edge-задач и офлайн-агентов.

Модель использует гибрид Mamba и Transformer, что дает баланс скорости и качества. Оптимизирована под RTX и Jetson, поддерживает квантование FP8 и GGUF для снижения потребления памяти. Обучена через дистилляцию из 9B версии с сохранением reasoning-навыков. Важны не только производительность, но и возможность кастомизации под свои сценарии и инструменты.

🔗 https://huggingface.co/blog/nvidia/nemotron-3-nano-4b

#AI #LLM #EdgeAI #NVIDIA #Inference