Nemotron 3 Nano 4B: ИИ теперь на устройстве
NVIDIA выпустила компактную модель 4B для локального запуска. Это значит, что ИИ можно держать на устройстве с низкой задержкой и приватностью и стоит протестировать для edge-задач и офлайн-агентов.
Модель использует гибрид Mamba и Transformer, что дает баланс скорости и качества. Оптимизирована под RTX и Jetson, поддерживает квантование FP8 и GGUF для снижения потребления памяти. Обучена через дистилляцию из 9B версии с сохранением reasoning-навыков. Важны не только производительность, но и возможность кастомизации под свои сценарии и инструменты.