🛡️ Гибкая модерация с NVIDIA Nemotron NVIDIA представила модель Nemotron для гибкой и быстрой модерации контента в AI-приложениях

🛡️ Гибкая модерация с NVIDIA Nemotron

NVIDIA представила модель Nemotron для гибкой и быстрой модерации контента в AI-приложениях.

Модель сочетает построение логических цепочек (reasoning) с низкой задержкой, что позволяет применять её в продакшене. Она понимает кастомные политики безопасности, заданные в естественном языке — например, «не обсуждать политику» или «запрещать PII». Работает в двух режимах: с выводом обоснования (для сложных кейсов) и без (для скорости). Обучена на датасете с цепочками рассуждений от Qwen3-32B и Gemma-3-4B-it.

Модель достигает точности выше аналогов при проверке кастомных правил и работает на 40% быстрее традиционных reasoning-решений. Оптимизирована под GPU с 8 ГБ VRAM и совместима с vLLM, TensorRT-LLM и SGLang.

#nvidia #ai_safety #content_moderation #reasoning #llm #guardrails