πŸ›‘οΈ Гибкая модСрация с NVIDIA Nemotron

NVIDIA прСдставила модСль Nemotron для Π³ΠΈΠ±ΠΊΠΎΠΉ ΠΈ быстрой ΠΌΠΎΠ΄Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π° Π² AI-прилоТСниях.

МодСль сочСтаСт построСниС логичСских Ρ†Π΅ΠΏΠΎΡ‡Π΅ΠΊ (reasoning) с Π½ΠΈΠ·ΠΊΠΎΠΉ Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ, Ρ‡Ρ‚ΠΎ позволяСт ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π΅Ρ‘ Π² ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ΅Π½Π΅. Она ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚ кастомныС ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ бСзопасности, Π·Π°Π΄Π°Π½Π½Ρ‹Π΅ Π² СстСствСнном языкС β€” Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Β«Π½Π΅ ΠΎΠ±ΡΡƒΠΆΠ΄Π°Ρ‚ΡŒ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΡƒΒ» ΠΈΠ»ΠΈ Β«Π·Π°ΠΏΡ€Π΅Ρ‰Π°Ρ‚ΡŒ PIIΒ». Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Π΄Π²ΡƒΡ… Ρ€Π΅ΠΆΠΈΠΌΠ°Ρ…: с Π²Ρ‹Π²ΠΎΠ΄ΠΎΠΌ обоснования (для слоТных кСйсов) ΠΈ Π±Π΅Π· (для скорости). ΠžΠ±ΡƒΡ‡Π΅Π½Π° Π½Π° датасСтС с Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ рассуТдСний ΠΎΡ‚ Qwen3-32B ΠΈ Gemma-3-4B-it.

МодСль достигаСт точности Π²Ρ‹ΡˆΠ΅ Π°Π½Π°Π»ΠΎΠ³ΠΎΠ² ΠΏΡ€ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ΅ кастомных ΠΏΡ€Π°Π²ΠΈΠ» ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π° 40% быстрСС Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹Ρ… reasoning-Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π° ΠΏΠΎΠ΄ GPU с 8 Π“Π‘ VRAM ΠΈ совмСстима с vLLM, TensorRT-LLM ΠΈ SGLang.

#nvidia #ai_safety #content_moderation #reasoning #llm #guardrails

πŸ›‘οΈ Гибкая модСрация с NVIDIA Nemotron
NVIDIA прСдставила модСль Nemotron для Π³ΠΈΠ±ΠΊΠΎΠΉ ΠΈ быстрой ΠΌΠΎΠ΄Π΅Ρ€Π°Ρ†ΠΈΠΈ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π° Π² AI-прилоТСниях | Π‘Π΅Ρ‚ΠΊΠ° β€” ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ hh.ru