💸 Blackwell резко удешевил ИИ-вывод

Ведущие провайдеры ИИ-вывода сократили стоимость токена до 10 раз с помощью Blackwell.

NVIDIA Blackwell с NVFP4, TensorRT-LLM и Dynamo ускоряет вывод открытых моделей. Провайдеры — Baseten, DeepInfra, Fireworks AI, Together AI — оптимизируют стек под Blackwell, комбинируя low-precision вычисления, MoE-архитектуры и эффективное масштабирование. Это даёт до 10x прироста производительности на доллар против Hopper.

Baseten сократил затраты на 90%, DeepInfra — в 4 раза, Fireworks AI достиг 50% экономии, Together AI — в 6 раз.

#ai_inference #nvidia_blackwell #tokenomics #llm #moe #open_source

💸 Blackwell резко удешевил ИИ-вывод
Ведущие провайдеры ИИ-вывода сократили стоимость токена до 10 раз с помощью Blackwell | Сетка — социальная сеть от hh.ru