💸 Blackwell резко удешевил ИИ-вывод
Ведущие провайдеры ИИ-вывода сократили стоимость токена до 10 раз с помощью Blackwell.
NVIDIA Blackwell с NVFP4, TensorRT-LLM и Dynamo ускоряет вывод открытых моделей. Провайдеры — Baseten, DeepInfra, Fireworks AI, Together AI — оптимизируют стек под Blackwell, комбинируя low-precision вычисления, MoE-архитектуры и эффективное масштабирование. Это даёт до 10x прироста производительности на доллар против Hopper.
Baseten сократил затраты на 90%, DeepInfra — в 4 раза, Fireworks AI достиг 50% экономии, Together AI — в 6 раз.
#ai_inference #nvidia_blackwell #tokenomics #llm #moe #open_source