AI Open Space пишет:

Google Cloud делит GPU на доли для AI

Google Cloud вводит fractional G4 VM — теперь можно арендовать 1/2, 1/4 или 1/8 GPU NVIDIA RTX Pro 6000. Это снижает стоимость запуска AI‑инференса и графических задач — разработчикам стоит пересмотреть инфраструктуру и платить только за нужную долю ускорителя.

Новые VM используют vGPU‑технологию NVIDIA и интегрируются с GKE, где контейнерный binpacking повышает загрузку GPU. Архитектура входит в стек AI Hypercomputer и оптимизирована для инференса моделей до сотен миллиардов параметров. Параллельно Google готовит поддержку платформы NVIDIA Vera Rubin NVL72 и добавляет Nemotron 3 в Vertex AI Model Garden для запуска reasoning‑моделей.

🔗 https://cloud.google.com/blog/products/compute/google-cloud-ai-infrastructure-at-nvidia-gtc-2026

#GoogleCloud #NVIDIA #GPU #AIInfrastructure #VertexAI

$Google Cloud делит GPU на доли для AI Google Cloud вводит fractional G4 VM — теперь можно арендовать 1/2, 1/4 или 1/8 GPU NVIDIA RTX Pro 6000 | Сетка — социальная сеть от hh.ru$

еще контент в этом сообществе