Google Cloud делит GPU на доли для AI
Google Cloud вводит fractional G4 VM — теперь можно арендовать 1/2, 1/4 или 1/8 GPU NVIDIA RTX Pro 6000. Это снижает стоимость запуска AI‑инференса и графических задач — разработчикам стоит пересмотреть инфраструктуру и платить только за нужную долю ускорителя.
Новые VM используют vGPU‑технологию NVIDIA и интегрируются с GKE, где контейнерный binpacking повышает загрузку GPU. Архитектура входит в стек AI Hypercomputer и оптимизирована для инференса моделей до сотен миллиардов параметров. Параллельно Google готовит поддержку платформы NVIDIA Vera Rubin NVL72 и добавляет Nemotron 3 в Vertex AI Model Garden для запуска reasoning‑моделей.
🔗 https://cloud.google.com/blog/products/compute/google-cloud-ai-infrastructure-at-nvidia-gtc-2026