🚀 AMD представила GPU DRA-драйвер для K8s
AMD выпустила DRA-драйвер для управления GPU в Kubernetes на основе нового фреймворка Dynamic Resource Allocation.
Теперь GPU становятся полноценным ресурсом Kubernetes через ResourceSlices — объекты, описывающие атрибуты GPU: модель, PCIe-корень, профиль разделения, память и вычислительные блоки. Пользователи могут заявлять требования через ResourceClaims с CEL-выражениями, например: выбрать два партицированных GPU с одного физического устройства или только MI300X с профилем spx_nps1. Драйвер обеспечивает нативную интеграцию, устраняя зависимость от меток узлов и кастомных Plugin.
Созданные ResourceClaim становятся наблюдаемыми объектами в API — с ними можно отслеживать выделение, аудитировать и делиться между контейнерами в Pod. Поддерживается мультизапрос (GPU + NIC) и динамическое распределение в рамках кластера.
#kubernetes #amd_gpu #dra #gpu_partitioning #rocm #ai_scheduling