🚀 AMD выпустила ROCm 7.2 для AI и HPC
Вышла новая версия open-source стека ROCm 7.2 с улучшениями для GPU AMD Instinct.
Платформа получила поддержку FP8/FP4 в rocMLIR и MIGraphX, оптимизацию GEMM-ядер для Llama и GLM, а также ThinLTO в компиляторе для глобальной оптимизации. RCCL стал топология-aware, использует 4-NIC сети эффективнее, а GPUDirect Async с GDA снижает задержки. Добавлена SR-IOV и RAS для безопасной виртуализации на MI350X/MI355X.
Новое NPM-управление питанием балансирует частоты GPU в узле, удерживая TDP. Все изменения повышают производительность и надёжность в дата-центрах.