🚀 Вышел ROCm 7.1 для AI и HPC

AMD представила ROCm 7.1 — обновлённую версию открытой платформы для высокопроизводительных вычислений и ИИ.

Версия улучшает производительность GPU через оптимизацию HIP-рантайма: добавлены 2D/3D копии памяти, асинхронные операции, управление потоками и улучшенный предзагрузчик памяти. Обновлены hipBLAS и hipBLASLt — теперь с поддержкой TF32, FP16/BF16 и fused-epilogue-операций для ускорения GEMM. Работа с многоузловыми системами улучшена за счёт RCCL: снижена задержка small- и medium-трансферов, добавлены батчинг P2P и новые алгоритмы коммуникации. Поддержка расширена до Debian 13, Ubuntu 24.04.4, RHEL 10.1 и других ОС, включая виртуализацию через KVM SR-IOV.

Добавлен динамический аттач профилировщика по PID, TUI-интерфейс и новый формат rocpd на основе SQLite3. ROCgdb покрывает до 80% кода, а AMD SMI теперь позволяет виртуальным машинам устанавливать power cap на GPU.

#rocm #amd #ai #hpc #gpu #developer_tools

🚀 Вышел ROCm 7.1 для AI и HPC
AMD представила ROCm 7.1 — обновлённую версию открытой платформы для высокопроизводительных вычислений и ИИ | Сетка — социальная сеть от hh.ru