🚀 Собирайте ROCm-ядра с Hugging Face

Hugging Face представил инструменты для простой сборки и обмена кастомными ROCm-ядрами.

Благодаря библиотекам kernel-builder и kernels, разработчики могут создавать высокопроизводительные ядра под AMD GPU (например, MI300X) и публиковать их в облаке. Процесс включает структурирование проекта, настройку build.toml и flake.nix, регистрацию PyTorch-операторов и кроссплатформенную сборку через Nix. Поддерживаются FP8-форматы, переброс масштабов и оптимизация под конкретные архитектуры.

Ядро GEMM от RadeonFlow выиграло AMD Developer Challenge 2025, показав высокую эффективность на gfx942.

#rocm #huggingface #gpu_kernels #pytorch #amd #fp8

🚀 Собирайте ROCm-ядра с Hugging Face
Hugging Face представил инструменты для простой сборки и обмена кастомными ROCm-ядрами | Сетка — социальная сеть от hh.ru