🚀 Собирайте ROCm-ядра с Hugging Face
Hugging Face представил инструменты для простой сборки и обмена кастомными ROCm-ядрами.
Благодаря библиотекам kernel-builder и kernels, разработчики могут создавать высокопроизводительные ядра под AMD GPU (например, MI300X) и публиковать их в облаке. Процесс включает структурирование проекта, настройку build.toml и flake.nix, регистрацию PyTorch-операторов и кроссплатформенную сборку через Nix. Поддерживаются FP8-форматы, переброс масштабов и оптимизация под конкретные архитектуры.
Ядро GEMM от RadeonFlow выиграло AMD Developer Challenge 2025, показав высокую эффективность на gfx942.