πŸš€ Π‘ΠΎΠ±ΠΈΡ€Π°ΠΉΡ‚Π΅ ROCm-ядра с Hugging Face

Hugging Face прСдставил инструмСнты для простой сборки ΠΈ ΠΎΠ±ΠΌΠ΅Π½Π° кастомными ROCm-ядрами.

Благодаря Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°ΠΌ kernel-builder ΠΈ kernels, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ Π²Ρ‹ΡΠΎΠΊΠΎΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ядра ΠΏΠΎΠ΄ AMD GPU (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, MI300X) ΠΈ ΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… Π² ΠΎΠ±Π»Π°ΠΊΠ΅. ΠŸΡ€ΠΎΡ†Π΅ΡΡ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ структурированиС ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°, настройку build.toml ΠΈ flake.nix, Ρ€Π΅Π³ΠΈΡΡ‚Ρ€Π°Ρ†ΠΈΡŽ PyTorch-ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€ΠΎΠ² ΠΈ ΠΊΡ€ΠΎΡΡΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠ΅Π½Π½ΡƒΡŽ сборку Ρ‡Π΅Ρ€Π΅Π· Nix. ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ΡΡ FP8-Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Ρ‹, пСрСброс ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΎΠ² ΠΈ оптимизация ΠΏΠΎΠ΄ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Π΅ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.

Π―Π΄Ρ€ΠΎ GEMM ΠΎΡ‚ RadeonFlow Π²Ρ‹ΠΈΠ³Ρ€Π°Π»ΠΎ AMD Developer Challenge 2025, ΠΏΠΎΠΊΠ°Π·Π°Π² Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π½Π° gfx942.

#rocm #huggingface #gpu_kernels #pytorch #amd #fp8

πŸš€ Π‘ΠΎΠ±ΠΈΡ€Π°ΠΉΡ‚Π΅ ROCm-ядра с Hugging Face
Hugging Face прСдставил инструмСнты для простой сборки ΠΈ ΠΎΠ±ΠΌΠ΅Π½Π° кастомными ROCm-ядрами | Π‘Π΅Ρ‚ΠΊΠ° β€” ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Π°Ρ ΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ hh.ru