🚀 AMD представила FlyDSL для GPU-ядер

AMD открыла FlyDSL — Python-библиотеку для создания высокопроизводительных ядер на GPU. Инструмент стал частью экосистемы ROCm.

FlyDSL использует алгебру макетов CuTe и представление FLIR внутри стека MLIR. В отличие от Triton, фреймворк даёт контроль на уровне потоков для экспертной оптимизации. Компиляция через JIT ускоряет итерации по сравнению с шаблонами HIP C++. Поддержка Softmax, GEMM и MoE конкурирует с Composable Kernel.

Решение уже работает в гипермасштабных нагрузках на кластерах MI GPU. Установка через pip install flydsl.

#amd_rocm #flydsl #gpu_kernel #mlir #python_dev #hpc

🚀 AMD представила FlyDSL для GPU-ядер
AMD открыла FlyDSL — Python-библиотеку для создания высокопроизводительных ядер на GPU. Инструмент стал частью экосистемы ROCm | Сетка — социальная сеть от hh.ru