🚀 AMD представила FlyDSL для GPU-ядер
AMD открыла FlyDSL — Python-библиотеку для создания высокопроизводительных ядер на GPU. Инструмент стал частью экосистемы ROCm.
FlyDSL использует алгебру макетов CuTe и представление FLIR внутри стека MLIR. В отличие от Triton, фреймворк даёт контроль на уровне потоков для экспертной оптимизации. Компиляция через JIT ускоряет итерации по сравнению с шаблонами HIP C++. Поддержка Softmax, GEMM и MoE конкурирует с Composable Kernel.
Решение уже работает в гипермасштабных нагрузках на кластерах MI GPU. Установка через pip install flydsl.