🚀 Flash Attention на AMD за 80 строк

AMD показала сверхэффективную реализацию Flash Attention для MI300X с помощью TileLang.

TileLang — это DSL для разработки GPU-ядер, который скрывает низкоуровневые

читать далее
🚀 Flash Attention на AMD за 80 строк
AMD показала сверхэффективную реализацию Flash Attention для MI300X с помощью TileLang | Сетка — социальная сеть от hh.ru