🚀 MXFP4/6 квантует генерацию изображений

AMD представила поддержку MXFP4 и MXFP6 на GPU MI350 — форматов, сочетающих высокую скорость и точность.

MXFP4 и MXFP6 — это низкобитные форматы по спецификации OCP Microscaling Formats, использующие плавающую точку с общим масштабным множителем E8M0 на блок из 32 значений. Это расширяет динамический диапазон FP4/FP6, сохраняя точность при квантовании. Форматы эффективны для тяжелых хвостов в активациях и внимании — их часто имеют модели генерации.

MXFP6 почти не теряет в качесвте против BF16: в FLUX.1-schnell разница в CLIP Score — 0.0001, а в видео (Wan2.1-T2V) средний балл — 0.8292 против 0.8311.

#mxfp #amd_mi350 #genai #quantization #gfx11 #rocm

🚀 MXFP4/6 квантует генерацию изображений
AMD представила поддержку MXFP4 и MXFP6 на GPU MI350 — форматов, сочетающих высокую скорость и точность | Сетка — социальная сеть от hh.ru 🚀 MXFP4/6 квантует генерацию изображений
AMD представила поддержку MXFP4 и MXFP6 на GPU MI350 — форматов, сочетающих высокую скорость и точность | Сетка — социальная сеть от hh.ru