🚀 MXFP4/6 квантует генерацию изображений
AMD представила поддержку MXFP4 и MXFP6 на GPU MI350 — форматов, сочетающих высокую скорость и точность.
MXFP4 и MXFP6 — это низкобитные форматы по спецификации OCP Microscaling Formats, использующие плавающую точку с общим масштабным множителем E8M0 на блок из 32 значений. Это расширяет динамический диапазон FP4/FP6, сохраняя точность при квантовании. Форматы эффективны для тяжелых хвостов в активациях и внимании — их часто имеют модели генерации.
MXFP6 почти не теряет в качесвте против BF16: в FLUX.1-schnell разница в CLIP Score — 0.0001, а в видео (Wan2.1-T2V) средний балл — 0.8292 против 0.8311.