🚀 MXFP4 и MXFP6 для точного квантования LLM

AMD представила высокоточное квантование MXFP4 и MXFP6 для крупных языковых моделей на GPU Instinct MI355.

Форматы MXFP4 (4 бита) и MXFP6 (6 бит) сокращают

читать далее
🚀 MXFP4 и MXFP6 для точного квантования LLM
AMD представила высокоточное квантование MXFP4 и MXFP6 для крупных языковых моделей на GPU Instinct MI355 | Сетка — социальная сеть от hh.ru