🚀 Как ускорить обучение T2I-моделей
Hugging Face и Photoroom раскрыли ключевые методы ускорения обучения генеративных моделей.
REPA выравнивает промежуточные признаки генератора с сильным преподавателем (DINOv2/v3), ускоряя обучение и улучшая структуру изображений. Лучший прирост даёт оптимизация пространства латентных переменных — REPA-E-VAE и FLUX.2 AE улучшают обучаемость представлений. На высоких разрешениях (1024²) маршрутизация токенов (TREAD/SPRINT) резко повышает скорость и качество. Также критичны длинные описания и оптимизатор Muon.
FID улучшился с 18.2 до 12.07, а обучение 1024×1024 стало в 3 раза медленнее, а не на порядки.