🚀 Как ускорить обучение T2I-моделей

Hugging Face и Photoroom раскрыли ключевые методы ускорения обучения генеративных моделей.

REPA выравнивает промежуточные признаки генератора с сильным преподавателем (DINOv2/v3), ускоряя обучение и улучшая структуру изображений. Лучший прирост даёт оптимизация пространства латентных переменных — REPA-E-VAE и FLUX.2 AE улучшают обучаемость представлений. На высоких разрешениях (1024²) маршрутизация токенов (TREAD/SPRINT) резко повышает скорость и качество. Также критичны длинные описания и оптимизатор Muon.

FID улучшился с 18.2 до 12.07, а обучение 1024×1024 стало в 3 раза медленнее, а не на порядки.

#text2image #diffusion #repamethod #traininghacks

🚀 Как ускорить обучение T2I-моделей
Hugging Face и Photoroom раскрыли ключевые методы ускорения обучения генеративных моделей | Сетка — социальная сеть от hh.ru