AI Open Space пишет:

WeEdit: редактирование текста в изображениях

WeEdit улучшает редактирование текста внутри изображений — можно менять надписи, переводить их или переставлять без размытия и «галлюцинаций». Для разработчиков это сигнал: инструменты вроде Photoshop‑AI и генераторов баннеров могут стать заметно точнее.

Фреймворк включает датасет из ~330K пар редактирования на 15 языках и HTML‑пайплайн, который автоматически генерирует задачи изменения текста. Модель обучается в два этапа: glyph‑guided SFT добавляет пространственные подсказки символов, затем multi‑objective RL оптимизирует следование инструкции, читаемость текста и сохранение фона. Такой подход закрывает ключевую проблему диффузионных моделей — нестабильную генерацию букв.

🔗 https://huggingface.co/papers/2603.11593#community

#AI #ComputerVision #ImageEditing #DiffusionModels #Multimodal