Новости за последний час
ByteDance показала Seedance 2.5 — видеогенератор, который обещает ролики до 30 секунд, до 50 референсов, загрузку 3D-моделей без текстур и вывод вплоть до 4K. Для таких моделей это уже не просто «красивый демо-ролик»: здесь заметны попытки закрыть сразу и качество, и управляемость сцены, и звук с липсинком на уровне фонем.
Отдельно заявлены покадровый контроль камеры, лучшая согласованность между кадрами, меньше фликера и варпов, плюс мультикадровые нарративы — несколько связанных сцен по одному промпту без ручной склейки. Если это подтвердится в релизе в начале июля, у конкурентов будет ещё один неприятный ориентир.
А у Yandex Research и ШАД получилась куда более «инженерная» история: они ускорили графовые нейросети на GPU без изменения архитектуры. Для attention-слоёв ускорение дошло до 8,5 раза, а пиковая память упала до 76 раз. Тут ценность не в красивом бенчмарке, а в том, что узкое место нашли в памяти и неравномерной нагрузке, а не в математике модели.
Оптимизации упаковали в набор GPU-операторов для PyTorch, так что их можно подменять без перестройки модели. Для GNN это особенно полезно: такие сети часто упираются не в число операций, а в то, как именно данные гоняются по GPU.
Источники: Neurogen, anti_agi
Все новости: ai.popovs.tech
В этом посте были ссылки, но мы их удалили по правилам Сетки