🎮 AMD показала генерацию игрового видео из картинки
Команда ROCm продемонстрировала работу Hunyuan-GameCraft — ИИ для создания игрового видео по одной картинке и действиям игрока.
Система использует модель HunyuanVideo (MM-DiT) и обучаются на более чем 1 млн 6-секундных клипов из AAA-игр. Добавлен общий вектор камеры, энкодер действий и гибридное расширение видео в латентном пространстве — это обеспечивает плавность и согласованность кадров. Ввод включает WASD-движения и повороты мышью с регулируемой скоростью. Генерация происходит не в реальном времени — на один клип уходит до 75 минут на 4× MI300X.
На практике модель стабильно движется вперёд, но при сложных сценариях ошибается: вместо шагов вбок может повернуть камеру. Точность падает при увеличении скорости действий.
#ai_video #hunyuangamecraft #amd_mi300x #rocm #genai #gaming_ai