Как мы учили нейросеть, что крыло — это тоже рука, а персонаж не должен быть страшным
Нейросеть даёт два варианта антропоморфных птиц: либо мультяшный персонаж из дешёвого мультика, либо страшная химера. Середины практически нет.
Мы перепробовали десятки вариантов сов и жаворонков в разных инструментах. Лучший кастинг неожиданно получился в GPT Image — именно там персонажи вышли живыми и при этом симпатичными. Потом уже интегрировали их в сцены через Nano Banana. Неудачный вариант медведя на картинке слева, а справа финальный облик.
Но дальше началась настоящая боль.
По сценарию птицы взаимодействуют с предметами: нажимают кнопки, открывают двери, держат устройства. По задумке — крыльями, не руками. А нейросеть анатомию крыла с функцией руки не понимает вообще.
Решение нашлось простое, но не очевидное: визуально крыло остаётся крылом, но кончики перьев работают как пальцы. Не пытаться сделать «руку в перьях» — а просто переосмыслить, как именно крыло касается предмета.
Это и есть суть работы с нейросетями не бороться с логикой ИИ, а искать обходной путь, который выглядит естественно.
Делитесь в комментариях, как вы использовали косяки нейросетей себе во благо😎
эйай продакшн <-> Юра Покровский
В этом посте были ссылки, но мы их удалили по правилам Сетки