Как генерировать одного человека, а не похожих людей
Фотосессия с бабушкой и дедушкой на 9 мая, которую я выкладывал на прошлой неделе, целиком собрана в GPT, и для меня это до сих пор немного странно, потому что до недавнего времени работать с ней в этом направлении было почти невозможно. На каждого из героев я собрал отдельную карточку персонажа — на бабушку, на дедушку, на себя, — и когда они оказывались в одном кадре, GPT держала все три лица.
Звучит обыкновенно, но это первый раз, когда у меня вообще получилось добиться нужных лиц, а не их приблизительных копий. До этого ни GPT, ни Banana меня не видели: я загружал референсы, прикладывал свои фотки, прописывал черты, тыкал в одну и ту же кнопку по тысяче раз, и каждый раз получался кто-то другой. Похожий парень. Но не я. С дедушкой была ровно та же история, и я уже было решил, что у меня просто такое лицо, которое нейронкам не даётся.
После недавних обновлений GPT начала держать черты аккуратно, и работа поменялась целиком. Если у кого-то раньше не получалось, имеет смысл попробовать ещё раз.
Карточка собирается так. В новом чате загружаешь пять-семь фотографий человека под разными углами — анфас, оба профиля, три четверти, при желании со спины, — снятых при ровном дневном свете, без фильтров. Дальше отправляешь один промпт.
Промпт смотрите в комментариях.
GPT собирает по снимкам описание: пропорции лица, форму подбородка, мимику, цвет глаз, текстуру кожи. Этот текст и есть карточка — двадцать-тридцать минут на одного человека, и дальше она живёт в чате, к ней нейронка возвращается при каждой следующей генерации. Если героев несколько, процесс повторяется отдельно для каждого, и все карточки сосуществуют в одном диалоге.
Карточка не запирается внутри GPT: те же Seedance-2 и Grok принимают её без потерь.
Два момента, на которые я наступил.
Карточка иногда вываливается из памяти после длинного диалога, и персонаж снова начинает гулять, как будто нейронка забыла, кого рисовала десять сообщений назад. Лечится дублированием карточки тем же сообщением, и преемственность возвращается.
Когда долго правишь черты, GPT начинает сглаживать кожу, и вместо живого человека получается пластиковая кукла. Тогда загружаешь референс с кожей заново и просишь прогнать карточку через него, с порами и неоднородностью тона.
Если зайдёт — расскажу дальше, как переодевать персонажа, собирать подборки одежды через GPT и встраивать его в сцену так, чтобы не выглядел вырезанным.