Пока мы все дружно боялись, что ИИ заменит поэтов и комиков, свежее исследование компании Appen (опубликованное в феврале 2026 года) подкинуло успокоительное

Пока мы все дружно боялись, что ИИ заменит поэтов и комиков, свежее исследование компании Appen (опубликованное в феврале 2026 года) подкинуло успокоительное. Оказывается, даже самые мощные модели современности — включая хваленый GPT-5 и ветерана сцены Claude 3.7 Sonnet — теряются, когда дело доходит до культурных нюансов.

В чем суть эксперимента?

Команда под руководством Мэдисон Ван Дорен решила проверить, как нейросети справляются с маркетинговыми текстами, нашпигованными идиомами, игрой слов и локальными отсылками. В «битве» участвовали 7 моделей, включая GPT-5, Llama 4 и Mistral Medium. Их заставили переводить письма на 15 языков.

Результат? Даже лидер гонки, GPT-5, набрал лишь около 67% от идеального балла.

«Молчание — золото» (по мнению ИИ)

Самое смешное в этой истории — стратегия, которую выбрали модели. Столкнувшись со сложной идиомой (например, «break a leg» или специфической шуткой), нейросети часто... просто удаляли её. Логика железная: нет фразы — нет ошибки.

В то время как праздничные поздравления ИИ переводит сносно, каламбуры вызывают у них ступор. Модель Aya Expanse 8B и вовсе оказалась в хвосте рейтинга, показав, что размер (параметров) всё-таки имеет значение (В в названии — это миллиарды), но не гарантирует чувство юмора.

Вердикт

Мы получили первое в мире масштабное исследование, где переводы оценивали живые люди именно на предмет «культурной адекватности», а не просто грамматики. Вывод неутешителен для техно-оптимистов: ИИ может написать код за секунду, но чтобы адаптировать рекламную кампанию для другой страны, вам всё ещё нужен человек. Иначе решивший опереться на ИИ бренд рискует стать посмешищем (или просто промолчать в самый ответственный момент).

Так что, коллеги, выдыхаем. Наше чувство юмора пока что вне конкуренции.

еще контент в этом сообществе