Пока мы все дружно боялись, что ИИ заменит поэтов и комиков, свежее исследование компании Appen (опубликованное в феврале 2026 года) подкинуло успокоительное. Оказывается, даже самые мощные модели современности — включая хваленый GPT-5 и ветерана сцены Claude 3.7 Sonnet — теряются, когда дело доходит до культурных нюансов.
В чем суть эксперимента?
Команда под руководством Мэдисон Ван Дорен решила проверить, как нейросети справляются с маркетинговыми текстами, нашпигованными идиомами, игрой слов и локальными отсылками. В «битве» участвовали 7 моделей, включая GPT-5, Llama 4 и Mistral Medium. Их заставили переводить письма на 15 языков.
Результат? Даже лидер гонки, GPT-5, набрал лишь около 67% от идеального балла.
«Молчание — золото» (по мнению ИИ)
Самое смешное в этой истории — стратегия, которую выбрали модели. Столкнувшись со сложной идиомой (например, «break a leg» или специфической шуткой), нейросети часто... просто удаляли её. Логика железная: нет фразы — нет ошибки.
В то время как праздничные поздравления ИИ переводит сносно, каламбуры вызывают у них ступор. Модель Aya Expanse 8B и вовсе оказалась в хвосте рейтинга, показав, что размер (параметров) всё-таки имеет значение (В в названии — это миллиарды), но не гарантирует чувство юмора.
Вердикт
Мы получили первое в мире масштабное исследование, где переводы оценивали живые люди именно на предмет «культурной адекватности», а не просто грамматики. Вывод неутешителен для техно-оптимистов: ИИ может написать код за секунду, но чтобы адаптировать рекламную кампанию для другой страны, вам всё ещё нужен человек. Иначе решивший опереться на ИИ бренд рискует стать посмешищем (или просто промолчать в самый ответственный момент).
Так что, коллеги, выдыхаем. Наше чувство юмора пока что вне конкуренции.
· 01.03
Культурный и исторический контекст не распознается чужаками в недосказанном, в то время как свои, вопринимают фразы в контексте общих событий. И в этом огромная трагедия разговоров про ИИ.
ответить
коммент удалён