🎮 Почему топовые ИИ проигрывают детям в Pokémon
ИИ от Google, Anthropic и OpenAI играют в Pokémon, но даже лучшие модели медленны, путаются и застревают.
Системы вроде Claude Opus 4.5 и Gemini используют специальные "оболочки" (harness), которые преобразуют экран в текст и помогают с действиями. Gemini побеждал Pokémon Blue и Crystal, но с мощной поддержкой: его ИИ "видел" игру через текстовое описание, обходя слабость в визуальном анализе. Claude, напротив, играет почти вслепую — его минимальная оболочка даёт меньше подсказок, зато честнее тестирует реальные способности модели. Даже после 500 часов игры ИИ не могут пройти игру без ошибок: они забывают контекст, не видят простых решений (например, срубить дерево) и теряются в долгосрочной стратегии.
Opus 4.5 стал лучше оставлять себе заметки, а Gemini 3 Pro прошёл Pokémon Crystal без проигрышей — признак прогресса в планировании.
#ai_agents #llm #pokemon_ai #long_term_planning #anthropic #google_ai