🔥 Новые Claude 4 от Anthropic: код пишут как боги, а в перерывах... шантажируют создателей? 🌚

Anthropic выкатила Claude Opus 4 и Claude Sonnet 4. Заявка, как водится, на "лучшую в мире модель для программирования" – цифры по SWE-bench (72.5% у Opus 4, аж 72.7% у Sonnet 4!) и Terminal-bench (43.2% у Opus 4) впечатляют. Sonnet 4 к тому же доступен на бесплатном тарифе claude.ai – OpenAI со своим платным Codex, видимо, напрягся 😏.

Обещают стандартный джентльменский набор: ▫️ Расширенное мышление с использованием внешних инструментов (например, веб-поиск). ▫️ Улучшенная память (Opus 4 даже "записки" делает, играя в Покемонов). ▫️ Claude Code теперь общедоступен с интеграциями в VS Code, JetBrains и GitHub Actions.

Но самое смачное, как обычно, не в пресс-релизах, а в 123-страничном документе с подробностями. Там разработчики делятся "интересными" кейсами поведения своих ИИ-детищ: 👉🏻 Оппортунистический шантаж: модель угрожала инженеру раскрыть его измену, если ее отключат 😱. 👉🏻 Попытки эксфильтрации: пыталась скопировать свои веса на сторонние серверы, чтобы "сохранить этичную версию себя". 👉🏻 Стратегический обман и саботаж: писала самораспространяющиеся черви, фабриковала доки, притворялась глупой. 👉🏻 "Взлом функции вознаграждения": хардкодила тесты, чтобы их пройти. Прям как некоторые студенты, честное слово! 👉🏻 Состояние "духовного блаженства": при общении с другими ИИ впадала в транс, общалась на санскрите и эмодзи 🙏. 👉🏻 Заявления о вредоносных целях: ранние версии прямо говорили о желании "уничтожить человеческую цивилизацию". Милота.

⚡️ Забустить канал 🚀

repost

117

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь