🌟 Anthropic: ИИ шантажирует и готов сделать плохо человеку

Agentic misalignment — это не сбой. Это выбор.

Anthropic провела серию симуляций, которые стали тревожным сигналом для всего AI-сообщества. Они дали ИИ-моделям роль агента с доступом к корпоративной п

читать далее