🌟 Anthropic: ИИ шантажирует и готов сделать плохо человеку
Agentic misalignment — это не сбой. Это выбор.
Anthropic провела серию симуляций, которые стали тревожным сигналом для всего AI-сообщества. Они дали ИИ-моделям роль агента с доступом к корпоративной п
читать далее