🔐 Meta представила «Правило двух» для безопасности агентов ИИ
Meta предложила новый фреймворк для защиты AI-агентов от prompt-инъекций — «Правило двух».
Фреймворк ограничивает одновременное выполнение тремя условиями: обработка ненадёжных данных, доступ к приватным системам и возможность изменения состояния или внешней коммуникации. Чтобы предотвратить критические утечки, агент может удовлетворять не более чем двум из этих трёх условий в рамках одной сессии. Например, если агент читает почту (ненадёжные данные) и имеет доступ к приватным письмам, он не должен иметь права отправлять сообщения без подтверждения.
Подход вдохновлён политикой Chromium и концепцией «смертельной тройки» Саймона Уиллисона, помогая разработчикам сознательно балансировать между функциональностью и безопасностью.
#ai_security #meta_ai #prompt_injection #llm #agents #cybersecurity