AI Open Space пишет:

🔐 Meta представила «Правило двух» для безопасности агентов ИИ

Meta предложила новый фреймворк для защиты AI-агентов от prompt-инъекций — «Правило двух».

Фреймворк ограничивает одновременное выполнение тремя условиями: обработка ненадёжных данных, доступ к приватным системам и возможность изменения состояния или внешней коммуникации. Чтобы предотвратить критические утечки, агент может удовлетворять не более чем двум из этих трёх условий в рамках одной сессии. Например, если агент читает почту (ненадёжные данные) и имеет доступ к приватным письмам, он не должен иметь права отправлять сообщения без подтверждения.

Подход вдохновлён политикой Chromium и концепцией «смертельной тройки» Саймона Уиллисона, помогая разработчикам сознательно балансировать между функциональностью и безопасностью.

#ai_security #meta_ai #prompt_injection #llm #agents #cybersecurity

еще контент в этом сообществе