Безопасные ИИ-агенты: один из вариантов реализации

Фёдор Колесов

Application Security engineer в Okko

· 17.03 · ред.

Безопасные ИИ-агенты: один из вариантов реализации

Сейчас ИИ-агенты и LLM-инструменты для многих выглядят как “новый must have”: удобно, быстро, автоматизирует рутину, помогает писать код, анализировать данные, ускорять процессы.

Но вместе с пользой у компаний и у обычных пользователей появляется довольно неприятная проблема: ➥ в ИИ очень легко явно и неосознанно слить конфиденциальную информацию.

━━━━━━━━━━ Где существует риск? ━━━━━━━━━━

Когда сотрудник, разработчик или просто пользователь отправляет в внешний AI-сервис ◦ внутренний код ◦ конфиги ◦ токены ◦ куски переписки ◦ данные клиентов ◦ внутреннюю документацию ◦результаты аудитов и расследований

он часто думает, что “просто попросил модель помочь”.

Но с точки зрения безопасности это уже вопрос: ➥ куда ушли данные, где они обрабатываются, кто имеет к ним доступ и можно ли вообще это контролировать?

И именно поэтому тема безопасной реализации ИИ-агентов сейчас важна не только для enterprise, но и для обычных специалистов, которые работают с чувствительным контекстом.

━━━━━━━━━━ Что я решил реализовать ━━━━━━━━━━

Я собрал простой open-source проект Offline AI Chat, где идея максимально практичная: ➥ модель работает локально, в изолированном Docker runtime, без сетевого доступа во время выполнения.

То есть это не “ещё один удобный чат к внешнему API”, а формат реализации позволяющий сократить риски утечки данных за счёт локального изолированного исполнения. ⇨ https://github.com/eZer-Net/Offline-AI-Chat/

━━━━━━━━━━ Функционал проекта ━━━━━━━━━━

Проект реализует два базовых сценария.

1. Offline AI Chat Пользователь выбирает GGUF-модель из локального каталога, после чего проект проверяет наличие файлов, валидирует их по SHA256, подготавливает Docker build context, собирает image с выбранной моделью и запускает локальный CLI-чат. После старта контейнера llama.cpp поднимается внутри изолированного окружения, а общение с моделью идёт через консоль.

2. System Analyzer Отдельный сценарий оценивает ресурсы Linux-хоста и предлагает значения для .env, чтобы гибко подстроить запуск агента под железо. В проекте для этого используются параметры вроде CTX_SIZE, MEM_LIMIT, CPU_LIMIT и PIDS_LIMIT, которые затем применяются как runtime-лимиты контейнера.

━━━━━━━━━━ Как реализована изоляция и безопасность ━━━━━━━━━━

Подход не делает ИИ “магически безопасным”, я сделал реализацию на основе всем известных политик в Docker.

В проекте модель сначала проверяется по SHA256, а затем запекается в Docker image вместе с llama.cpp. Это позволяет заранее контролировать состав артефактов и уменьшает хаос с внешними runtime-подключениями.

Дальше контейнер запускается с набором изоляционных флагов: • –network none — полностью отключает сеть • –read-only — делает корневую ФС контейнера только для чтения • –tmpfs /tmp:rw,noexec,nosuid,nodev,size=2g — оставляет только контролируемую временную область записи • –cap-drop ALL — убирает все дополнительные Linux capabilities • –security-opt no-new-privileges:true — запрещает эскалацию привилегий • –user : — запускает процесс не от root • –pids-limit, --memory, --cpus — ограничивают потребление ресурсов.

Связь с моделью идёт локально через Unix socket, без публикации TCP-портов наружу. То есть идея проекта сократить поверхность атаки и сделать среду исполнения более предсказуемой и “прозрачной”.

#AI #LLM #CyberSecurity #AppSec #DevSecOps #Docker #OpenSource