Как решить проблему конфиденциальности данных при работе с внешними ИИ? Проблема защиты чувствительных данных при работе с ChatGPT, Claude, Qwen, DeepSeek и прочими публичными сетями, в том числе и ро...

Как решить проблему конфиденциальности данных при работе с внешними ИИ? Проблема защиты чувствительных данных при работе с ChatGPT, Claude, Qwen, DeepSeek и прочими публичными сетями, в том числе и российскими, актуальна как никогда. Мы с клиентами уже неоднократно сталкивались с тем, что постоянно приходится заранее готовить и тщательно «очищать» информацию, которую передаём во внешние ИИ. Полноценные локализованные решения доступны только «состоятельным» компаниям, но потребность рынка в ИИ-решениях гораздо шире.

Представьте, насколько сильно упростилась бы работа юристов, бухгалтеров, финансистов, технических специалистов при взаимодействии с ноу-хау и коммерческой тайной, будь они защищены от утечки данных в ИИ.

На днях вышла статья компании Just AI на Хабре, где они описывают решение проблемы утечек чувствительных данных.

Авторы рассказывают о методе динамической анонимизации данных с помощью промежуточного прокси-сервера. Этот сервер перехватывает запросы пользователей перед отправкой в LLM, находит в них персональные данные (имена, адреса, телефоны и т. д.) и заменяет их специальными метками. После обработки запроса моделью, прокси-сервер возвращает персональные данные на место меток в ответе.

Такой метод реализован в продукте компании под названием Jay Guard. Он использует гибридный метод поиска персональных данных: сочетание регулярных выражений, словарей и моделей машинного обучения.

Очень рекомендую статью к прочтению — она даёт хорошее представление как о самой проблеме утечки чувствительных данных в ИИ, так и о способах её решения.

Мы в своих предложениях для клиентов уже реализуем решения и рекомендации, близкие по подходу. Но, как и всегда, здесь тоже есть свои тонкости. Полностью решить проблему утечки данных только техническим решением не получится. Скорее, это комплекс: подобное Jay Guard решение, грамотно структурированная база знаний и строгие правила работы с ИИ.

Полный текст статьи я привожу по ссылке https://habr.com/ru/companies/just_ai/articles/946392/