Марина Одинова пишет:

МАСКИРОВКА ДАННЫХ. 😎

Продолжаем тему безопасности данных. Как и обещала рассказываю чем отличаются разные варианты их маскировки.

Зачастую применяется одно слово - обезличивание. Но на практике способы обработки разные. И задачи у них тоже разные.

Если говорить совсем просто, чаще всего встречаются три варианта:

1. Маскировка данных Это когда чувствительная информация скрывается или заменяется прямо в тексте, таблице или документе. Например: Иванов Иван Иванович → ФИО_1 ООО "Ромашка" → Контрагент_12 Счет № 40702... → Счет скрыт

Такой вариант подходит, когда нужно быстро убрать чувствительные данные перед отправкой файла или текста в ИИ.

2. Псевдонимизация Это уже более аккуратный способ замены, при котором реальные данные подменяются условными обозначениями, но логика связей сохраняется. Например, если в файле 25 раз встречается один и тот же контрагент, он во всех местах будет заменен на один и тот же маркер: ООО "Ромашка" → Контрагент_12

Зачем это нужно? Чтобы ИИ мог анализировать данные, не теряя смысл. Он будет видеть, что в отчете один и тот же контрагент встречается много раз, хотя настоящее название скрыто.

Для финансовых задач это более применимо. Иначе можно "спрятать" данные так, что анализ уже ничего полезного не покажет.

3. Обезличивание Это более широкий подход. Смысл в том, чтобы удалить или изменить данные так, чтобы нельзя было определить конкретного человека, компанию или объект без дополнительной информации.

То есть обезличивание может включать в себя и маскирование, и псевдонимизацию, и другие способы обработки.

Если совсем коротко:

маскирование - скрыли или заменили данные псевдонимизация - заменили так, чтобы сохранить логику и связи обезличивание - сделали данные безопаснее для использования, снизив риск идентификации

Так что вопрос не в том, можно или нельзя использовать ИИ (если только это прямо не запрещено в компании). Вопрос в том, как подготовить данные для работы с ним.

Тема безопасной подготовки данных находится на первом месте среди вопросов, которые я получаю, выступая на конференциях, проводя вебинары и даже созвоны с подписчиками.

Если коротко: Все что находится или планируется к размещению в открытых источниках - передавать можно. Все что относится к конфиденциальным, персональным данным или является коммерческой тайной - подлежит предварительной обработке либо загрузке в нейросеть, развернутую локально.

#ИИ_безопасность

В этом посте были ссылки, но мы их удалили по правилам Сетки