Data Profiling — процесс изучения данных, доступных из существующего источника информации, и сбора статистических данных или информативных сводок об этих данных.

☝️ Другими словами, процесс профилирования состоит как бы из двух шагов:

✔️ первый - это этап изучения данных, понимания их структуры, взаимосвязей, бизнес-контекста и возможного применения в дальнейшем анализе. Также этап может включать процесс извлечения метаданных: информации о технических именах данных, формат, размер, время создания и т.п.;

✔️ второй - этап сбора статистических характеристик, таких как характер распределения величин, наличие выбросов, параметры выборки. Этот этап также может включать процедуры по предварительной оценке качества данных: поиск пропущенных значений, нарушения целостности и бизнес-логики связей между значениями полей и т.п.

👉Толковый словарь Data Governance

repost

377

input message

напишите коммент

еще контент в этом сообществе

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь