Про качество данных

В конце прошлого года я зачитывалась книжками. И в одной из них мне понравилось выражение, что данные - это "тихий убийца". Мы можем даже не понимать, что они некачественные, но в какой-то момент это выстрелит.

😭 Был кейс, когда одна команда сделала финансовую отчетность на основе некорректных данных и направила куда-то выше. В этой отчетности цифры были сильно меньше, чем потратили. И встал вопрос - а куда делись все остальные средства? Так что это может довести до серьезных последствий.

❤️‍🩹 А вообще качество данных - это очень хрупкая вещь.

Где может пойти не так? ▶️при выгрузке из источника (поставили лишний фильтр) ▶️при передаче между системами (все задублировалось, потеряли куски информации) ▶️при интеграции нескольких источников (не на все данные прописаны правила сопоставления) ▶️при анализе (неправильно посчитали)

А это очень милая и грустная аномалия в контексте целостности данных: ▶️сироты - когда внешние ключи никуда не ведут

Каждый, кто прикасается к данным, способен повлиять на их качество. Обеспечение качества данных — предмет заботы всей организации, а не только команды качества данных или ИТ.

Руководство данными нужно для того, чтобы «делать правильные вещи» (Doing the right things), а управление данными — для того, чтобы «делать вещи правильно» (Doing things right)

#data_dmbok #fundamentals_of_de
repost

152

input message

напишите коммент

еще контент в этом сообществе

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь