Основы качества данных, глава вторая.

О системах хранения данных.

Что интересного: 📎 Основные компоненты качества данных: процесс, технологии, люди

📎 Перед работой над качеством данных стоит понять, качество чего хотим улучшить - операционных или аналитических данных

📎 Аналитические данные опираются на операционные, и являются результатом преобразования

📎 Важно найти компромисс между пропускной способностью и допустимой задержкой

📎 Выбирая способ хранения, важно учитывать взаимодействие с данными - формат (структура) задаётся при записи или чтении

📎 Разделять хранилище данных и вычисления

📎 Возможность "заболачивания" озера данных - если туда сливать всё без разбора, то качество будет падать, а владельцев крайне сложно найти

📎 Чем больше шагов при обработке данных, тем больше возможностей для ошибок

📎 Основной показатель качества данных - время простоя

📎 Для поверхностной оценки данных приводится список вопросов. Поделиться?

📎 Мониторинг показателей качества данных является одной из фундаментальных задач

📎 Приведены шаги для получения показателей качества данных. Надо?

📎 Чтобы начать верить данным, они должны быть точными, чистыми, доступными

📎 Важно понимать и отслеживать состояние и использование своих данных на всех этапах их жизненного цикла.

Есть над чем подумать, в общем 😊

#dataquality #качестводанных #dqf
repost

196

input message

напишите коммент

еще контент в этом сообществе

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь