Data Quality | Качество данных
11.03
Основы качества данных, глава вторая.
О системах хранения данных.
Что интересного: 📎 Основные компоненты качества данных: процесс, технологии, люди
📎 Перед работой над качеством данных стоит понять, качество чего хотим улучшить - операционных или аналитических данных
📎 Аналитические данные опираются на операционные, и являются результатом преобразования
📎 Важно найти компромисс между пропускной способностью и допустимой задержкой
📎 Выбирая способ хранения, важно учитывать взаимодействие с данными - формат (структура) задаётся при записи или чтении
📎 Разделять хранилище данных и вычисления
📎 Возможность "заболачивания" озера данных - если туда сливать всё без разбора, то качество будет падать, а владельцев крайне сложно найти
📎 Чем больше шагов при обработке данных, тем больше возможностей для ошибок
📎 Основной показатель качества данных - время простоя
📎 Для поверхностной оценки данных приводится список вопросов. Поделиться?
📎 Мониторинг показателей качества данных является одной из фундаментальных задач
📎 Приведены шаги для получения показателей качества данных. Надо?
📎 Чтобы начать верить данным, они должны быть точными, чистыми, доступными
📎 Важно понимать и отслеживать состояние и использование своих данных на всех этапах их жизненного цикла.
Есть над чем подумать, в общем 😊
#dataquality #качестводанных #dqfеще контент в этом сообществе
еще контент в этом соообществе
Data Quality | Качество данных
11.03
войдите, чтобы увидеть
и подписаться на интересных профи