Data Governance для чайников
13.10 · ред.
Моделирование данных в хранилище ☝️ Была мысль написать сразу про моделирование хранилищ данных - есть запрос на минимальное описание подхода Data Vault.
Но если подумать, нельзя начать с Vault, и при этом не вспомнить про схемы Star (Звезду) или Snowflake (Снежинку). Основоположниками вообще всей истории с хранилищами и тем как правильно раскладывать в них данные считают двух мужей: Билл Инмон (Bill Inmon) и Ральф Кимбалл (Ralph Kimball)
И только потом появился Линстед (Daniel Linstedt) со своим Data Vault.
Произведения, по которым учатся до сих пор, поищите в интернете, если интересно: Inmon, William H., Building the Data Warehouse, 1992 Kimball, Ralph, The Data Warehouse Toolkit, 1996
Ну так вот, есть мысль рассказать про моделирование в хранилищах. Но тут возникла маАаленька проблемка: как только мы начинаем разговор о хранилищах и базах данных, то сразу сталкиваемся с такими понятиями как нормализация, реляционность, измерения, факты.
Ну и, конечно, OLTP и OLAP - разницу между этими двумя подходами/системами обработки данных тоже надо понимать.
Когда спрашиваешь своих коллег - глубоко погруженных в проектирование баз данных и построение хранилищ - что это такое, для чего это и в чём смысл? То, конечно, все с удовольствием объясняют, но понятнее не становится. Можно изучать самостоятельно по ссылкам в вики, читать тематические статьи и книги. Лично мне не сильно помогло в моё "зелёное время", так как "опыт - сын ошибок трудных" - это наше всё.
Но я попробую рассказать Вам об этом всём как можно проще. Начну давать определения и понемножку объяснять все эти дикие понятия по-простецки, так, чтобы стало понятно даже тем, кто далёк от ИТ-сферы.
Для особенно торопящихся ниже даны ссылки на вики - там на буржуйском языке можно почитать обо всём, что упоминалось выше, уже сейчас.
Подход звезда: https://en.wikipedia.org/wiki/Starschema Подход снежинка: https://en.wikipedia.org/wiki/Snowflakeschema Нормализация: https://en.wikipedia.org/wiki/Databasenormalization Измерения: https://en.wikipedia.org/wiki/Dimension(data_warehouse) Факты: https://en.wikipedia.org/wiki/Facttable _Реляционная база данных: https://en.wikipedia.org/wiki/Relationaldatabase
P.S.: Ой, ой, наверное, тяжелятина в канале начнётся - не разбегайтесь, крепитесь! 🥰
еще контент в этом сообществе
еще контент в этом соообществе
Data Governance для чайников
13.10 · ред.
войдите, чтобы увидеть
и подписаться на интересных профи