Data Warehouse (DWH) — это система (здесь акцент на слове "система") хранения и анализа больших данных, которая поддерживает процессы принятия решений в компании. Для поддержания её работоспособности нужны серьёзные технические и человекческие ресурсы.

Уильям Инмон объясняет, что такое DWH, на примере 4 ключевых характеристик этой системы:

— Предметно-ориентированность. DWH следуют отраслевой логике, и оперирует данными, относящимися только к темам, представляющим интерес для компании.  — Интегрированность. Хранилище содержит информацию из различных источников, поэтому необходимо позаботиться о согласованности между ними. — Привязка ко времени. DWH служит своего рода историческим архивом. Поэтому все изменения в информации, касающиеся каждого отдельного элемента, записываются, создавая новые экземпляры без перезаписи старых данных. — Неизменяемость. Доступ к хранимой информации осуществляется "только для чтения".

Стоит отметить, что не всё из описанного выше является универсальным решением для любого DWH. В противовес Биллу Инмону ставится подход Ральфа Кимбалла. Подробнее о каждом из них буду рассказывать далее.

repost

72

input message

напишите коммент

Работаю с DWH как пользователь, пока в моем опыте это лучшее решение для аналитика. В следствии интегрированности, если данные в источнике были изменены (например, открыт период в 1С и внесены правки), данные в DWH перезаписываются при обновлении, изменяются. Для бизнеса это необходимое свойство, так как решения принимаются на основе данных ) Спасибо, что открыли такую тему, интересно будет узнать больше )

ответить

еще контент в этом сообществе

еще контент в этом соообществе

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь