06.12
Data Warehouse (DWH) — это система (здесь акцент на слове "система") хранения и анализа больших данных, которая поддерживает процессы принятия решений в компании. Для поддержания её работоспособности нужны серьёзные технические и человекческие ресурсы.
Уильям Инмон объясняет, что такое DWH, на примере 4 ключевых характеристик этой системы:
— Предметно-ориентированность. DWH следуют отраслевой логике, и оперирует данными, относящимися только к темам, представляющим интерес для компании. — Интегрированность. Хранилище содержит информацию из различных источников, поэтому необходимо позаботиться о согласованности между ними. — Привязка ко времени. DWH служит своего рода историческим архивом. Поэтому все изменения в информации, касающиеся каждого отдельного элемента, записываются, создавая новые экземпляры без перезаписи старых данных. — Неизменяемость. Доступ к хранимой информации осуществляется "только для чтения".
Стоит отметить, что не всё из описанного выше является универсальным решением для любого DWH. В противовес Биллу Инмону ставится подход Ральфа Кимбалла. Подробнее о каждом из них буду рассказывать далее.
· 07.12
Работаю с DWH как пользователь, пока в моем опыте это лучшее решение для аналитика. В следствии интегрированности, если данные в источнике были изменены (например, открыт период в 1С и внесены правки), данные в DWH перезаписываются при обновлении, изменяются. Для бизнеса это необходимое свойство, так как решения принимаются на основе данных ) Спасибо, что открыли такую тему, интересно будет узнать больше )
ответить
еще контент в этом сообществе
еще контент в этом соообществе
06.12
войдите, чтобы увидеть
и подписаться на интересных профи