В мире больших данных
15.01
Системный аналитик DWH — кто ты?
Интернет заполнен рекламой курсов по дата инженерии и мы уже более-менее разобрались кто эти ребята и чем занимаются. С дата аналитикой, кажется, тоже плюс минус всё понятно. Но кто такие системные аналитики DWH (SA DWH), зачем они нужны и можно ли обойтись без них?
Очень давно я уже писала пост о SA DWH, где сравнивала эту роль с волшебником, который превращает хаос данных в упорядоченную структуру. Сегодня хочется рассказать более предметно о том, что же это за зверь и за что получает свою зряплату.
В России исторически закрепилась вертикальная структура компаний, где каждый отдел имеет «ответственное лицо» за свою область. Так у хранилищ данных и появились «системные аналитики DWH», которые: 🔵 согласовывают требования с бизнесом 🔵 расписывают модели данных 🔵 передают задачи дата-инженерам.
По сути, системный аналитик — входная точка в хранилище данных. Да, во многих зарубежных компаниях выделенных SA DWH нет: эти обязанности совмещают Data Warehouse Architect, Data Solutions Analyst, Technical Data Analyst, Analytics Engineer (поговаривают, что эта роль потихоньку уходит в прошлое, но это не точно), ETL или Data Engineer. Однако в российских реалиях системные аналитики DWH — это связующее звено между бизнесом и техническим миром. Правда, иногда их тоже называют дата-инжеренами, выделяя в отдельное направление (как, например, в одном жёлтом банке).
Чем же занимается SA DWH?
Все мы понимаем, что всё меняется от компании к компании, но примерно так: 🔵 общается с бизнесом и командами разработки, собирает требования к данным (то есть координирует взаимодействие и выступает «переводчиком» между бизнесом, DevOps, ETL, BI и другими участниками дата-процессов). 🔵 проектирует схему хранилища: создает и документирует структуру таблиц, представлений, витрин (включая CDC, STG, ODS, EMART и другие «слои» DWH). 🔵 разрабатывает концепцию обработки данных: какие пайплайны нужны, как реализовать CDC и репликацию, и т.д. 🔵 ведёт анализ данных (и копается в куче legacy 🥲) 🔵 продумывает качество данных (иногда в составе отдельного подразделения по качеству, если позволяет масштаб компании)🔵 создает стратегии по работе с историческими данными (сколько хранить, как обновлять, как архивировать) 🔵 планирует развитие DWH: какие таблицы добавить, какие поля стоит убрать, как обогатить данные, ... 🔵 проектирует витрины и описывает требования к ETL-процессам, чтобы дата-инженеры могли чётко реализовывать логику загрузки 🔵 разбирается с интеграцией легаси-систем (нередко это самый сложный блок). 🔵 ...
На самом деле список задач SA может сильно отличаться от команды к команде. Например, в идеальной ситуации есть выделенный DWH-архитектор, который строит целостную архитектуру и отвечает за масштабирование. Но если в компании такой роли нет, эти обязанности часто берёт на себя системный аналитик.
Для меня работа SA всегда где-то на грани творчества, экспертизы и здравого смысла. В этом и вся прелесть профессии.
Позже расскажу какими инструментами мы пользуемся в своей работе.
А что ближе вам — техническая внутрянка или работа с бизнес-контекстом и логикой?
#системный_анализАнна Ившина
· 26.01
Мы с сестрой все еще спорим, кто же такие – аналитики DWH 😄 Она описывает их примерно как в этом посте, но, в моем понимании, здесь про обычных системных аналитиков. А DWH связано с работой с не самыми очищенными и готовыми к использованию бизнесом данными, написанием витрин через полотна SQL-скриптов (а не загрузкой через Апи, Кафку) и тд. Chat GPT, кстати, согласен со второй точкой зрения.
ответить
Юлия Иванова
27.01
Привет 👋🏻 на самом деле всё очень меняется от компании до компании. Если говорить именно про «аналитиков DWH”, то в одной компании они могут играть роль бизнес дата аналитиков, в другой BI, в третьей сочетать роль системных и дата инженеров, а в четвертой вообще делать всё и сразу 😄 отрасль молодая и быстро меняющаяся, со стандартами сложно )
ответить
еще контент в этом сообществе
еще контент в этом соообществе
В мире больших данных
15.01
войдите, чтобы увидеть
и подписаться на интересных профи