Ready 2 HR Tech
03.06
Можно ли автоматизировать очистку HR-данных?
Если Вы пробовали найти что-то ценное в массиве данных о персонале, Вы понимаете, что как правило нельзя просто взять и использовать то, что у Вас есть. Дубли, ошибки, незаполненные значения, интерпретация периодов, и, конечно же, выбросы – это то, что не позволит Вам даже начать это делать. А уж если Вам нужно объединить данные из разных источников…
В общем, это именно то, с чем HR-Аналитики и Data-инженеры сталкиваются каждый день. Сегодняшняя статья как раз посвящена экспертному взгляду на подготовку HR-данных для анализа. После рассказа о проблемах в источниках данных предлагается два потенциальных решения для уменьшения искажений (и нет, это не искусственный интеллект):
1️⃣ Первое из них часто недооценивают, это управление данными. Это значит, что даются четкие определения данных, определяются согласованные способы расчета, устанавливаются границы, информация контролируется, так же, как и её сбор и хранение. Эти меры сокращают уровень нужного реформатирования и деления на группы.
2️⃣ Второе решение — инженерия данных. Любая задача, повторяемая повторно, становится кандидатом для автоматизации. Стремление проанализировать информацию иногда заставляет аналитиков искать короткие пути в очистке тех данных, которые не повторяются. Так, мы сами виноваты в необходимости чистить некоторые данные. Хорошая инженерия данных с автоматизацией потока информации призвана упрощать интеграцию данных и уменьшать количество времени на их очистку.
В статье упоминается сомнительная метрика, что 80% работы аналитика уходит на предварительную оценку данных. Вряд ли именно так, но сколько бы там ни было, это та работа, от которой нельзя отказаться, но которую хочется минимизировать. Без этого Вы просто не получите надежных выводов и не сможете проверить ни одну гипотезу.
Почитайте полный текст статьи у меня на сайте. 🔗 https://ready.2hr.tech/Nd1W9f
Георгий Полевой
· 11.06
80% на оценку - это правильная цифра. Если работа хорошо рутинирована, а у хорошего специалиста это так, то именно вводные данные требуют больше всего времени. Всегда на этот счёт у меня были споры с продактами, что нельзя оценивать объем работ на всяких спринтах, потому, что оценка объема невозможна без знаний всего процесса работ, а после того как мы его знаем, мы сделали 90% объема задачи, потому, что реализовать процесс это уже рутина, которая у хорошего специалиста занимает 10%.
ответить
еще контент в этом сообществе
еще контент в этом соообществе
Ready 2 HR Tech
03.06
войдите, чтобы увидеть
и подписаться на интересных профи