Пишу небольшой пост для начинающих аналитиков данных (джуниоров).

Когда появляется новая задача в первую очередь стоят 2 фундаментальных этапа для её решения: - Разобраться в предметной области. - Выбрать и правильно использовать методы решения задачи.

Для первого этапа в первую очередь нужно пообщаться с заказчиком/ владельцем продукта. Далее я читаю новости в этой области и изучаю кейсы других компаний. Какие метрики они использовали, какие данные собирали, какие тесты проводили.

Для второго этапа я использую поисковик + чат джипити + сайты с научными статьями и книгами. Но я поняла, что у каждого источника есть минусы такие как недостаточность информации, искажение информации или она совсем не правильная. При этом на поиск информации уходит куча времени. И хочу поделиться еще двумя источниками информации это гитхаб или кагл. Я часто слышала о них как о крутых сайтах, но не понимала как именно их использовать, поэтому даже не пыталась. Оказывается нужно искать конкретный кейс/ инструмент, например: "Сегментация в ритейле", "Прогнозирование дэфолта в банковской сфере", "Логистическая регрессия", "Cat boost".

Как вывод можно сказать, что существует множество качественных инструментов для поиска информации, но мы часто ими не пользуемся. При этом для каждой задачи будет эффективнее использовать те или иные способы.

Спасибо за внимание, пишите методы поиска информации, про которые я не упомянула и какие вы считаете наилучшими.

repost

192

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь