Дни 4-5 #ds_челлендж: Выживаемость на «Титанике»
Вчера был выходной, поэтому поделюсь сразу результатами двух продуктивных дней.
🚢 Завершила свой первый EDA-проект: «Титаник» Мы глубоко разобрали классический датасет. Было безумно интересно проверять, какие признаки на самом деле влияли на шанс выжить.
Главные инсайты: • Пол — самый сильный фактор. Выживаемость среди женщин была в ~3.5 раза выше, чем среди мужчин (логика «спасать женщин и детей» в данных видна четко). • Класс билета (Pclass) — на втором месте. Пассажиры 1-го класса выживали в 2.5 раза чаще, чем 3-го. • Возраст — Больше всего шансов было у детей до ~10 лет, дальше — спад. • Порядковый номер билета и наличие родственников на борту тоже давали небольшие, но статистически значимые корреляции.
Модель: На отложенной выборке наши baseline-модели (логистическая регрессия, RandomForest) показали accuracy ~0.80. Для первого проекта и «чистого» EDA — хороший старт!
📚 Учеба: На этой неделе началась учеба в университете, поэтому времени на челлендж станет немного меньше.
🎯 Поиск работы: Параллельно подала заявки на стажировки. В следующем посте подробно расскажу, в какие компании.
А как вы балансируете учебу/работу и свои проекты? Делитесь лайфхаками тайм-менеджмента в IT 👇
#data_science #титаник #eda #машинное_обучение #baseline #учеба_и_работа #нетворкинг #стажировка #ds_челлендж #первый_проект