Первый ML-проект ч.2

Итак, 1 февраля 2026 года я решил побороть синдром вечного студента, задать себе установку, что моих знаний на текущий момент достаточно для реализации первого ML-проекта и приступить к нему. Я зашел на Kaggle и нашел датасет с размеченными логами IDS.

👨‍💻Начал я с ознакомления с датасетом: каждая запись содержала в себе IP-адрес отправителя/получателя, порты, протоколы прикладного и нижестоящих уровней, размер запроса, строку User-Agent, статус запроса, флаг вторжения и класс запроса.

🎯Далее нужно было определиться с целью проекта. У меня было 2 варианта: 1. Задача бинарной классификации: определить нормальный и вредоносный запросы. 2. Задача многоклассовой классификации: конкретизировать тип запроса, как нормальный, сканирование портов или бот-атаку. Выбор пал на второй вариант.

🛫Мотивацию поднял, датасет нашел, цель поставил, а дальше что? А дальше я начал смотреть основные этапы построения ML-моделей. Для своего проекта я выделил следующие этапы: - Разведочный анализ данных (EDA) - Очистка данных при необходимости - Выбор ML-алгоритма - Создание и преобразование признаков (Feature engineering) - Обучение модели - Оценка качества модели

⏳Определившись со всем этим, я дал себе ровно месяц на реализацию. Каждый день после работы я приходил и 2 часа тратил на проект. О каждом этапе и о том, что он мне дал я расскажу далее.

Первый ML-проект ч.2 | Сетка — социальная сеть от hh.ru Первый ML-проект ч.2 | Сетка — социальная сеть от hh.ru