Недавно довела до конца свой проект EEG Cognitive Load Detection 🧠 - кейс на стыке нейротехнологий, анализа сигналов и машинного обучения.

Задача проекта: классифицировать окна EEG-сигнала (записи электрической активности мозга) на два состояния - низкая и высокая когнитивная нагрузка. Но главный фокус был не в том, чтобы просто обучить модель и показать высокий accuracy. В EEG-задачах это может быть обманчиво: если окна одного и того же человека попадают и в train, и в test, модель может частично “запоминать” индивидуальные особенности сигнала, а не реально обобщать паттерны когнитивной нагрузки. У каждого человека сигнал немного индивидуален: отличается базовая активность, уровень шума, особенности записи, реакция на задачу, контакт электродов, амплитуды по каналам. Если модель уже видела часть EEG-окон конкретного испытуемого, она может потом хорошо предсказывать другие окна этого же испытуемого, но это не значит, что она так же хорошо сработает на новом человеке.

🧩 Поэтому в проекте я сравнила два подхода к валидации: — window-level validation, где окна EEG случайно делятся на train/test; — subject-independent validation, где тестовые испытуемые полностью не встречаются при обучении. Результат получился показательный: при window-level validation метрики выглядят намного лучше, особенно у Random Forest, но subject-independent validation даёт более честную оценку качества на новых пользователях.

📊 Что сделано в проекте: — обработка EEG-окон; — извлечение bandpower-признаков по theta / alpha / beta / gamma диапазонам; — ML-baselines: Logistic Regression и Random Forest; — CNN baseline на raw EEG windows; — сравнение стратегий валидации; — анализ feature importance; — Streamlit demo для интерактивного просмотра предсказаний модели. Для меня этот проект важен тем, что он показывает не только умение обучать модели, но и исследовательский подход: проверять leakage, выбирать корректную схему валидации, честно описывать ограничения и не делать завышенных выводов там, где данные этого не позволяют.

🔬 Дальше хочу развить проект в сторону более честного и воспроизводимого EEG/ML-пайплайна: обучить CNN с subject-independent validation, добавить EEGNet-style архитектуру, улучшить preprocessing, калибровать вероятности модели и доработать Streamlit demo так, чтобы оно показывало не только предсказание, но и уровень уверенности. Главная цель следующего этапа для меня - не просто повысить метрики, а сделать оценку модели более надёжной для сценария, где она работает с новыми испытуемыми.

🤖 Ссылка на проект: https://github.com/kva99kva-eng/eeg-cognitive-load-detection

#EEG #MachineLearning #DataScience #NeuroTech #Neurotechnology #ML #AI #CognitiveLoad #ResearchAnalytics #PortfolioProject

Сетка — социальная сеть от hh.ru