Байки из склепа про смену специальности внутри IT. Часть 2

Продолжение истории. Что может сделать ML-неофит с пачкой текстов? В далеком 2014 мне не пришло ничего лучшего, чем посчитать частотность разных частей речи и построить на этом что-то. Звучит скучновато, согласна, но тут есть предыстория.

В те незапамятные я училась в школе соционики. Идея про взять и кластеризовать всех людей, чтобы лучше понимать их потенциал, тогда сильно меня воодушевляла. Сейчас тоже воодушевляет, но с тех пор я узнала, что люди несколько сложнее и одного деления на самые правильные типы недостаточно.

Кроме соционики мы изучали признаки Рейнина. Это такая ортогональная к соционике теория, в которой тоже есть пары признаков, в числе которых есть Статика и Динамика. В теории статики мыслят состояниями, а динамики процессами. Также в нашей школе предполагалось, что динамики чаще употребляют глаголы, а статики существительные. Еще там была идея, что типы все-таки выделяются, а не лежат плашмя на какой-то непрерывной оси.

Если бы это все было правдой, то попытка разделить тексты с помощью частоты употребления частей речи дала бы несколько кластеров, но такого факта мне зафиксировать не удалось. Частоты давали по одной единственной Гауссиане. С одной стороны это было разочарование, так как прорыва не случилось, с другой это был первый опыт приложения теории к практики. А к разочарованиям пора было привыкать…

Следующей точкой приложения стал hh.ru. Не помню, что я точно с ним делала, но кажется у меня получились смешные кружочки технологий и я узнала, что ML это не только про модельки, но иногда про самостоятельный сбор данных.

А потом мой амбициозный сожитель принес откуда-то настоящий пет-проект, который заключался в том, чтобы кластеризовать текстовые описания товаров. И вот тут я познала бездну правды про то, что чистых данных в природе не существует и в реальном кейсе нужен был какой-никакой etl-процесс.

А потом случился Крым, доллар по 55 и мои накопления как-то резко потускнели, поэтому научные интересы уступили вполне прагматичному вопросу: «Где взять работу по новой специальности, да еще и в кризис?»

Единственной компанией, которая в короткие сроки впечатлилась моими рассказами про частоту глаголов и парсинг hh, стала международная AdTech-компания российского происхождения. Впрочем больше их интересовал диплом мехмата, так как им нужен был сотрудник в отдел R&D, а без математики там сложно. В этот раз я меньше смотрела на зарплату и больше смотрела на начальника (помня прошлый опыт). Начальник показался мне идеальным, да и выбора особо не было, так что я сказала компании да.

Конечно, у меня внутри скрипело, что работа связана с рекламой, а реклама это манипуляции и вот это все, а я же изучала ML, чтобы делать что-то полезное и т.п. и т.д. Но это было еще одной правдой про ML и исследования в далеком 2014. Чтобы позволить себе целый штат R&D нужны деньги, обычно большие. А большие деньги не всегда водятся там, где есть прямая польза для людей, зато их много там, где есть польза для другого бизнеса.

Какие выводы я сделала?

Когда меняешь специальность, то перед собесом стоит покрутить что-нибудь реальное. Тогда получится говорить уже а процессе, а не цитировать вылизанные кейсы с учебы.

Когда новая специальность еще не мейнстрим и по ней нет кучи курсов, то единственным капиталом становится твой собственный интерес и желание развития, а также прошлый бэкграунд.

Пока ты в чем-то новичок и у тебя нет много денег за душой, то надо приготовиться набирать опыт в самых неожиданных для себя местах.