250 000 SKU и “детка великих озёр”
Где-то в начале 2014 года я впервые серьёзно вышел на hh.
Уже не как человек, который делает свои проекты, ковыряет серверы, изучает SEO, парсинг и соцсети по вечерам. А как человек, который решил попробовать попасть в нормальный официальный digital.
Я создал резюме, начал откликаться на вакансии и в какой-то момент меня взяли в интернет-магазин авиационных деталей.
Звучит солидно.
Авиация, интернет-магазин, каталог, детали, сайт на Bitrix. На первый взгляд всё должно было выглядеть как нормальный сложный e-commerce проект. Но внутри всё оказалось намного интереснее.
Сайт был сделан примерно так: кто-то взял американский каталог авиационных товаров, спарсил его, залил в Bitrix около 250 000 SKU, потом всё это перевели автоматическим переводчиком и решили, что проект готов к жизни.
Только после обновления страницы стало понятно, что что-то пошло не так. Один из самых запоминающихся примеров — “детка великих озёр”.
Звучит как название артхаусного фильма или странной сказки. Но на самом деле речь шла о самолёте, который садится на воду. Машинный перевод просто сделал то, что умеет машинный перевод без контекста: превратил технический каталог в набор абсурдных фраз.
И таких проблем было не две и не десять.
Каталог был огромный. Около 250 000 товаров. Авиационная тематика. Английские названия, артикулы, технические обозначения, специфические детали. Это не магазин футболок, где можно быстро понять, что перед тобой. Здесь ошибка в названии уже ломает доверие к продукту.
На этом месте обычно хочется сказать: ну конечно, надо было всё нормально подготовить до загрузки.
Но в реальности бизнес часто выглядит именно так.
Сначала быстро собрали. Потом быстро залили. Потом быстро перевели. Потом открыли сайт. Потом поняли, что быстро не получилось.
И дальше начался самый интересный вопрос: что с этим делать?
Одним из решений было посадить человека и вручную всё перепереводить. 250 000 SKU. Руками. По одному товару.
Для меня это выглядело как задача без конца.
Не потому что человек плохо работает. А потому что сама логика была неправильная. Когда проблема создана на уровне данных, шаблонов и процесса, её нельзя нормально решить только ручным трудом.
Сейчас я понимаю, что это был мой первый большой урок про качество данных.
Можно сделать красивый сайт. Можно поставить дорогую CMS. Можно залить огромный каталог. Можно сказать, что у нас большой ассортимент.
Но если данные внутри кривые, всё остальное начинает рассыпаться.
Пользователь не понимает, что он видит. Менеджер не понимает, что продаёт. SEO не понимает, какие страницы продвигать. Реклама ведёт людей в хаос. Разработка чинит последствия, а не причину.
И вот тут мой прошлый опыт неожиданно оказался очень полезен. Lineage2 научила меня не бояться технического хаоса. SEO научило смотреть на сайт как на систему страниц. Парсинг научил не пытаться чинить тысячи сущностей руками, если можно найти шаблон и процесс.
Поэтому я довольно быстро понял: проблема не только в переводе. Проблема в том, что каталогу нужна другая логика обработки.
Не ручное переписывание всего подряд.
А нормализация, шаблоны, структура, артикулы и понимание, как с такими данными вообще работать.
Это было моё первое официальное место работы в digital. И оно сразу показало мне важную вещь: реальный бизнес редко приходит к тебе в идеальном состоянии.
Чаще он приходит как большой странный каталог, где вместо технического названия написано “детка великих озёр”, сроки горят, сайт нужен для выставки, а тебе надо не рассуждать, а разбираться.
В следующей части расскажу, как мы этот проект стабилизировали, почему там внезапно появилась тема безопасности, DDoS и выставки HeliRussia, и какой главный вывод я сделал из своего первого боевого крещения.