ПСЖ — Интер: это не про футбол. Это про провал продукта со счётом 5:0 Как вы знаете, правами на показ футбола обладает один кинотеатр. Поэтому рассказ дальше пойдет о нем. Пост написан достаточно давно, но актуальность он потеряет еще не скоро.
31 мая 2025 год, 22:00. Включаю телевизор 〰 финал Лиги чемпионов. Я, кстати, дальше от футбола, чем Мэт Деймон от шанса быть неспасенным в очередном блокбастере. Футбол это что? Не лопнувший мыльный пузырь: 22 миллионэра гоняют мяч, а миллионы платят за возможность на это посмотреть.
Но сыну надо. Пришлось включить. И стать свидетелем очередного провала продуктовой команды в момент пиковой нагрузки. 〰 Анамнез: Главная страница 〰 жива. Красивый баннер. Привлекает новых пользователей. Подписка 〰 мертва. При попытке оплаты 〰 бесконечный лоудер. Деньги 〰 тихо списываются. За 5 минут три платежа. Трансляция 〰 не грузится. Поддержка 〰 не просто молчит. Чат потух вместе со всем остальным. Интерфейс 〰 выглядит как будто всё в порядке. Ни намёка на сбой. И так около 20 минут матча.
Шок. Не в падении. Со всеми бывает. Проблема в полном отсутствии реакции.
У продукта не было ни одного уведомления о работе со сбоем: 〰 Не убрали баннер с морды 〰 продолжая наращивать нагрузку. 〰 Никаких аварийных обёрток 〰 ни «проблема, решаем», ни даже «извините». 〰 Бот поддержки 〰 в отключке. 〰 Никакой коммуникации с пользователем. Ни во время, ни после.
Прямые потери 〰 копейки. Потеря доверия 〰 вот настоящая проблема. Это не история про «айтишников, которые не выдержали нагрузку». Это история про продуктовую и управленческую культуру. Или, точнее 〰 про её отсутствие.
〰 А как же надо? В Яндексе Таня кошмарила всех учениями в ДЦ: Просто дёргала рубильник 〰 и мы учились держать лицо, когда всё падает. Спасибо ей.
〰 Поэтому для неравнодушных есть чек-лист на черный день для затравки:
〰 Не надеяться на авось. Запускать заранее согласованный протокол 〰 а не бегать в панике.
〰 Снять баннеры. Вырубить рекламу. Первым делом 〰 остановить приток новых пользователей. Спасаем не сервер, а репутацию.
〰 Включить аварийного бота. Чат поддержки не должен зависеть от основной инфраструктуры. Но раз уж так вышло, заготовленные ответы 〰 лучше, чем тишина. «Мы знаем, что у вас проблемы. Работаем над этим. Спасибо за терпение»
〰 Дать сигнал. Заранее предусмотренное «место под аварию» 〰 даже в виде простого баннера. Не «всё ок», а «горит, но мы не прячемся».
〰 При масштабном сбое врубаем программу «Свидетель». Собрать ID всех, кто заплатил и не получил. Предложить компенсацию 〰 не как жест доброй воли, а как стандартную процедуру восстановления репутации. Мораль: Готовитесь к пику? Готовьтесь и к провалу. Потому что в момент славы любая неготовность может привести к провалу. P.S. Если вы 〰 руководитель, продукт-менеджер, инженер 〰 задайте себе вопрос: «А если завтра сервис упадёт в — что будет делать команда?» Если ответ 〰 «не знаю» 〰 значит, вы уже в зоне риска.
Делитесь опытом. Что у вас было? Как вы справились? Или 〰 как вы не справились?
В этом посте были ссылки, но мы их удалили по правилам Сетки