Knock, knock... Wake up, Neo... The Matrix has you.. или как разбудить дежурного

Отличный обзор каналов аварийной коммуникации на

Если кратко:

«Проблема: при BCM-инцидентах корпсвязь падает, Telegram недоступен, MAX сотрудники не ставят, навык обзвона утрачен. Решение: нужны гибридные мессенджеры, работающие при падении локальной сети. На рынке готов только eXpress, прочее требует open source сборки. План: убрать публичные мессенджеры из матриц оповещения, внедрить массовые SMS-рассылки, вернуть тренировки ручного обзвона и перейти на гибридную ИТ-архитектуру»

Да, звонки сейчас не в почёте — они вырывают из привычного ритма и используются только в экстренных случаях. А авария как раз тот случай. И, конечно, речь не про ручной обзвон.

Требуется немного подготовки:

  • Актуальный и обновляемый список дежурных по направлениям поддержки бизнес-процессов.
  • Ссылка на аварийную комнату в корпоративном мессенджере.
  • Матрица эскалации.

Как это работает: 1. Аварийное событие 2. Проверка дежурным ситуационного центра, какой бизнес-процесс пострадал 3. Через автоматизированную систему запускается скрипт обзвона ответственным 4. Коллегам поступает СМС с краткой информацией об аварии и ссылкой для подключения. 5. С интервалом в 5 минут срабатывает автоматический обзвон тех, кто еще не подключился к аварийной комнате. 6. Подробности аварии направляются в email-оповещении и корпоративный мессенджер 7. При необходимости инициируется эскалация.

Итого, два надежных канала связи для оперативного реагирования и рабочий процесс по снижению времени восстановления сервиса

? А как у вас настроены оповещения?

#УправлениеИнцидентами #IncidentManagement #BusinessContinuity #SRE #ITOperations #АварийноеОповещение #CIO #IT


В этом посте были ссылки, но мы их удалили по правилам Сетки