Knock, knock... Wake up, Neo... The Matrix has you.. или как разбудить дежурного
Отличный обзор каналов аварийной коммуникации на
Если кратко:
«Проблема: при BCM-инцидентах корпсвязь падает, Telegram недоступен, MAX сотрудники не ставят, навык обзвона утрачен. Решение: нужны гибридные мессенджеры, работающие при падении локальной сети. На рынке готов только eXpress, прочее требует open source сборки. План: убрать публичные мессенджеры из матриц оповещения, внедрить массовые SMS-рассылки, вернуть тренировки ручного обзвона и перейти на гибридную ИТ-архитектуру»
Да, звонки сейчас не в почёте — они вырывают из привычного ритма и используются только в экстренных случаях. А авария как раз тот случай. И, конечно, речь не про ручной обзвон.
Требуется немного подготовки:
- Актуальный и обновляемый список дежурных по направлениям поддержки бизнес-процессов.
- Ссылка на аварийную комнату в корпоративном мессенджере.
- Матрица эскалации.
Как это работает: 1. Аварийное событие 2. Проверка дежурным ситуационного центра, какой бизнес-процесс пострадал 3. Через автоматизированную систему запускается скрипт обзвона ответственным 4. Коллегам поступает СМС с краткой информацией об аварии и ссылкой для подключения. 5. С интервалом в 5 минут срабатывает автоматический обзвон тех, кто еще не подключился к аварийной комнате. 6. Подробности аварии направляются в email-оповещении и корпоративный мессенджер 7. При необходимости инициируется эскалация.
Итого, два надежных канала связи для оперативного реагирования и рабочий процесс по снижению времени восстановления сервиса
? А как у вас настроены оповещения?
#УправлениеИнцидентами #IncidentManagement #BusinessContinuity #SRE #ITOperations #АварийноеОповещение #CIO #IT
В этом посте были ссылки, но мы их удалили по правилам Сетки