SREGame: живой CTF по SRE вместо скучных учебников

Привет, %username%! Если тебе надоели теоретические статьи про SRE и хочется «потрогать прод» без риска всё уронить, обрати внимание на SREGame — сервис с живым sandbox-окружением, где ты расследуешь инциденты как в реальной жизни.

Вместо симуляций тебе дают доступ к настоящему окружению: лезешь в конфиги, смотришь логи и трафик, ищешь флаги, разбираешься, почему всё упало и как это починить. По сути, это CTF в формате «боевых дежурств»: меньше теории, больше реального hands-on, который можно потом конвертировать в улучшения своих процессов, алертов и runbook’ов.

Такой формат отлично заходит:

  • SRE/DevOps, которые хотят прокачать навыки расследования инцидентов без боли продакшена.
  • Тимлидам и техлидам, которым нужен практический тренажёр для команды вместо абстрактных тренингов.
  • Инженерам эксплуатации, которые хотят потренироваться «копать глубже»: от сети и конфигураций до приложений и инфраструктуры.

Мне нравится идея использовать подобный сервис как внутренний «полигон»: можно устраивать регулярные CTF-сессии, отрабатывать on-call сценарии, шлифовать процессы эскалации и совместно улучшать документацию и знания команды.

А как ты учишь команду разбирать инциденты: разборы полётов на сухих постмортемах или практические разборы в песочнице? Хотел(а) бы поучаствовать в таком SRE CTF сам(а) или дать его джунам/мидлам как часть онбординга? Какие форматы «боевого» обучения SRE тебе заходят лучше всего и почему?

#SRE #DevOps #OnCall #Incidents #CTF #Education #SREGame