SREGame: живой CTF по SRE вместо скучных учебников
Привет, %username%! Если тебе надоели теоретические статьи про SRE и хочется «потрогать прод» без риска всё уронить, обрати внимание на SREGame — сервис с живым sandbox-окружением, где ты расследуешь инциденты как в реальной жизни.
Вместо симуляций тебе дают доступ к настоящему окружению: лезешь в конфиги, смотришь логи и трафик, ищешь флаги, разбираешься, почему всё упало и как это починить. По сути, это CTF в формате «боевых дежурств»: меньше теории, больше реального hands-on, который можно потом конвертировать в улучшения своих процессов, алертов и runbook’ов.
Такой формат отлично заходит:
- SRE/DevOps, которые хотят прокачать навыки расследования инцидентов без боли продакшена.
- Тимлидам и техлидам, которым нужен практический тренажёр для команды вместо абстрактных тренингов.
- Инженерам эксплуатации, которые хотят потренироваться «копать глубже»: от сети и конфигураций до приложений и инфраструктуры.
Мне нравится идея использовать подобный сервис как внутренний «полигон»: можно устраивать регулярные CTF-сессии, отрабатывать on-call сценарии, шлифовать процессы эскалации и совместно улучшать документацию и знания команды.
А как ты учишь команду разбирать инциденты: разборы полётов на сухих постмортемах или практические разборы в песочнице? Хотел(а) бы поучаствовать в таком SRE CTF сам(а) или дать его джунам/мидлам как часть онбординга? Какие форматы «боевого» обучения SRE тебе заходят лучше всего и почему?