Я получил заказное письмо от Яндекса
Внутри - сертификат SRE-инженера. Пять месяцев подготовки, и вот он у меня в руках.
Когда я только стартовал, то думал, что SRE - это про мониторинг и алерты. Уже на второй неделе понял, насколько ошибался. Основой стала книга Бетси Бейер "Site Reliability Engineering" и оригинальные Google SRE practices. Не короткие статьи, не пересказы в телеграм-каналах, а полное погружение: observability, реакция на пожары, что делать во время инцидента, что после, снижение рисков будущих пожаров, отказоустойчивость, reliability gates, снижение MTTR.
Самым жестким этапом стала итоговая аттестация. Больше пятнадцати часов на сдачу финального проекта, где нужно было показать не теорию, а реальное проектирование надежной системы с расчетом бюджетов на ошибки и SLO. Это не "прочитал и запомнил", это "спроектировал и защитил перед экспертами".
Теперь буду разбирать лучшие практики в блоге и применять в работе. Не просто пересказывать главы из книги, а показывать, как SRE-подход ложится на наши реалии: где работает, где требует адаптации, а где откровенно буксует.
Спасибо Яндексу за этот опыт и багаж навыков.
Кто из вас тоже проходил SRE-треки или сертификации? Что оказалось самым неожиданным в процессе обучения? #sre #sitereliabilityengineering #observability #incidentmanagement #reliability #mttr #slo #errorbudget #yandex #googlecloud #certification #devops #productionengineering #srepractices
· 08.06
Насколько аттестация от Яндекса была полезна для человека с 4 летним опытом в SRE?
ответить
коммент удалён
· 08.06
У меня 4+ года плотной работы в нагрузочном тестировании и SRE практиках, аттестация SRE полезна не столько новыми инструментами, сколько сдвигом мышления. Я итак умею гонять систему до предела, но SRE даёт ответ на вопрос "а что дальше?". Не простт гнать тесты и давать результаты НТ, а как спроектировать SLO, заложить error budget, помочь командам с гейтами и сократить MTTR. Нагрузочное тестирование из изолированной практики превращается в часть общей стратегии надёжности. Это стоит пройти хотя бы ради того, чтобы на архитектурных ревью разговаривать с разработчиками на одном языке и аргументировать не "сервис упал, держите дефект, чините ", а "мы точно исчерпаем бюджет ошибок, если вы надумаете внедряться игнорируя заключение НТ"
ответить
ответ удалён
· 08.06
Понял, спасибо за ответ, из профиля казалось, что ты SRE
ответить
ответ удалён
· 08.06
Я рассматриваю предложения SRE и буду рад развитию в этой сфере)
ответить
ответ удалён