Диплом о профессиональной переподготовке по программе «SRE»
Диплом о профессиональной переподготовке по программе «SRE — обеспечение надёжности систем» ▪ Присвоенная квалификация: Программист
Certificate of Completion of the Professional Training Course "Site Reliability Engineering" ▪ Qualification: Developer
В рамках курса я освоил ключевые компетенции SRE (Site Reliability Engineering):
— Признаки инцидентов
— Как узнать об инциденте: наблюдаемость
— Как узнать об инциденте: метрики
— Во время инцидента
— После инцидента
— Снижение рисков будущих инцидентов: отказоустойчивость
— Снижение рисков будущих инцидентов: надежность
— Сокращение времени устранения инцидентов
Технические навыки: - Полный стек observability: Prometheus, Grafana, Loki, Tempo - Автоматизация мониторинга и алертинга - Распределенный трейсинг и корреляция сигналов - Kubernetes и container orchestration - Инфраструктура как код (Helm, YAML)
Процессные навыки: - Инцидент-менеджмент и on-call процессы - Разработка и поддержка документации - Планирование дежурств и эскалации - Disaster Recovery Planning - Оптимизация MTTR и снижение шума в алертах
Методологические навыки: - SRE принципы и best practices - Четыре золотых сигнала мониторинга - SLI/SLO/SLA определение и отслеживание - Chaos engineering и тестирование надежности - Capacity planning и performance analysis
#SRE #SLI #SLO #SLA #ErrorBudget #Postmortem #GoldenSignals #RED #Grafana #Loki #Mimir #Prometheus #Tempo #OpenTelemetry #Alertmanager #GoAlert #GitLab #Kubernetes #Terraform #Ansible #nginx