🔹 SLA — договор, который спасает продакшн 🔹 Как понять, что 99.9% — это много или мало для сервиса? 🔸 SLA нужен, чтобы согласовать ожидания и ответственность между командами и клиентами. Без него product, infra и data будут спорить о приоритетах и сроках реакции.
🔸 SLA (Service Level Agreement — соглашение об уровне сервиса) — контракт: какие метрики меряем, какой уровень сервиса, окна обслуживания и последствия за провал. Уровень сервиса прописывают явно.
🔸 Uptime — доля времени, когда сервис физически "в сети". Availability — практическая доступность для пользователей (учитывает деградации и таймауты). Оба выражаются в %.
🔸 Практический пример: 99.9% uptime ≈ 43.2 минуты простоя в месяц; 99.99% ≈ 4.32 минуты. В data-проектах SLA для пайплайна = когда данные должны быть свежи; нарушение триггерит инцидент и приоритеты на восстановление.
📚 Зафиксируйте числа, автоматизируйте мониторинг и договоритесь о последствиях.
➡️ Мы в Telegram - Сетке - Дзен Буду рад вашей реакции здесь⬇️
В этом посте были ссылки, но мы их удалили по правилам Сетки