Хенрик Гердес — "Почему я больше не могу рекомендовать Grafana"

Привет, %username%! Мне тут коллега подкинул статью «The Grafana trust problem» Хенрика Гердеса, в которой он поделился личным опытом и высказал абсолютнейшее ИМХО в отношении всего, что делает Grafana.

Понравилась цитата: "...хорошие технические решения, просто способ управления вызывает вопросы"

Немного тезисов:

  • Grafana часто меняет продукты, подходы и технологии, что вызывает проблемы со стабильностью.
  • Постоянные депрекейшены и крупные изменения (смена агентов, конфигураций, переход на свой DSL, необычные зависимости вроде Kafka) усложняют жизнь инженерных команд.
  • Сообщество и инструменты kube-prometheus-stack/Thanos публикуют менее радикальные изменения и кажутся более стабильными.
  • Главное требование для мониторинга в больших инфраструктурах — предсказуемость и минимум "шума" от изменений.

Какие решения в области мониторинга показались тебе самыми стабильными за последние 2-3 года? Как относишься к отдельным DSL для конфигураций (например, Alloy vs YAML)? Как обеспечивается устойчивость и контроль над мониторингом при постоянных изменениях инструментария? Знаешь тех, кто полностью ушел с Grafana, и если да — на что они перешли?

#Grafana #Monitoring #SRE #DevOps #Mimir #Thanos #Prometheus #Observability