🔎 Prometheus: система мониторинга, которая знает все

Кратко: Prometheus — это open-source система для сбора и анализа метрик. Она опрашивает ваши сервисы, выдёргивает цифры (сколько запросов, свободной памяти, ошибок) и сохраняет их в базу. Это стандарт мониторинга в Kubernetes и DevOps.

▫️Как дошли до жизни такой · 2012 г. — Мэтт Пруитт (экс-Google) создаёт Prometheus в SoundCloud · 2015 г. — Второй проект после Kubernetes, принятый в CNCF · 2018 г. — Выпускной проект CNCF, версия 2.0 · 2020–2026 гг. — Стандарт индустрии, есть managed-версии у всех облачных провайдеров

▫️Как работает (Pull-модель) Prometheus сам идёт и опрашивает ваши сервисы: 1. Экспортёры — агенты, отдающие метрики. Node Exporter (системные метрики), cAdvisor (контейнеры), Blackbox (доступность), экспортёры для БД 2. Scrape — каждые 15–30 секунд забирает метрики с http://target:9100/metrics 3. Хранение — локальная time-series БД (обычно 15 дней) 4. PromQL — язык запросов для графиков и алертов 5. Alertmanager — отправляет уведомления в Telegram, Slack, PagerDuty

▫️PromQL на примере # Средняя задержка запросов за 5 минут avg(rate(http_request_duration_seconds_sum[5m]) / rate(http_request_duration_seconds_count[5m])) # Ошибки 5xx в процентах sum(rate(http_requests_total{status=~"5.."}[5m])) / sum(rate(http_requests_total[5m])) * 100

▫️Где живёт (2026) · Kubernetes — стандартный сборщик метрик через kube-state-metrics и cAdvisor · Микросервисы — приложения отдают метрики на /metrics наравне с health · Облака — AWS (Amazon Managed Service for Prometheus), Google Cloud Monitoring (с поддержкой PromQL), Yandex Monitoring (через remote-write) · IoT и Edge — лёгкий режим (Agent Mode) без локального хранения

▫️Плюсы и минусы Плюсы: · Open source, огромное сообщество · PromQL — лучший язык для метрик · Родная интеграция с Kubernetes · Тысячи экспортёров подо всё Минусы: · Pull-модель не везде удобна (короткоживущие batch-задачи, сервисы за NAT) · Долгое хранение — проблема (по умолчанию 15 дней) · Горизонтальное масштабирование сложное (нужен Thanos или VictoriaMetrics)

▫️Культурный феномен · «Prometheus везде» — если у сервиса есть /metrics, он уважает себя · «PromQL — это SQL для DevOps» — без него в мониторинге делать нечего · Pull-модель — Prometheus всегда в курсе, кто жив, а кто нет (если не отвечает — сервис мёртв) · Мем про метрики — «Упало всё, но метрики собираются отлично»

▫️Современное положение (2026) · Версия — 2.x, на подходе 3.0 (бета с новым хранилищем) · Долгое хранение — Thanos (дедупликация в S3) или VictoriaMetrics (как замена, но с тем же PromQL) · Тренды — Prometheus в паре с Grafana (стандарт), Remote Write в облака, Agent Mode для edge · Альтернативы — VictoriaMetrics (совместима с PromQL, лучше масштабируется), Mimir (от Grafana Labs)

▫️С чего начать 1. docker run -p 9090:9090 prom/prometheus — поднять в контейнере 2. Поставить Node Exporter на сервер 3. Настроить таргеты в prometheus.yml 4. Идти на localhost:9090, писать запросы 5. Добавить Grafana для красивых дашбордов

#prometheus #мониторинг #devops #promql #kubernetes #opensource

🔎 Prometheus: система мониторинга, которая знает все | Сетка — социальная сеть от hh.ru