Основные понятия
Содержание
Monitoring
Metrics
Метрики используются для количественного описания состояния работы системы, и каждая метрика состоит из четырёх основных элементов:
- Metric Name: используется для идентификации объекта мониторинга, например,
cpu_usage - Metric Value: конкретное измеренное значение, например,
85.5 - Timestamp: фиксирует время измерения
- Labels: используются для многомерной классификации данных, например,
{pod="nginx-1", namespace="default"}
PromQL
PromQL — это язык запросов для Prometheus, используемый для запроса и агрегации метрик из системы мониторинга.
Built-in Indicators
Платформа имеет предустановленный набор часто используемых метрик мониторинга, основанных на многолетнем опыте эксплуатации. Вы можете использовать эти метрики напрямую при настройке правил оповещений или создании дашбордов без дополнительной конфигурации.
Exporter
Exporter — это компонент для сбора данных мониторинга, основные задачи которого включают:
- Сбор исходных данных мониторинга с целевой системы
- Преобразование данных в стандартный формат временных рядов метрик
- Предоставление метрик для запросов через HTTP-интерфейс
ServiceMonitor
ServiceMonitor используется для декларативного управления конфигурациями мониторинга и в основном определяет:
- Критерии выбора целей мониторинга
- Конфигурацию интерфейсов сбора метрик
- Параметры выполнения задач сбора (интервалы, таймауты и т. д.)
Alarms
Alarm Rules
Правила оповещений определяют конкретные условия срабатывания оповещений:
- Alarm Expression: описание условий срабатывания с помощью выражений PromQL
- Alarm Threshold: явные пороговые значения для срабатывания
- Duration: продолжительность, в течение которой условия должны выполняться непрерывно
- Alarm Level: различение степени серьёзности оповещений (например, P0/P1/P2)
Alarm Policies
Политики оповещений объединяют несколько правил оповещений для единой настройки:
- Alarm Targets: целевой охват правил
- Notification Method: каналы отправки оповещений
- Sending Interval: интервал повторной отправки оповещений
Notifications
Notification Policies
Политики уведомлений управляют правилами отправки сообщений об оповещениях:
- Recipients: целевые пользователи для уведомлений об оповещениях
- Notification Channels: поддерживаемые методы отправки сообщений
- Notification Templates: определение формата содержимого сообщений
Notification Templates
Шаблоны уведомлений настраивают формат отображения сообщений об оповещениях:
- Title Template: формат заголовка сообщения об оповещении
- Content Template: организация деталей оповещения
- Variable Replacement: поддержка динамического заполнения данных
Monitoring Dashboard
Dashboard
Дашборд — это коллекция нескольких связанных панелей, предоставляющая общий обзор состояния системы. Поддерживает гибкое расположение и может организовывать панели в строки или столбцы.
Panels
Панели — визуальные представления данных мониторинга, поддерживающие различные типы отображения.
Data Sources
Конфигурация источников данных мониторинга. В настоящее время поддерживаются только компоненты мониторинга текущего кластера, кастомные источники данных пока не поддерживаются.
Variables
Переменные служат заполнителями значений и могут использоваться в запросах метрик. Через селектор переменных в верхней части дашборда можно динамически изменять условия запросов, что позволяет обновлять содержимое графиков в реальном времени.