Основные понятия
Содержание
MonitoringMetricsPromQLBuilt-in IndicatorsExporterServiceMonitorAlarmsAlarm RulesAlarm PoliciesNotificationsNotification PoliciesNotification TemplatesMonitoring DashboardDashboardPanelsData SourcesVariablesMonitoring
Metrics
Метрики используются для количественного описания состояния работы системы, и каждая метрика состоит из четырёх основных элементов:
- Metric Name: используется для идентификации объекта мониторинга, например,
cpu_usage - Metric Value: конкретное измеренное значение, например,
85.5 - Timestamp: фиксирует время измерения
- Labels: используются для многомерной классификации данных, например,
{pod="nginx-1", namespace="default"}
PromQL
PromQL — это язык запросов для Prometheus, используемый для запроса и агрегации данных метрик из системы мониторинга.
Built-in Indicators
Платформа содержит предустановленный набор часто используемых метрик мониторинга, основанных на многолетнем опыте эксплуатации. Вы можете использовать эти метрики напрямую при настройке правил оповещений или создании панелей мониторинга без дополнительной конфигурации.
Exporter
Exporter — это компонент для сбора данных мониторинга, основные задачи которого включают:
- Сбор исходных данных мониторинга из целевой системы
- Преобразование данных в стандартный формат временных рядов метрик
- Предоставление метрик для запросов через HTTP-интерфейс
ServiceMonitor
ServiceMonitor используется для декларативного управления конфигурациями мониторинга и в основном определяет:
- Критерии выбора целей мониторинга
- Настройки интерфейсов сбора метрик
- Параметры выполнения задач сбора (интервалы, тайм-ауты и т.д.)
Alarms
Alarm Rules
Правила оповещений определяют конкретные условия срабатывания оповещений:
- Alarm Expression: описание условий срабатывания оповещения с помощью выражений PromQL
- Alarm Threshold: явные граничные значения для срабатывания
- Duration: продолжительность, в течение которой условия должны непрерывно выполняться
- Alarm Level: различение степени серьёзности оповещений (например, P0/P1/P2)
Alarm Policies
Политики оповещений объединяют несколько правил оповещений для единой настройки:
- Alarm Targets: целевой охват правил
- Notification Method: каналы отправки оповещений
- Sending Interval: интервал повторной отправки оповещений
Notifications
Notification Policies
Политики уведомлений управляют правилами отправки сообщений об оповещениях:
- Recipients: целевые пользователи для уведомлений об оповещениях
- Notification Channels: поддерживаемые методы отправки сообщений
- Notification Templates: определение формата содержимого сообщений
Notification Templates
Шаблоны уведомлений настраивают формат отображения сообщений об оповещениях:
- Title Template: формат заголовка сообщения об оповещении
- Content Template: организация деталей оповещения
- Variable Replacement: поддержка динамического заполнения данных
Monitoring Dashboard
Dashboard
Дашборд — это коллекция нескольких связанных панелей, предоставляющая общий обзор состояния системы. Поддерживает гибкое расположение элементов и может организовывать панели в строки или столбцы.
Panels
Панели — визуальное представление данных мониторинга, поддерживающее различные типы отображения.
Data Sources
Конфигурация источников данных мониторинга. В настоящее время поддерживаются только компоненты мониторинга текущего кластера, кастомные источники данных пока не поддерживаются.
Variables
Переменные служат в качестве заполнителей значений и могут использоваться в запросах метрик. С помощью селектора переменных в верхней части дашборда можно динамически изменять условия запросов, что позволяет обновлять содержимое графиков в реальном времени.