Основные понятия

Содержание

Monitoring

Metrics

Метрики используются для количественного описания состояния работы системы, и каждая метрика состоит из четырёх основных элементов:

  • Metric Name: используется для идентификации объекта мониторинга, например, cpu_usage
  • Metric Value: конкретное измеренное значение, например, 85.5
  • Timestamp: фиксирует время измерения
  • Labels: используются для многомерной классификации данных, например, {pod="nginx-1", namespace="default"}

PromQL

PromQL — это язык запросов для Prometheus, используемый для запроса и агрегации данных метрик из системы мониторинга.

Built-in Indicators

Платформа содержит предустановленный набор часто используемых метрик мониторинга, основанных на многолетнем опыте эксплуатации. Вы можете использовать эти метрики напрямую при настройке правил оповещений или создании панелей мониторинга без дополнительной конфигурации.

Exporter

Exporter — это компонент для сбора данных мониторинга, основные задачи которого включают:

  • Сбор исходных данных мониторинга из целевой системы
  • Преобразование данных в стандартный формат временных рядов метрик
  • Предоставление метрик для запросов через HTTP-интерфейс

ServiceMonitor

ServiceMonitor используется для декларативного управления конфигурациями мониторинга и в основном определяет:

  • Критерии выбора целей мониторинга
  • Настройки интерфейсов сбора метрик
  • Параметры выполнения задач сбора (интервалы, тайм-ауты и т.д.)

Alarms

Alarm Rules

Правила оповещений определяют конкретные условия срабатывания оповещений:

  • Alarm Expression: описание условий срабатывания оповещения с помощью выражений PromQL
  • Alarm Threshold: явные граничные значения для срабатывания
  • Duration: продолжительность, в течение которой условия должны непрерывно выполняться
  • Alarm Level: различение степени серьёзности оповещений (например, P0/P1/P2)

Alarm Policies

Политики оповещений объединяют несколько правил оповещений для единой настройки:

  • Alarm Targets: целевой охват правил
  • Notification Method: каналы отправки оповещений
  • Sending Interval: интервал повторной отправки оповещений

Notifications

Notification Policies

Политики уведомлений управляют правилами отправки сообщений об оповещениях:

  • Recipients: целевые пользователи для уведомлений об оповещениях
  • Notification Channels: поддерживаемые методы отправки сообщений
  • Notification Templates: определение формата содержимого сообщений

Notification Templates

Шаблоны уведомлений настраивают формат отображения сообщений об оповещениях:

  • Title Template: формат заголовка сообщения об оповещении
  • Content Template: организация деталей оповещения
  • Variable Replacement: поддержка динамического заполнения данных

Monitoring Dashboard

Dashboard

Дашборд — это коллекция нескольких связанных панелей, предоставляющая общий обзор состояния системы. Поддерживает гибкое расположение элементов и может организовывать панели в строки или столбцы.

Panels

Панели — визуальное представление данных мониторинга, поддерживающее различные типы отображения.

Data Sources

Конфигурация источников данных мониторинга. В настоящее время поддерживаются только компоненты мониторинга текущего кластера, кастомные источники данных пока не поддерживаются.

Variables

Переменные служат в качестве заполнителей значений и могут использоваться в запросах метрик. С помощью селектора переменных в верхней части дашборда можно динамически изменять условия запросов, что позволяет обновлять содержимое графиков в реальном времени.