Основные понятия

Содержание

Monitoring

Metrics

Метрики используются для количественного описания состояния работы системы, и каждая метрика состоит из четырёх основных элементов:

  • Metric Name: используется для идентификации объекта мониторинга, например, cpu_usage
  • Metric Value: конкретное измеренное значение, например, 85.5
  • Timestamp: фиксирует время измерения
  • Labels: используются для многомерной классификации данных, например, {pod="nginx-1", namespace="default"}

PromQL

PromQL — это язык запросов для Prometheus, используемый для запроса и агрегации метрик из системы мониторинга.

Built-in Indicators

Платформа имеет предустановленный набор часто используемых метрик мониторинга, основанных на многолетнем опыте эксплуатации. Вы можете использовать эти метрики напрямую при настройке правил оповещений или создании дашбордов без дополнительной конфигурации.

Exporter

Exporter — это компонент для сбора данных мониторинга, основные задачи которого включают:

  • Сбор исходных данных мониторинга с целевой системы
  • Преобразование данных в стандартный формат временных рядов метрик
  • Предоставление метрик для запросов через HTTP-интерфейс

ServiceMonitor

ServiceMonitor используется для декларативного управления конфигурациями мониторинга и в основном определяет:

  • Критерии выбора целей мониторинга
  • Конфигурацию интерфейсов сбора метрик
  • Параметры выполнения задач сбора (интервалы, таймауты и т. д.)

Alarms

Alarm Rules

Правила оповещений определяют конкретные условия срабатывания оповещений:

  • Alarm Expression: описание условий срабатывания с помощью выражений PromQL
  • Alarm Threshold: явные пороговые значения для срабатывания
  • Duration: продолжительность, в течение которой условия должны выполняться непрерывно
  • Alarm Level: различение степени серьёзности оповещений (например, P0/P1/P2)

Alarm Policies

Политики оповещений объединяют несколько правил оповещений для единой настройки:

  • Alarm Targets: целевой охват правил
  • Notification Method: каналы отправки оповещений
  • Sending Interval: интервал повторной отправки оповещений

Notifications

Notification Policies

Политики уведомлений управляют правилами отправки сообщений об оповещениях:

  • Recipients: целевые пользователи для уведомлений об оповещениях
  • Notification Channels: поддерживаемые методы отправки сообщений
  • Notification Templates: определение формата содержимого сообщений

Notification Templates

Шаблоны уведомлений настраивают формат отображения сообщений об оповещениях:

  • Title Template: формат заголовка сообщения об оповещении
  • Content Template: организация деталей оповещения
  • Variable Replacement: поддержка динамического заполнения данных

Monitoring Dashboard

Dashboard

Дашборд — это коллекция нескольких связанных панелей, предоставляющая общий обзор состояния системы. Поддерживает гибкое расположение и может организовывать панели в строки или столбцы.

Panels

Панели — визуальные представления данных мониторинга, поддерживающие различные типы отображения.

Data Sources

Конфигурация источников данных мониторинга. В настоящее время поддерживаются только компоненты мониторинга текущего кластера, кастомные источники данных пока не поддерживаются.

Variables

Переменные служат заполнителями значений и могут использоваться в запросах метрик. Через селектор переменных в верхней части дашборда можно динамически изменять условия запросов, что позволяет обновлять содержимое графиков в реальном времени.