• Русский
  • Основные понятия

    Monitoring

    Metrics

    Метрики используются для количественного описания состояния работы системы, и каждая метрика состоит из четырёх основных элементов:

    • Metric Name: используется для идентификации объекта мониторинга, например, cpu_usage
    • Metric Value: конкретное измеренное значение, например, 85.5
    • Timestamp: фиксирует время измерения
    • Labels: используются для многомерной классификации данных, например, {pod="nginx-1", namespace="default"}

    PromQL

    PromQL — это язык запросов для Prometheus, используемый для запроса и агрегации данных метрик из системы мониторинга.

    Built-in Indicators

    Платформа содержит предустановленный набор часто используемых метрик мониторинга, основанных на многолетнем опыте эксплуатации. Вы можете использовать эти метрики напрямую при настройке правил оповещений или создании панелей мониторинга без дополнительной конфигурации.

    Exporter

    Exporter — это компонент для сбора данных мониторинга, основные задачи которого включают:

    • Сбор исходных данных мониторинга из целевой системы
    • Преобразование данных в стандартный формат временных рядов метрик
    • Предоставление метрик для запросов через HTTP-интерфейс

    ServiceMonitor

    ServiceMonitor используется для декларативного управления конфигурациями мониторинга и в основном определяет:

    • Критерии выбора целей мониторинга
    • Настройки интерфейсов сбора метрик
    • Параметры выполнения задач сбора (интервалы, тайм-ауты и т.д.)

    Alarms

    Alarm Rules

    Правила оповещений определяют конкретные условия срабатывания оповещений:

    • Alarm Expression: описание условий срабатывания оповещения с помощью выражений PromQL
    • Alarm Threshold: явные граничные значения для срабатывания
    • Duration: продолжительность, в течение которой условия должны непрерывно выполняться
    • Alarm Level: различение степени серьёзности оповещений (например, P0/P1/P2)

    Alarm Policies

    Политики оповещений объединяют несколько правил оповещений для единой настройки:

    • Alarm Targets: целевой охват правил
    • Notification Method: каналы отправки оповещений
    • Sending Interval: интервал повторной отправки оповещений

    Notifications

    Notification Policies

    Политики уведомлений управляют правилами отправки сообщений об оповещениях:

    • Recipients: целевые пользователи для уведомлений об оповещениях
    • Notification Channels: поддерживаемые методы отправки сообщений
    • Notification Templates: определение формата содержимого сообщений

    Notification Templates

    Шаблоны уведомлений настраивают формат отображения сообщений об оповещениях:

    • Title Template: формат заголовка сообщения об оповещении
    • Content Template: организация деталей оповещения
    • Variable Replacement: поддержка динамического заполнения данных

    Monitoring Dashboard

    Dashboard

    Дашборд — это коллекция нескольких связанных панелей, предоставляющая общий обзор состояния системы. Поддерживает гибкое расположение элементов и может организовывать панели в строки или столбцы.

    Panels

    Панели — визуальное представление данных мониторинга, поддерживающее различные типы отображения.

    Data Sources

    Конфигурация источников данных мониторинга. В настоящее время поддерживаются только компоненты мониторинга текущего кластера, кастомные источники данных пока не поддерживаются.

    Variables

    Переменные служат в качестве заполнителей значений и могут использоваться в запросах метрик. С помощью селектора переменных в верхней части дашборда можно динамически изменять условия запросов, что позволяет обновлять содержимое графиков в реальном времени.