Введение

Содержание

Обзор модуля

Модуль мониторинга предоставляет операционные возможности, такие как метрики, дашборды, оповещения и уведомления для администраторов платформы и операционного персонала.

Платформа интегрирует открытые компоненты, такие как Prometheus / VictoriaMetrics и панели мониторинга, обеспечивая мониторинг в реальном времени кластеров, узлов, компонентов, пользовательских приложений, Pod’ов, контейнеров и других объектов, управляемых платформой.

Поддерживается быстрая настройка оповещений по метрикам мониторинга на уровне кластера, узла и вычислительных компонентов, оповещений по логам (только для вычислительных компонентов) и оповещений по событиям. Кроме того, возможно создание пользовательских алгоритмов мониторинга метрик на основе реальных требований, что позволяет увеличить количество необходимых метрик и правил оповещений. Стратегии уведомлений можно настроить для своевременной отправки информации об оповещениях операционному персоналу, что помогает избежать сбоев системы или оперативно решать возникающие проблемы, снижая затраты на эксплуатацию и обеспечивая стабильность системы.

Преимущества модуля

Модуль мониторинга обладает следующими ключевыми преимуществами:

  • Комплексное покрытие мониторинга

    Поддерживает обширный мониторинг на различных уровнях, таких как кластеры, узлы, компоненты и контейнеры, обеспечивая сквозную цепочку мониторинга от инфраструктуры до приложений.

  • Гибкая настройка оповещений

    Предлагает богатый набор предустановленных правил оповещений, а также поддерживает создание пользовательских правил и алгоритмов для различных сценариев мониторинга.

  • Разнообразные способы визуализации

    Интегрирует профессиональные панели мониторинга, поддерживающие различные методы визуализации данных, обеспечивая наглядное представление состояния системы.

  • Эффективные уведомления об оповещениях

    Поддерживает многоканальные уведомления, включая email, SMS, webhook и другие, гарантируя своевременную доставку информации об оповещениях.

  • Масштабируемая архитектура мониторинга

    Основана на передовом технологическом стеке Prometheus / VictoriaMetrics, обладает отличной масштабируемостью и совместимостью.

Сценарии применения

Модуль мониторинга применим в следующих сценариях:

  • Мониторинг состояния кластера

    Мониторинг в реальном времени использования ресурсов, состояния узлов и работы компонентов внутри кластера для своевременного выявления потенциальных проблем.

  • Анализ производительности приложений

    Мониторинг рабочих метрик приложений и использования ресурсов контейнеров для оптимизации производительности приложений.

  • Раннее предупреждение и диагностика сбоев

    С помощью настройки разумных правил оповещений можно заранее обнаруживать аномалии системы, что способствует быстрому выявлению и устранению проблем.

  • Планирование емкости

    Проведение анализа тенденций на основе исторических данных мониторинга для обоснования расширения и оптимизации ресурсов.

Ограничения использования

При использовании модуля мониторинга обратите внимание на следующие ограничения:

  • Срок хранения данных мониторинга зависит от настроек емкости хранилища, по умолчанию период хранения составляет 7 дней.

  • Prometheus и VictoriaMetrics не могут быть установлены одновременно в одном кластере, необходимо выбрать один из них для установки.

  • Минимальный поддерживаемый интервал сбора пользовательских метрик мониторинга составляет 60 секунд.

  • Для каналов уведомлений об оповещениях должны быть предварительно настроены соответствующие сервисы (например, почтовые серверы, SMS-шлюзы, боты WeChat/DingTalk и др.).