Введение
Содержание
Обзор модуля
Модуль мониторинга предоставляет операционные возможности, такие как метрики, дашборды, оповещения и уведомления для администраторов платформы и операционного персонала.
Платформа интегрирует открытые компоненты, такие как Prometheus / VictoriaMetrics и панели мониторинга, обеспечивая мониторинг в реальном времени кластеров, узлов, компонентов, пользовательских приложений, Pod’ов, контейнеров и других объектов, управляемых платформой.
Поддерживается быстрая настройка оповещений по метрикам мониторинга на уровне кластера, узла и вычислительных компонентов, оповещений по логам (только для вычислительных компонентов) и оповещений по событиям. Кроме того, возможно создание пользовательских алгоритмов мониторинга метрик на основе реальных требований, что позволяет увеличить количество необходимых метрик и правил оповещений. Стратегии уведомлений можно настроить для своевременной отправки информации об оповещениях операционному персоналу, что помогает избежать сбоев системы или оперативно решать возникающие проблемы, снижая затраты на эксплуатацию и обеспечивая стабильность системы.
Преимущества модуля
Модуль мониторинга обладает следующими ключевыми преимуществами:
-
Комплексное покрытие мониторинга
Поддерживает обширный мониторинг на различных уровнях, таких как кластеры, узлы, компоненты и контейнеры, обеспечивая сквозную цепочку мониторинга от инфраструктуры до приложений.
-
Гибкая настройка оповещений
Предлагает богатый набор предустановленных правил оповещений, а также поддерживает создание пользовательских правил и алгоритмов для различных сценариев мониторинга.
-
Разнообразные способы визуализации
Интегрирует профессиональные панели мониторинга, поддерживающие различные методы визуализации данных, обеспечивая наглядное представление состояния системы.
-
Эффективные уведомления об оповещениях
Поддерживает многоканальные уведомления, включая email, SMS, webhook и другие, гарантируя своевременную доставку информации об оповещениях.
-
Масштабируемая архитектура мониторинга
Основана на передовом технологическом стеке Prometheus / VictoriaMetrics, обладает отличной масштабируемостью и совместимостью.
Сценарии применения
Модуль мониторинга применим в следующих сценариях:
-
Мониторинг состояния кластера
Мониторинг в реальном времени использования ресурсов, состояния узлов и работы компонентов внутри кластера для своевременного выявления потенциальных проблем.
-
Анализ производительности приложений
Мониторинг рабочих метрик приложений и использования ресурсов контейнеров для оптимизации производительности приложений.
-
Раннее предупреждение и диагностика сбоев
С помощью настройки разумных правил оповещений можно заранее обнаруживать аномалии системы, что способствует быстрому выявлению и устранению проблем.
-
Планирование емкости
Проведение анализа тенденций на основе исторических данных мониторинга для обоснования расширения и оптимизации ресурсов.
Ограничения использования
При использовании модуля мониторинга обратите внимание на следующие ограничения:
-
Срок хранения данных мониторинга зависит от настроек емкости хранилища, по умолчанию период хранения составляет 7 дней.
-
Prometheus и VictoriaMetrics не могут быть установлены одновременно в одном кластере, необходимо выбрать один из них для установки.
-
Минимальный поддерживаемый интервал сбора пользовательских метрик мониторинга составляет 60 секунд.
-
Для каналов уведомлений об оповещениях должны быть предварительно настроены соответствующие сервисы (например, почтовые серверы, SMS-шлюзы, боты WeChat/DingTalk и др.).