Модуль мониторинга предоставляет операционные возможности, такие как метрики, дашборды, оповещения и уведомления для администраторов платформы и операционного персонала.
Платформа интегрирует открытые компоненты, такие как Prometheus / VictoriaMetrics и панели мониторинга, обеспечивая мониторинг в реальном времени кластеров, узлов, компонентов, пользовательских приложений, Pod’ов, контейнеров и других объектов, управляемых платформой.
Поддерживается быстрая настройка оповещений по метрикам мониторинга на уровне кластера, узла и вычислительных компонентов, оповещений по логам (только для вычислительных компонентов) и оповещений по событиям. Кроме того, возможно создание пользовательских алгоритмов мониторинга метрик на основе реальных требований, что позволяет увеличить количество необходимых метрик и правил оповещений. Стратегии уведомлений можно настроить для своевременной отправки информации об оповещениях операционному персоналу, что помогает избежать сбоев системы или оперативно решать возникающие проблемы, снижая затраты на эксплуатацию и обеспечивая стабильность системы.
Модуль мониторинга обладает следующими ключевыми преимуществами:
Комплексное покрытие мониторинга
Поддерживает обширный мониторинг на различных уровнях, таких как кластеры, узлы, компоненты и контейнеры, обеспечивая сквозную цепочку мониторинга от инфраструктуры до приложений.
Гибкая настройка оповещений
Предлагает богатый набор предустановленных правил оповещений, а также поддерживает создание пользовательских правил и алгоритмов для различных сценариев мониторинга.
Разнообразные способы визуализации
Интегрирует профессиональные панели мониторинга, поддерживающие различные методы визуализации данных, обеспечивая наглядное представление состояния системы.
Эффективные уведомления об оповещениях
Поддерживает многоканальные уведомления, включая email, SMS, webhook и другие, гарантируя своевременную доставку информации об оповещениях.
Масштабируемая архитектура мониторинга
Основана на передовом технологическом стеке Prometheus / VictoriaMetrics, обладает отличной масштабируемостью и совместимостью.
Модуль мониторинга применим в следующих сценариях:
Мониторинг состояния кластера
Мониторинг в реальном времени использования ресурсов, состояния узлов и работы компонентов внутри кластера для своевременного выявления потенциальных проблем.
Анализ производительности приложений
Мониторинг рабочих метрик приложений и использования ресурсов контейнеров для оптимизации производительности приложений.
Раннее предупреждение и диагностика сбоев
С помощью настройки разумных правил оповещений можно заранее обнаруживать аномалии системы, что способствует быстрому выявлению и устранению проблем.
Планирование емкости
Проведение анализа тенденций на основе исторических данных мониторинга для обоснования расширения и оптимизации ресурсов.
При использовании модуля мониторинга обратите внимание на следующие ограничения:
Срок хранения данных мониторинга зависит от настроек емкости хранилища, по умолчанию период хранения составляет 7 дней.
Prometheus и VictoriaMetrics не могут быть установлены одновременно в одном кластере, необходимо выбрать один из них для установки.
Минимальный поддерживаемый интервал сбора пользовательских метрик мониторинга составляет 60 секунд.
Для каналов уведомлений об оповещениях должны быть предварительно настроены соответствующие сервисы (например, почтовые серверы, SMS-шлюзы, боты WeChat/DingTalk и др.).