• Русский
  • Введение

    Содержание

    Обзор модуля

    Модуль мониторинга предоставляет операционные возможности, такие как метрики, дашборды, оповещения и уведомления для администраторов платформы и операционного персонала.

    Платформа интегрирует открытые компоненты, такие как Prometheus / VictoriaMetrics и панели мониторинга, обеспечивая мониторинг в реальном времени кластеров, узлов, компонентов, пользовательских приложений, Pod’ов, контейнеров и других объектов, управляемых платформой.

    Поддерживается быстрая настройка оповещений по метрикам мониторинга на уровне кластера, узла и вычислительных компонентов, оповещений по логам (только для вычислительных компонентов) и оповещений по событиям. Кроме того, возможно создание пользовательских алгоритмов мониторинга метрик на основе реальных требований, что позволяет увеличить количество необходимых метрик и правил оповещений. Стратегии уведомлений можно настроить для своевременной отправки информации об оповещениях операционному персоналу, что помогает избежать сбоев системы или оперативно решать возникающие проблемы, снижая затраты на эксплуатацию и обеспечивая стабильность системы.

    Преимущества модуля

    Модуль мониторинга обладает следующими ключевыми преимуществами:

    • Комплексное покрытие мониторинга

      Поддерживает обширный мониторинг на различных уровнях, таких как кластеры, узлы, компоненты и контейнеры, обеспечивая сквозную цепочку мониторинга от инфраструктуры до приложений.

    • Гибкая настройка оповещений

      Предлагает богатый набор предустановленных правил оповещений, а также поддерживает создание пользовательских правил и алгоритмов для различных сценариев мониторинга.

    • Разнообразные способы визуализации

      Интегрирует профессиональные панели мониторинга, поддерживающие различные методы визуализации данных, обеспечивая наглядное представление состояния системы.

    • Эффективные уведомления об оповещениях

      Поддерживает многоканальные уведомления, включая email, SMS, webhook и другие, гарантируя своевременную доставку информации об оповещениях.

    • Масштабируемая архитектура мониторинга

      Основана на передовом технологическом стеке Prometheus / VictoriaMetrics, обладает отличной масштабируемостью и совместимостью.

    Сценарии применения

    Модуль мониторинга применим в следующих сценариях:

    • Мониторинг состояния кластера

      Мониторинг в реальном времени использования ресурсов, состояния узлов и работы компонентов внутри кластера для своевременного выявления потенциальных проблем.

    • Анализ производительности приложений

      Мониторинг рабочих метрик приложений и использования ресурсов контейнеров для оптимизации производительности приложений.

    • Раннее предупреждение и диагностика сбоев

      С помощью настройки разумных правил оповещений можно заранее обнаруживать аномалии системы, что способствует быстрому выявлению и устранению проблем.

    • Планирование емкости

      Проведение анализа тенденций на основе исторических данных мониторинга для обоснования расширения и оптимизации ресурсов.

    Ограничения использования

    При использовании модуля мониторинга обратите внимание на следующие ограничения:

    • Срок хранения данных мониторинга зависит от настроек емкости хранилища, по умолчанию период хранения составляет 7 дней.

    • Prometheus и VictoriaMetrics не могут быть установлены одновременно в одном кластере, необходимо выбрать один из них для установки.

    • Минимальный поддерживаемый интервал сбора пользовательских метрик мониторинга составляет 60 секунд.

    • Для каналов уведомлений об оповещениях должны быть предварительно настроены соответствующие сервисы (например, почтовые серверы, SMS-шлюзы, боты WeChat/DingTalk и др.).