• Русский
  • Мониторинг и оповещения

    Платформа предоставляет комплексные возможности мониторинга с интегрированными панелями управления для экземпляров Redis. Эти функции мониторинга позволяют анализировать производительность, отслеживать использование ресурсов и настраивать механизмы оповещений для проактивного управления.

    Мониторинг

    Платформа автоматически собирает ключевые показатели производительности для экземпляров Redis, связанные с использованием ресурсов и операционной эффективностью. Эти метрики можно просматривать в режиме реального времени на вкладке Monitoring экземпляра.

    КатегорияМетрики
    Мониторинг состояния кластераСтатистика количества ключей, метрики выполнения команд, задержка репликации и др.
    Мониторинг ресурсовИспользование памяти, сетевой трафик, потребление хранилища и др.
    Мониторинг производительностиКоличество соединений, пропускная способность сети, задержка команд и др.

    Оповещения

    Для настройки правил оповещений для экземпляров Redis перейдите на страницу Alerts > Rules в Alauda Application Service.

    Настройка правил оповещений

    Для реализации оповещений необходимо создать правило оповещения в Alauda Application Service. Правило оповещения определяет объекты мониторинга, пороговые условия, при которых срабатывают уведомления, и механизмы доставки уведомлений.

    Платформа предоставляет следующие преднастроенные индикаторы оповещений:

    ИндикаторРекомендуемый порогОписание
    Состояние экземпляра!=1, устойчиво в течение 30 секундОтслеживает доступность и рабочее состояние экземпляра
    Процент попаданий по ключам< 80%, устойчиво в течение 30 секундОтслеживает эффективность кеша; низкий процент попаданий может указывать на пропуски кеша, требующие корректировки стратегии (увеличение TTL, оптимизация паттернов ключей и др.)
    Среднее время отклика>0.1 с, устойчиво в течение 30 секундОтслеживает задержку выполнения команд; длительное время отклика может указывать на ограничение CPU, чрезмерную нагрузку или операции с BigKey
    Переключение мастер-слейв=1, устойчиво в течение 30 секундОбнаруживает переходы ролей мастер-слейв, которые могут свидетельствовать о проблемах инфраструктуры или сбоях узлов Redis
    Входящая пропускная способность на узелПороговые значения, специфичные для средыОтслеживает входящий сетевой трафик в реальном времени для предотвращения насыщения пропускной способности, влияющего на доступность сервиса
    Исходящая пропускная способность на узелПороговые значения, специфичные для средыОтслеживает исходящий сетевой трафик в реальном времени для предотвращения насыщения пропускной способности, влияющего на доступность сервиса
    Количество клиентских соединений на узелПороговые значения, специфичные для средыОтслеживает паттерны соединений для выявления возможных утечек соединений или аномального доступа
    Использование CPU на узле> 80%, устойчиво в течение 30 секундОтслеживает потребление CPU; длительно высокое использование может потребовать планирования емкости и масштабирования
    Использование памяти на узле> 80%, устойчиво в течение 30 секундОтслеживает использование памяти; приближение к лимитам емкости требует немедленного масштабирования для предотвращения вытеснения или OOM-состояний
    Использование хранилища на узле> 80%, устойчиво в течение 30 секундОтслеживает использование постоянного хранилища для конфигураций RDB/AOF; высокий уровень использования требует расширения емкости

    Эти преднастроенные индикаторы облегчают быструю реализацию правил оповещений. Для расширенных требований к мониторингу можно определить пользовательские индикаторы оповещений с использованием синтаксиса запросов Prometheus:

    (1/(1+(avg(irate(redis_keyspace_misses_total{namespace=~"<namespace>", pod=~"<podname prefix>-.*"}[5m])) by(namespace,service) / (avg(irate(redis_keyspace_hits_total{namespace=~"<namespace>", pod=~"<podname prefix>-.*"}[5m])) by(namespace,service)+1))))

    В этом примере redis_keyspace_misses_total представляет собой метрику, собираемую Prometheus, <namespace> фильтрует ресурсы по namespace, а <podname prefix> задаёт шаблон имени Pod для ресурсов, управляемых Deployment или StatefulSet. Для подробной информации о запросах метрик обратитесь к PromQL Official Documentation.

    Для детальных инструкций по настройке и управлению оповещениями смотрите Alert Management.