Мониторинг и оповещения

Платформа предоставляет комплексные возможности мониторинга с интегрированными панелями управления для экземпляров Redis. Эти функции мониторинга позволяют анализировать производительность, отслеживать использование ресурсов и настраивать механизмы оповещений для проактивного управления.

Содержание

Мониторинг Оповещения Настройка правил оповещений

Мониторинг

Платформа автоматически собирает ключевые показатели производительности для экземпляров Redis, связанные с использованием ресурсов и операционной эффективностью. Эти метрики можно просматривать в режиме реального времени на вкладке Monitoring экземпляра.

Категория	Метрики
Мониторинг состояния кластера	Статистика количества ключей, метрики выполнения команд, задержка репликации и др.
Мониторинг ресурсов	Использование памяти, сетевой трафик, потребление хранилища и др.
Мониторинг производительности	Количество соединений, пропускная способность сети, задержка команд и др.

Оповещения

Для настройки правил оповещений для экземпляров Redis перейдите на страницу Alerts > Rules в Alauda Application Service.

Настройка правил оповещений

Для реализации оповещений необходимо создать правило оповещения в Alauda Application Service. Правило оповещения определяет объекты мониторинга, пороговые условия, при которых срабатывают уведомления, и механизмы доставки уведомлений.

Платформа предоставляет следующие преднастроенные индикаторы оповещений:

Индикатор	Рекомендуемый порог	Описание
Состояние экземпляра	!=1, устойчиво в течение 30 секунд	Отслеживает доступность и рабочее состояние экземпляра
Процент попаданий по ключам	< 80%, устойчиво в течение 30 секунд	Отслеживает эффективность кеша; низкий процент попаданий может указывать на пропуски кеша, требующие корректировки стратегии (увеличение TTL, оптимизация паттернов ключей и др.)
Среднее время отклика	>0.1 с, устойчиво в течение 30 секунд	Отслеживает задержку выполнения команд; длительное время отклика может указывать на ограничение CPU, чрезмерную нагрузку или операции с BigKey
Переключение мастер-слейв	=1, устойчиво в течение 30 секунд	Обнаруживает переходы ролей мастер-слейв, которые могут свидетельствовать о проблемах инфраструктуры или сбоях узлов Redis
Входящая пропускная способность на узел	Пороговые значения, специфичные для среды	Отслеживает входящий сетевой трафик в реальном времени для предотвращения насыщения пропускной способности, влияющего на доступность сервиса
Исходящая пропускная способность на узел	Пороговые значения, специфичные для среды	Отслеживает исходящий сетевой трафик в реальном времени для предотвращения насыщения пропускной способности, влияющего на доступность сервиса
Количество клиентских соединений на узел	Пороговые значения, специфичные для среды	Отслеживает паттерны соединений для выявления возможных утечек соединений или аномального доступа
Использование CPU на узле	> 80%, устойчиво в течение 30 секунд	Отслеживает потребление CPU; длительно высокое использование может потребовать планирования емкости и масштабирования
Использование памяти на узле	> 80%, устойчиво в течение 30 секунд	Отслеживает использование памяти; приближение к лимитам емкости требует немедленного масштабирования для предотвращения вытеснения или OOM-состояний
Использование хранилища на узле	> 80%, устойчиво в течение 30 секунд	Отслеживает использование постоянного хранилища для конфигураций RDB/AOF; высокий уровень использования требует расширения емкости

Эти преднастроенные индикаторы облегчают быструю реализацию правил оповещений. Для расширенных требований к мониторингу можно определить пользовательские индикаторы оповещений с использованием синтаксиса запросов Prometheus:

(1/(1+(avg(irate(redis_keyspace_misses_total{namespace=~"<namespace>", pod=~"<podname prefix>-.*"}[5m])) by(namespace,service) / (avg(irate(redis_keyspace_hits_total{namespace=~"<namespace>", pod=~"<podname prefix>-.*"}[5m])) by(namespace,service)+1))))

В этом примере redis_keyspace_misses_total представляет собой метрику, собираемую Prometheus, <namespace> фильтрует ресурсы по namespace, а <podname prefix> задаёт шаблон имени Pod для ресурсов, управляемых Deployment или StatefulSet. Для подробной информации о запросах метрик обратитесь к PromQL Official Documentation.

Для детальных инструкций по настройке и управлению оповещениями смотрите Alert Management.

#Мониторинг и оповещения

#Содержание

#Мониторинг

#Оповещения

#Настройка правил оповещений

Мониторинг и оповещения

Содержание

Мониторинг

Оповещения

Настройка правил оповещений