Работа системы оповещений основана на следующих ключевых этапах:
Платформа ASM позволяет пользователям задавать политики оповещений (то есть набор правил оповещений) для сервисов и вычислительных компонентов на основе предустановленных метрик мониторинга, пользовательских метрик, а также данных логов и событий платформы. При обнаружении аномалий или достижении ресурсов состояния предварительного предупреждения система автоматически генерирует оповещение.
В сочетании с функционалом уведомлений платформы, информация об оповещениях может напрямую передаваться операционному персоналу или разработчикам, что обеспечивает своевременное реагирование и устранение проблем, гарантируя бесперебойную работу бизнес-процессов платформы.
В зависимости от объекта мониторинга платформа определяет следующие типы оповещений:
Metric Alerts: Платформа уточняет общие метрики мониторинга, удовлетворяющие потребности большинства клиентов. Пользователи могут настраивать оповещения, выбирая метрики мониторинга и задавая условия срабатывания. Оповещения генерируются, когда данные мониторинга соответствуют условиям срабатывания правил оповещений.
Custom Alerts: Клиенты добавляют корпоративные правила метрик в соответствии со своими сценариями использования, что лучше удовлетворяет продвинутые потребности предприятий в оповещениях.
Log Alerts (только для вычислительных компонентов): Оповещения, срабатывающие по количеству определённого содержимого логов (Error, Warning и др.), обнаруженного за заданный промежуток времени для вычислительных компонентов.
Event Alerts (только для вычислительных компонентов): Оповещения, срабатывающие по количеству событий Reason (причины текущего состояния компонента, например BackOff, Pulling, Failed и др.), обнаруженных за заданный промежуток времени.
После настройки политик оповещений система будет в реальном времени отслеживать состояние платформы на основе выбранных вами метрик мониторинга. Для каждой политики оповещений в зависимости от текущей ситуации на платформе будет установлен один из следующих статусов:
Статус оповещения
Alert: По крайней мере одно правило в политике оповещений сработало и вызвало оповещение.
Processing: По крайней мере одно правило в политике оповещений имеет данные запроса, достигшие или превысившие порог оповещения, и оповещение вот-вот будет сгенерировано — это промежуточное состояние.
Normal: Ни одно из правил в политике оповещений не вызвало оповещение.
Статус подавления (silence должен быть установлен для данной политики оповещений)
Silence Waiting: Состояние перед началом подавления после установки режима silence. В этом состоянии, если правило политики вызовет оповещение, уведомления будут отправлены как обычно.
Silencing: Состояние с момента начала подавления до его окончания. В этом состоянии, если правило политики вызовет оповещение, уведомления отправляться не будут.