Введение
Во время эксплуатации и обслуживания инстанса оповещения могут использоваться для уведомления о исключениях или состояниях, требующих особого внимания. Когда инстанс сталкивается с аномалией или достигает предупреждающего состояния, оповещения могут автоматически срабатывать, помогая своевременно обнаруживать и локализовать проблемы.
Для повышения эффективности эксплуатации и обслуживания система установила правила оповещений на основе мониторинговых показателей, используемых при диагностике распространённых неисправностей инстансов, классифицируя и объединяя их в встроенные стратегии оповещений.
Платформа поддерживает правила оповещений на основе предопределённых и пользовательских мониторинговых показателей. При возникновении аномалий ресурсов или достижении предупреждающего состояния оповещения могут автоматически срабатывать. В сочетании с функцией уведомлений платформы информация об оповещениях может активно передаваться операционному персоналу, напоминая им своевременно реагировать на оповещаемые ресурсы, обеспечивая бесперебойную работу бизнес-процессов на платформе.
Для удобства настройки оповещений для большого количества ресурсов на платформе поддерживается настройка стандартизированных конфигураций оповещений для схожих инстансов через шаблоны оповещений, что позволяет быстро создавать стратегии оповещений для ресурсов на основе существующих шаблонов.
Типы оповещений
-
Metric Alert: Общие мониторинговые показатели, извлечённые платформой, которые удовлетворяют большинству потребностей клиентов. Вы можете настроить оповещения, выбрав мониторинговые показатели и установив условия срабатывания. Когда мониторинговые данные соответствуют условиям срабатывания правила оповещения, оповещение будет вызвано.
-
Custom Alert: Вы можете добавить специфичные для предприятия правила метрик на основе реальных сценариев использования, чтобы лучше удовлетворять расширенные потребности предприятия в оповещениях на базе metric alerts.
Описание состояний
-
Статус оповещения
-
Alert: Данные, полученные при запросе конфигурации правил оповещений, соответствуют условиям срабатывания и вызвали оповещение.
-
Pending: Мониторинговые данные, полученные при запросе конфигурации правил оповещений, больше или равны пороговому значению оповещения в условиях срабатывания, но длительность ещё не достигла условий срабатывания, что представляет собой критическое состояние перед вызовом оповещения. Например: если условие срабатывания правила оповещения —
использование CPU превышает 80% и длится 3 минуты, при первом обнаружении системой превышения CPU 80% правило будет помечено какPending. Оценка будет продолжаться, и если использование CPU останется выше 80% в течение 3 минут, статус правила изменится на Alert; если при последующей оценке использование CPU упадёт ниже 80%, статус правила вернётся в Normal. -
Normal: Данные, полученные при запросе конфигурации правил оповещений, не достигают порогового значения оповещения.
-
-
Статус тишины
-
Silent Pending: Статус перед началом периода тишины после его установки. В этом состоянии при срабатывании правил стратегии оповещения уведомления отправляются в обычном режиме.
-
Silent: Статус с начала до окончания периода тишины. В этом состоянии при срабатывании правил стратегии оповещения уведомления не отправляются.
-
Оповещения в реальном времени
Платформа отображает количество ресурсов, находящихся в состоянии оповещения, и подробную информацию об оповещениях через оповещения в реальном времени, позволяя операционному персоналу и администраторам в режиме реального времени понимать общую ситуацию с оповещениями бизнеса на платформе, своевременно выявлять и устранять неисправности для обеспечения нормальной работы платформы.
История оповещений
Для помощи операционному персоналу и администраторам в анализе последних условий мониторинга и отслеживании исторических проблем платформа поддерживает просмотр исторических записей оповещений за определённый период времени. Доступная для просмотра историческая информация включает время возникновения, правила оповещений, неисправные ресурсы, методы уведомления, статус и получателей уведомлений и др.
Примечание: Время хранения истории оповещений совпадает со временем хранения событий и может быть обновлено в разделе Administrator путём изменения параметров конфигурации компонента хранения логов.