Введение

Во время эксплуатации и обслуживания инстанса оповещения могут использоваться для уведомления о исключениях или состояниях, требующих особого внимания. Когда инстанс сталкивается с аномалией или достигает состояния предупреждения, оповещения могут автоматически срабатывать, помогая своевременно обнаруживать и локализовать проблемы.

Для повышения эффективности эксплуатации и обслуживания система установила правила оповещений на основе мониторинговых показателей, используемых при устранении распространённых неисправностей инстансов, классифицируя и объединяя их в встроенные стратегии оповещений.

Платформа поддерживает правила оповещений на основе предопределённых мониторинговых показателей и пользовательских показателей. При возникновении аномалий ресурсов или достижении состояния предупреждения оповещения могут автоматически срабатывать. В сочетании с функцией уведомлений платформы информация об оповещениях может активно передаваться операционному персоналу, напоминая им своевременно реагировать на оповещаемые ресурсы, обеспечивая бесперебойную работу бизнеса на платформе.

Для удобства настройки оповещений для большого количества ресурсов на платформе поддерживается возможность настраивать стандартизированные конфигурации оповещений для похожих инстансов с помощью шаблонов оповещений, что позволяет быстро создавать стратегии оповещений для ресурсов на основе существующих шаблонов.

Содержание

Типы оповещений

  • Metric Alert: Общие мониторинговые показатели, извлечённые платформой, которые удовлетворяют большинству потребностей клиентов. Вы можете настроить оповещения, выбрав мониторинговые показатели и установив условия срабатывания. Когда мониторинговые данные соответствуют условиям срабатывания правила оповещения, оповещение будет вызвано.

  • Custom Alert: Вы можете добавить корпоративные правила метрик на основе реальных сценариев использования, чтобы лучше удовлетворять расширенные потребности предприятия в оповещениях на основе metric alerts.

Описание статусов

  • Статус оповещения

    • Alert: Данные, полученные при запросе конфигурации правил оповещений, соответствуют условиям срабатывания и вызвали оповещение.

    • Pending: Мониторинговые данные, полученные при запросе конфигурации правил оповещений, больше или равны пороговому значению оповещения в условиях срабатывания, но длительность ещё не достигла условий срабатывания, что представляет собой критическое состояние перед вызовом оповещения. Например: если условие срабатывания правила оповещения — использование CPU превышает 80% и длится 3 минуты, когда система впервые обнаружит, что CPU превышает 80%, правило будет помечено как Pending. Оценка будет продолжаться, и если использование CPU останется выше 80% в течение 3 минут, статус правила изменится на Alert; если при последующей оценке использование CPU упадёт ниже 80%, статус правила вернётся в Normal.

    • Normal: Данные, полученные при запросе конфигурации правил оповещений, не достигают порогового значения оповещения.

  • Статус тишины

    • Silent Pending: Статус перед началом периода тишины после его установки. В этом статусе при срабатывании правил стратегии оповещения уведомления отправляются как обычно.

    • Silent: Статус с начала до окончания периода тишины. В этом статусе при срабатывании правил стратегии оповещения уведомления не отправляются.

Оповещения в реальном времени

Платформа отображает количество ресурсов, находящихся в состоянии оповещения, и подробную информацию об оповещениях через оповещения в реальном времени, позволяя операционному персоналу и администраторам в режиме реального времени отслеживать общую ситуацию с оповещениями бизнеса на платформе, своевременно выявлять и устранять неисправности для обеспечения нормальной работы платформы.

История оповещений

Для помощи операционному персоналу и администраторам в анализе последних состояний мониторинговых оповещений и отслеживании исторических проблем платформа поддерживает просмотр исторических записей оповещений за определённый период времени. Доступная для просмотра историческая информация включает время возникновения, правила оповещений, неисправные ресурсы, методы уведомления, статус и получателей уведомлений и др.

Примечание: Время хранения истории оповещений совпадает со временем хранения событий и может быть обновлено в разделе Administrator путём изменения параметров конфигурации компонента хранения логов.