Мониторинг и оповещения

Система объектного хранения оснащена встроенными возможностями мониторинга и оповещений, охватывающими кластеры хранения, состояние сервисов и использование ресурсов. Также поддерживаются настраиваемые политики уведомлений для информирования вашей операционной команды. Информация в режиме реального времени помогает оптимизировать производительность и принимать операционные решения, а автоматические оповещения обеспечивают стабильность и надежность системы хранения.

Содержание

Мониторинг

По умолчанию платформа собирает ключевые метрики по кластерам хранения и состоянию сервисов. Вы можете получить доступ к данным мониторинга в реальном времени в разделе Storage Management > Object Storage > Monitoring.

Обзор хранилища

Этот раздел предоставляет общий обзор состояния системы хранения, статуса сервисов и использования сырой емкости. Если статус хранилища аномален, детали оповещения укажут на первопричину, что поможет эффективно диагностировать и устранять проблемы.

Мониторинг кластера

Отслеживайте использование сырой емкости и тенденции производительности ввода-вывода по всему кластеру хранения. Это помогает выявлять узкие места, оптимизировать распределение ресурсов и обеспечивать бесперебойную работу с данными.

Мониторинг объектов

Контролируйте шаблоны доступа, включая общее количество запросов и количество неудачных запросов. Эти данные помогают анализировать нагрузку на хранилище и обнаруживать аномалии, которые могут указывать на сбои сервисов или риски безопасности.

Оповещения

Платформа поставляется с преднастроенными политиками оповещений для обнаружения аномалий и отправки уведомлений при достижении заданных порогов. Встроенные правила охватывают ключевые области, такие как состояние компонентов, использование емкости и целостность пользовательских данных.

Настройка уведомлений

Для своевременного реагирования настройте политики уведомлений в Operations Center. Оповещения могут отправляться по электронной почте, SMS или другим каналам, чтобы информировать ответственных сотрудников. Тонко настройте параметры в соответствии с процессом реагирования вашей организации.

Обработка оповещений

  • Кластер в состоянии "Alert": Сработало предупреждение, и стабильность системы может быть под угрозой. Проверьте раздел Live Alerts для получения подробностей, определите первопричину и примите корректирующие меры.
  • Кластер в состоянии "Failure": Кластер хранения перестал работать. Требуется немедленное вмешательство для восстановления доступности сервиса.

Платформа классифицирует оповещения по уровням серьезности, что помогает командам приоритизировать реагирование на инциденты:

Уровень серьезностиОписание
CriticalСбой системы, влияющий на бизнес-процессы или приводящий к потере данных. Требуется немедленное действие.
MajorИзвестная проблема, которая может привести к сбоям в функциональности и нарушению бизнес-процессов.
WarningПотенциальный риск, который при отсутствии реакции может повлиять на производительность или доступность.

Анализ после инцидента

Журнал Alert History содержит все прошлые инциденты, предоставляя ценные данные для анализа и улучшения системы. При рассмотрении прошлых оповещений учитывайте следующее:

  1. Каковы были точные симптомы во время инцидента?
  2. Повторяются ли определённые оповещения со временем? Можно ли принять превентивные меры для предотвращения повторения?
  3. Был ли зафиксирован всплеск оповещений в определённый период? Был ли он вызван операционной проблемой или внешним фактором? Следует ли скорректировать стратегию реагирования?

Постоянный анализ шаблонов оповещений и совершенствование стратегий мониторинга позволяет повысить устойчивость системы, минимизировать время простоя и обеспечить бесперебойную работу хранилища.