Система объектного хранения оснащена встроенными возможностями мониторинга и оповещений, охватывающими кластеры хранения, состояние сервисов и использование ресурсов. Также поддерживаются настраиваемые политики уведомлений для информирования вашей операционной команды. Информация в режиме реального времени помогает оптимизировать производительность и принимать операционные решения, а автоматические оповещения обеспечивают стабильность и надежность системы хранения.
По умолчанию платформа собирает ключевые метрики по кластерам хранения и состоянию сервисов. Вы можете получить доступ к данным мониторинга в реальном времени в разделе Storage Management > Object Storage > Monitoring.
Этот раздел предоставляет общий обзор состояния системы хранения, статуса сервисов и использования сырой емкости. Если статус хранилища аномален, детали оповещения укажут на первопричину, что поможет эффективно диагностировать и устранять проблемы.
Отслеживайте использование сырой емкости и тенденции производительности ввода-вывода по всему кластеру хранения. Это помогает выявлять узкие места, оптимизировать распределение ресурсов и обеспечивать бесперебойную работу с данными.
Контролируйте шаблоны доступа, включая общее количество запросов и количество неудачных запросов. Эти данные помогают анализировать нагрузку на хранилище и обнаруживать аномалии, которые могут указывать на сбои сервисов или риски безопасности.
Платформа поставляется с преднастроенными политиками оповещений для обнаружения аномалий и отправки уведомлений при достижении заданных порогов. Встроенные правила охватывают ключевые области, такие как состояние компонентов, использование емкости и целостность пользовательских данных.
Для своевременного реагирования настройте политики уведомлений в Operations Center. Оповещения могут отправляться по электронной почте, SMS или другим каналам, чтобы информировать ответственных сотрудников. Тонко настройте параметры в соответствии с процессом реагирования вашей организации.
Платформа классифицирует оповещения по уровням серьезности, что помогает командам приоритизировать реагирование на инциденты:
Уровень серьезности | Описание |
---|---|
Critical | Сбой системы, влияющий на бизнес-процессы или приводящий к потере данных. Требуется немедленное действие. |
Major | Известная проблема, которая может привести к сбоям в функциональности и нарушению бизнес-процессов. |
Warning | Потенциальный риск, который при отсутствии реакции может повлиять на производительность или доступность. |
Журнал Alert History содержит все прошлые инциденты, предоставляя ценные данные для анализа и улучшения системы. При рассмотрении прошлых оповещений учитывайте следующее:
Постоянный анализ шаблонов оповещений и совершенствование стратегий мониторинга позволяет повысить устойчивость системы, минимизировать время простоя и обеспечить бесперебойную работу хранилища.