Компонент мониторинга служит инфраструктурой для функций мониторинга, оповещений, инспекции и проверки состояния в модуле наблюдаемости. В этом документе описывается, как установить ACP Monitoring с плагином Prometheus или ACP Monitoring с плагином VictoriaMetrics в кластере.
Перед установкой компонентов мониторинга убедитесь, что выполнены следующие условия:
global
может получить доступ к порту 11780 рабочего кластера.Перейдите в App Store Management > Cluster Plugins и выберите целевой кластер.
Найдите плагин ACP Monitoring with Prometheus и нажмите Install.
Настройте следующие параметры:
Parameter | Description |
---|---|
Scale Configuration | Поддерживает три конфигурации: Small Scale, Medium Scale и Large Scale: - Значения по умолчанию установлены на основе рекомендуемых значений нагрузочного тестирования платформы - Можно выбрать или настроить квоты в зависимости от фактического масштаба кластера - Значения по умолчанию будут обновляться с версиями платформы; для фиксированных конфигураций рекомендуется использовать пользовательские настройки |
Storage Type | - LocalVolume: Локальное хранилище с данными, сохранёнными на указанных узлах - StorageClass: Автоматически создаёт постоянные тома с помощью класса хранилища - PV: Использует существующие постоянные тома Примечание: Конфигурация хранилища не может быть изменена после установки |
Replica Count | Устанавливает количество подов компонента мониторинга Примечание: Prometheus поддерживает только установку на одном узле |
Parameter Configuration | Параметры данных для компонента мониторинга могут быть отрегулированы по необходимости |
Нажмите Install для завершения установки.
После завершения установки компоненты доступны по следующим адресам (замените <>
на актуальные значения):
Component | Access Address |
---|---|
Thanos | <platform_access_address>/clusters/<cluster>/prometheus |
Prometheus | <platform_access_address>/clusters/<cluster>/prometheus-0 |
Alertmanager | <platform_access_address>/clusters/<cluster>/alertmanager |
Убедитесь, что плагин опубликован, проверив наличие ресурсов ModulePlugin и ModuleConfig в кластере global
:
Это означает, что ModulePlugin prometheus
существует в кластере и версия v4.1.0
опубликована.
Создайте ресурс ModuleInfo для установки плагина без параметров конфигурации:
Пример настройки ресурсов, например для prometheus:
Для подробностей см. Планирование ёмкости компонентов мониторинга
Справка по полям YAML (VictoriaMetrics):
Field path | Description |
---|---|
metadata.labels.cpaas.io/cluster-name | Имя целевого кластера, в котором установлен плагин. |
metadata.labels.cpaas.io/module-name | Должно быть victoriametrics . |
metadata.labels.cpaas.io/module-type | Должно быть plugin . |
metadata.name | Имя ModuleInfo (например, <cluster>-victoriametrics ). |
spec.version | Версия плагина для установки. |
spec.config.storage.type | Тип хранилища: LocalVolume , StorageClass или PV . |
spec.config.storage.capacity | Размер хранилища для VictoriaMetrics (Gi). Рекомендуется минимум 30 Gi. |
spec.config.storage.nodes | Список узлов при storage.type=LocalVolume . Поддерживается до 1 узла. |
spec.config.storage.path | Путь LocalVolume при storage.type=LocalVolume . |
spec.config.storage.storageClass | Имя StorageClass при storage.type=StorageClass . |
spec.config.storage.pvSelectorK | Ключ селектора PV при storage.type=PV . |
spec.config.storage.pvSelectorV | Значение селектора PV при storage.type=PV . |
spec.replicas | Количество реплик; LV не поддерживает множественные реплики. |
spec.config.components.vmstorage.retention | Количество дней хранения данных для vmstorage. |
spec.config.components.vmagent.scrapeInterval | Интервал сбора в секундах; применяется к ServiceMonitors без interval . |
spec.config.components.vmagent.scrapeTimeout | Таймаут сбора в секундах; должен быть меньше scrapeInterval . |
spec.config.components.vmstorage.resources | Настройки ресурсов для vmstorage. |
spec.config.components.nodeExporter.port | Порт Node Exporter (по умолчанию 9100). |
spec.config.components.nodeExporter.resources | Настройки ресурсов для Node Exporter. |
spec.config.components.alertmanager.resources | Настройки ресурсов для Alertmanager. |
spec.config.components.kubeStateExporter.resources | Настройки ресурсов для Kube State Exporter. |
spec.config.components.prometheusAdapter.resources | Настройки ресурсов для Prometheus Adapter (используется для HPA/кастомных метрик). |
spec.config.components.vmagent.resources | Настройки ресурсов для vmagent. |
spec.config.size | Масштаб мониторинга: Small , Medium или Large . |
Так как имя ModuleInfo изменяется при создании, найдите ресурс по метке для проверки статуса плагина и версии:
Объяснение полей:
NAME
: имя ресурса ModuleInfoCLUSTER
: кластер, в котором установлен плагинMODULE
: имя плагинаDISPLAY_NAME
: отображаемое имя плагинаSTATUS
: статус установки; Running
означает успешную установку и работуTARGET_VERSION
: версия, предназначенная для установкиCURRENT_VERSION
: версия до установкиNEW_VERSION
: последняя доступная версия для установкиПерейдите в App Store Management > Cluster Plugins и выберите целевой кластер.
Найдите плагин ACP Monitoring with VictoriaMetrics и нажмите Install.
Настройте следующие параметры:
Parameter | Description |
---|---|
Scale Configuration | Поддерживает три конфигурации: Small Scale, Medium Scale и Large Scale: - Значения по умолчанию установлены на основе рекомендуемых значений нагрузочного тестирования платформы - Можно выбрать или настроить квоты в зависимости от фактического масштаба кластера - Значения по умолчанию будут обновляться с версиями платформы; для фиксированных конфигураций рекомендуется использовать пользовательские настройки |
Install Agent Only | - Off: Устанавливает полный набор компонентов VictoriaMetrics - On: Устанавливает только компонент сбора VMAgent, который зависит от VictoriaMetrics Center |
VictoriaMetrics Center | Выберите кластер, в котором установлен полный набор компонентов VictoriaMetrics |
Storage Type | - LocalVolume: Локальное хранилище с данными, сохранёнными на указанных узлах - StorageClass: Автоматически создаёт постоянные тома с помощью класса хранилища - PV: Использует существующие постоянные тома |
Replica Count | Устанавливает количество подов компонента мониторинга: - Тип хранилища LocalVolume не поддерживает множественные реплики - Для других типов хранилища следуйте подсказкам на экране для настройки |
Parameter Configuration | Параметры данных для компонента мониторинга могут быть отрегулированы Примечание: Данные могут временно превышать период хранения перед удалением |
Нажмите Install для завершения установки.
Убедитесь, что плагин опубликован, проверив наличие ресурсов ModulePlugin и ModuleConfig в кластере global
:
Это означает, что ModulePlugin victoriametrics
существует в кластере и версия v4.1.0
опубликована.
Создайте ресурс ModuleInfo для установки плагина без параметров конфигурации:
Пример настройки ресурсов, например для prometheus:
Для подробностей см. Планирование ёмкости компонентов мониторинга
Справка по полям YAML (Prometheus):
Field path | Description |
---|---|
metadata.labels.cpaas.io/cluster-name | Имя целевого кластера, в котором установлен плагин. |
metadata.labels.cpaas.io/module-name | Должно быть prometheus . |
metadata.labels.cpaas.io/module-type | Должно быть plugin . |
metadata.name | Имя ModuleInfo (например, <cluster>-prometheus ). |
spec.version | Версия плагина для установки. |
spec.config.storage.type | Тип хранилища: LocalVolume , StorageClass или PV . |
spec.config.storage.capacity | Размер хранилища для Prometheus (Gi). Рекомендуется минимум 30 Gi. |
spec.config.storage.nodes | Список узлов при storage.type=LocalVolume . Поддерживается до 1 узла. |
spec.config.storage.path | Путь LocalVolume при storage.type=LocalVolume . |
spec.config.storage.storageClass | Имя StorageClass при storage.type=StorageClass . |
spec.config.storage.pvSelectorK | Ключ селектора PV при storage.type=PV . |
spec.config.storage.pvSelectorV | Значение селектора PV при storage.type=PV . |
spec.replicas | Количество реплик; применимо только для типов StorageClass /PV . |
spec.config.components.prometheus.retention | Количество дней хранения данных. |
spec.config.components.prometheus.scrapeInterval | Интервал сбора в секундах; применяется к ServiceMonitors без interval . |
spec.config.components.prometheus.scrapeTimeout | Таймаут сбора в секундах; должен быть меньше scrapeInterval . |
spec.config.components.prometheus.resources | Настройки ресурсов для Prometheus. |
spec.config.components.nodeExporter.port | Порт Node Exporter (по умолчанию 9100). |
spec.config.components.nodeExporter.resources | Настройки ресурсов для Node Exporter. |
spec.config.components.alertmanager.resources | Настройки ресурсов для Alertmanager. |
spec.config.components.kubeStateExporter.resources | Настройки ресурсов для Kube State Exporter. |
spec.config.components.prometheusAdapter.resources | Настройки ресурсов для Prometheus Adapter. |
spec.config.components.thanosQuery.resources | Настройки ресурсов для Thanos Query. |
spec.config.size | Масштаб мониторинга: Small , Medium или Large . |
Так как имя ModuleInfo изменяется при создании, найдите ресурс по метке для проверки статуса плагина и версии:
Объяснение полей:
NAME
: имя ресурса ModuleInfoCLUSTER
: кластер, в котором установлен плагинMODULE
: имя плагинаDISPLAY_NAME
: отображаемое имя плагинаSTATUS
: статус установки; Running
означает успешную установку и работуTARGET_VERSION
: версия, предназначенная для установкиCURRENT_VERSION
: версия до установкиNEW_VERSION
: последняя доступная версия для установки