Компонент мониторинга служит инфраструктурой для функций мониторинга, оповещений, инспекции и проверки состояния в модуле наблюдаемости. В этом документе описывается, как установить ACP Monitoring с плагином Prometheus или ACP Monitoring с плагином VictoriaMetrics в кластере.
Перед установкой компонентов мониторинга убедитесь, что выполнены следующие условия:
global может получить доступ к порту 11780 рабочего кластера.Перейдите в App Store Management > Cluster Plugins и выберите целевой кластер.
Найдите плагин ACP Monitoring with Prometheus и нажмите Install.
Настройте следующие параметры:
| Parameter | Description |
|---|---|
| Scale Configuration | Поддерживает три конфигурации: Small Scale, Medium Scale и Large Scale: - Значения по умолчанию установлены на основе рекомендуемых значений нагрузочного тестирования платформы - Можно выбрать или настроить квоты в зависимости от фактического масштаба кластера - Значения по умолчанию будут обновляться с версиями платформы; для фиксированных конфигураций рекомендуется использовать пользовательские настройки |
| Storage Type | - LocalVolume: Локальное хранилище с данными, сохранёнными на указанных узлах - StorageClass: Автоматически создаёт постоянные тома с помощью класса хранилища - PV: Использует существующие постоянные тома Примечание: Конфигурация хранилища не может быть изменена после установки |
| Replica Count | Устанавливает количество подов компонента мониторинга Примечание: Prometheus поддерживает только установку на одном узле |
| Parameter Configuration | Параметры данных для компонента мониторинга могут быть отрегулированы по необходимости |
Нажмите Install для завершения установки.
После завершения установки компоненты доступны по следующим адресам (замените <> на актуальные значения):
| Component | Access Address |
|---|---|
| Thanos | <platform_access_address>/clusters/<cluster>/prometheus |
| Prometheus | <platform_access_address>/clusters/<cluster>/prometheus-0 |
| Alertmanager | <platform_access_address>/clusters/<cluster>/alertmanager |
Убедитесь, что плагин опубликован, проверив наличие ресурсов ModulePlugin и ModuleConfig в кластере global:
Это означает, что ModulePlugin prometheus существует в кластере и версия v4.1.0 опубликована.
Создайте ресурс ModuleInfo для установки плагина без параметров конфигурации:
Пример настройки ресурсов, например для prometheus:
Для подробностей см. Планирование ёмкости компонентов мониторинга
Справка по полям YAML (VictoriaMetrics):
| Field path | Description |
|---|---|
metadata.labels.cpaas.io/cluster-name | Имя целевого кластера, в котором установлен плагин. |
metadata.labels.cpaas.io/module-name | Должно быть victoriametrics. |
metadata.labels.cpaas.io/module-type | Должно быть plugin. |
metadata.name | Имя ModuleInfo (например, <cluster>-victoriametrics). |
spec.version | Версия плагина для установки. |
spec.config.storage.type | Тип хранилища: LocalVolume, StorageClass или PV. |
spec.config.storage.capacity | Размер хранилища для VictoriaMetrics (Gi). Рекомендуется минимум 30 Gi. |
spec.config.storage.nodes | Список узлов при storage.type=LocalVolume. Поддерживается до 1 узла. |
spec.config.storage.path | Путь LocalVolume при storage.type=LocalVolume. |
spec.config.storage.storageClass | Имя StorageClass при storage.type=StorageClass. |
spec.config.storage.pvSelectorK | Ключ селектора PV при storage.type=PV. |
spec.config.storage.pvSelectorV | Значение селектора PV при storage.type=PV. |
spec.replicas | Количество реплик; LV не поддерживает множественные реплики. |
spec.config.components.vmstorage.retention | Количество дней хранения данных для vmstorage. |
spec.config.components.vmagent.scrapeInterval | Интервал сбора в секундах; применяется к ServiceMonitors без interval. |
spec.config.components.vmagent.scrapeTimeout | Таймаут сбора в секундах; должен быть меньше scrapeInterval. |
spec.config.components.vmstorage.resources | Настройки ресурсов для vmstorage. |
spec.config.components.nodeExporter.port | Порт Node Exporter (по умолчанию 9100). |
spec.config.components.nodeExporter.resources | Настройки ресурсов для Node Exporter. |
spec.config.components.alertmanager.resources | Настройки ресурсов для Alertmanager. |
spec.config.components.kubeStateExporter.resources | Настройки ресурсов для Kube State Exporter. |
spec.config.components.prometheusAdapter.resources | Настройки ресурсов для Prometheus Adapter (используется для HPA/кастомных метрик). |
spec.config.components.vmagent.resources | Настройки ресурсов для vmagent. |
spec.config.size | Масштаб мониторинга: Small, Medium или Large. |
Так как имя ModuleInfo изменяется при создании, найдите ресурс по метке для проверки статуса плагина и версии:
Объяснение полей:
NAME: имя ресурса ModuleInfoCLUSTER: кластер, в котором установлен плагинMODULE: имя плагинаDISPLAY_NAME: отображаемое имя плагинаSTATUS: статус установки; Running означает успешную установку и работуTARGET_VERSION: версия, предназначенная для установкиCURRENT_VERSION: версия до установкиNEW_VERSION: последняя доступная версия для установкиПерейдите в App Store Management > Cluster Plugins и выберите целевой кластер.
Найдите плагин ACP Monitoring with VictoriaMetrics и нажмите Install.
Настройте следующие параметры:
| Parameter | Description |
|---|---|
| Scale Configuration | Поддерживает три конфигурации: Small Scale, Medium Scale и Large Scale: - Значения по умолчанию установлены на основе рекомендуемых значений нагрузочного тестирования платформы - Можно выбрать или настроить квоты в зависимости от фактического масштаба кластера - Значения по умолчанию будут обновляться с версиями платформы; для фиксированных конфигураций рекомендуется использовать пользовательские настройки |
| Install Agent Only | - Off: Устанавливает полный набор компонентов VictoriaMetrics - On: Устанавливает только компонент сбора VMAgent, который зависит от VictoriaMetrics Center |
| VictoriaMetrics Center | Выберите кластер, в котором установлен полный набор компонентов VictoriaMetrics |
| Storage Type | - LocalVolume: Локальное хранилище с данными, сохранёнными на указанных узлах - StorageClass: Автоматически создаёт постоянные тома с помощью класса хранилища - PV: Использует существующие постоянные тома |
| Replica Count | Устанавливает количество подов компонента мониторинга: - Тип хранилища LocalVolume не поддерживает множественные реплики - Для других типов хранилища следуйте подсказкам на экране для настройки |
| Parameter Configuration | Параметры данных для компонента мониторинга могут быть отрегулированы Примечание: Данные могут временно превышать период хранения перед удалением |
Нажмите Install для завершения установки.
Убедитесь, что плагин опубликован, проверив наличие ресурсов ModulePlugin и ModuleConfig в кластере global:
Это означает, что ModulePlugin victoriametrics существует в кластере и версия v4.1.0 опубликована.
Создайте ресурс ModuleInfo для установки плагина без параметров конфигурации:
Пример настройки ресурсов, например для prometheus:
Для подробностей см. Планирование ёмкости компонентов мониторинга
Справка по полям YAML (Prometheus):
| Field path | Description |
|---|---|
metadata.labels.cpaas.io/cluster-name | Имя целевого кластера, в котором установлен плагин. |
metadata.labels.cpaas.io/module-name | Должно быть prometheus. |
metadata.labels.cpaas.io/module-type | Должно быть plugin. |
metadata.name | Имя ModuleInfo (например, <cluster>-prometheus). |
spec.version | Версия плагина для установки. |
spec.config.storage.type | Тип хранилища: LocalVolume, StorageClass или PV. |
spec.config.storage.capacity | Размер хранилища для Prometheus (Gi). Рекомендуется минимум 30 Gi. |
spec.config.storage.nodes | Список узлов при storage.type=LocalVolume. Поддерживается до 1 узла. |
spec.config.storage.path | Путь LocalVolume при storage.type=LocalVolume. |
spec.config.storage.storageClass | Имя StorageClass при storage.type=StorageClass. |
spec.config.storage.pvSelectorK | Ключ селектора PV при storage.type=PV. |
spec.config.storage.pvSelectorV | Значение селектора PV при storage.type=PV. |
spec.replicas | Количество реплик; применимо только для типов StorageClass/PV. |
spec.config.components.prometheus.retention | Количество дней хранения данных. |
spec.config.components.prometheus.scrapeInterval | Интервал сбора в секундах; применяется к ServiceMonitors без interval. |
spec.config.components.prometheus.scrapeTimeout | Таймаут сбора в секундах; должен быть меньше scrapeInterval. |
spec.config.components.prometheus.resources | Настройки ресурсов для Prometheus. |
spec.config.components.nodeExporter.port | Порт Node Exporter (по умолчанию 9100). |
spec.config.components.nodeExporter.resources | Настройки ресурсов для Node Exporter. |
spec.config.components.alertmanager.resources | Настройки ресурсов для Alertmanager. |
spec.config.components.kubeStateExporter.resources | Настройки ресурсов для Kube State Exporter. |
spec.config.components.prometheusAdapter.resources | Настройки ресурсов для Prometheus Adapter. |
spec.config.components.thanosQuery.resources | Настройки ресурсов для Thanos Query. |
spec.config.size | Масштаб мониторинга: Small, Medium или Large. |
Так как имя ModuleInfo изменяется при создании, найдите ресурс по метке для проверки статуса плагина и версии:
Объяснение полей:
NAME: имя ресурса ModuleInfoCLUSTER: кластер, в котором установлен плагинMODULE: имя плагинаDISPLAY_NAME: отображаемое имя плагинаSTATUS: статус установки; Running означает успешную установку и работуTARGET_VERSION: версия, предназначенная для установкиCURRENT_VERSION: версия до установкиNEW_VERSION: последняя доступная версия для установки