Русский

Планирование ёмкости компонента мониторинга

Компонент мониторинга отвечает за хранение данных метрик, собранных с одного или нескольких кластеров на платформе. Поэтому необходимо заранее оценить масштаб вашего мониторинга и спланировать ресурсы, необходимые для компонента мониторинга, согласно рекомендациям в этом документе.

Содержание

Предположения и методология

Данные в этом документе получены из контролируемых лабораторных отчетов по производительности и предназначены в качестве базового ориентира для планирования в продакшене.
В примерах для дискового пространства задан срок хранения 7 дней; для других сроков хранения корректируйте пропорционально.
Базовые параметры хранения соответствуют приведённому выше предупреждению (SSD, ~6000 IOPS, ~250MB/s чтение/запись, отдельный монтируемый том).
Тестовые нагрузки охватывали типичные страницы мониторинга, такие как "acp ns overview page" и "platform region detail page".

Prometheus

Ниже приведены рекомендации по размеру для Prometheus и связанных компонентов (Thanos Query, Thanos Sidecar и др.) в зависимости от масштаба.

Малый масштаб — 10 воркер-нод, 500 подов с двумя контейнерами

Скорость приёма метрик: ~2800 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	2C	4Gi	-	-
kube-prometheus-thanos-query	thanos-query	1	1C	1Gi	-	-
prometheus-kube-prometheus-0	prometheus	1	2C	8Gi	20G	~10G записи за 7 дней

Средний масштаб — 50 воркер-нод, 2000 подов с двумя контейнерами

Скорость приёма метрик: ~7294 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	4C	4Gi	-	-
kube-prometheus-thanos-query	thanos-query	1	2.5C	8Gi	-	-
prometheus-kube-prometheus-0	prometheus	1	4C	8Gi	40G	~30G записи за 7 дней

Большой масштаб — 500 воркер-нод, 10000 подов с двумя контейнерами

Скорость приёма метрик: ~41575 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	6C	4Gi	-	-
kube-prometheus-thanos-query	thanos-query	1	2C	6Gi	-	В реальных развертываниях может использоваться 2 реплики
prometheus-kube-prometheus-0	prometheus	1	8C	20Gi	100G	Пиковая память ~15Gi; ~69G записи за 7 дней

VictoriaMetrics

Ниже приведены рекомендации по размеру для компонентов VictoriaMetrics в зависимости от масштаба.

Малый масштаб — 10 воркер-нод, 500 подов с двумя контейнерами

Скорость приёма метрик: ~3274 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	1	2C	4Gi	-	-
vmselect-cluster	proxy	1	1C	200Mi	-	-
vmselect	vmselect	1	500m	1Gi	-	-
vmstorage-cluster	vmstorage	1	500m	2Gi	3G	~1.5G записи за 7 дней

Средний масштаб — 50 воркер-нод, 2000 подов с двумя контейнерами

Скорость приёма метрик: ~6940 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	4C	4Gi	-	-
vmselect-cluster	proxy	1	1C	200Mi	-	-
vmselect	vmselect	1	2C	2Gi	-	-
vmstorage-cluster	vmstorage	1	2C	2Gi	10G	~2.6G записи за 7 дней

Большой масштаб — 500 воркер-нод, 10000 подов с двумя контейнерами

Скорость приёма метрик: ~34300 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	6C	4Gi	-	-
vmselect-cluster	proxy	1	2C	200Mi	-	-
vmselect	vmselect	1	5C	3Gi	-	-
vmstorage-cluster	vmstorage	1	2C	6Gi	30G	~16.8G записи за 7 дней

Просмотреть полную документацию в формате PDF

Планирование ёмкости компонента мониторинга

Содержание

Предположения и методология

Данные в этом документе получены из контролируемых лабораторных отчетов по производительности и предназначены в качестве базового ориентира для планирования в продакшене.
В примерах для дискового пространства задан срок хранения 7 дней; для других сроков хранения корректируйте пропорционально.
Базовые параметры хранения соответствуют приведённому выше предупреждению (SSD, ~6000 IOPS, ~250MB/s чтение/запись, отдельный монтируемый том).
Тестовые нагрузки охватывали типичные страницы мониторинга, такие как "acp ns overview page" и "platform region detail page".

Prometheus

Малый масштаб — 10 воркер-нод, 500 подов с двумя контейнерами

Скорость приёма метрик: ~2800 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	2C	4Gi	-	-
kube-prometheus-thanos-query	thanos-query	1	1C	1Gi	-	-
prometheus-kube-prometheus-0	prometheus	1	2C	8Gi	20G	~10G записи за 7 дней

Средний масштаб — 50 воркер-нод, 2000 подов с двумя контейнерами

Скорость приёма метрик: ~7294 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	4C	4Gi	-	-
kube-prometheus-thanos-query	thanos-query	1	2.5C	8Gi	-	-
prometheus-kube-prometheus-0	prometheus	1	4C	8Gi	40G	~30G записи за 7 дней

Большой масштаб — 500 воркер-нод, 10000 подов с двумя контейнерами

Скорость приёма метрик: ~41575 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	6C	4Gi	-	-
kube-prometheus-thanos-query	thanos-query	1	2C	6Gi	-	В реальных развертываниях может использоваться 2 реплики
prometheus-kube-prometheus-0	prometheus	1	8C	20Gi	100G	Пиковая память ~15Gi; ~69G записи за 7 дней

VictoriaMetrics

Ниже приведены рекомендации по размеру для компонентов VictoriaMetrics в зависимости от масштаба.

Малый масштаб — 10 воркер-нод, 500 подов с двумя контейнерами

Скорость приёма метрик: ~3274 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	1	2C	4Gi	-	-
vmselect-cluster	proxy	1	1C	200Mi	-	-
vmselect	vmselect	1	500m	1Gi	-	-
vmstorage-cluster	vmstorage	1	500m	2Gi	3G	~1.5G записи за 7 дней

Средний масштаб — 50 воркер-нод, 2000 подов с двумя контейнерами

Скорость приёма метрик: ~6940 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	4C	4Gi	-	-
vmselect-cluster	proxy	1	1C	200Mi	-	-
vmselect	vmselect	1	2C	2Gi	-	-
vmstorage-cluster	vmstorage	1	2C	2Gi	10G	~2.6G записи за 7 дней

Большой масштаб — 500 воркер-нод, 10000 подов с двумя контейнерами

Скорость приёма метрик: ~34300 сэмплов/секунду

Компонент	Контейнер	Реплики	Лимит CPU	Лимит памяти	Диск (если применимо)	Примечания
courier-api	courier	2	6C	4Gi	-	-
vmselect-cluster	proxy	1	2C	200Mi	-	-
vmselect	vmselect	1	5C	3Gi	-	-
vmstorage-cluster	vmstorage	1	2C	6Gi	30G	~16.8G записи за 7 дней

ACP CLI (ac)

Управление узлами

Управляемые кластеры

Импорт кластеров

Инициализация кластера в публичном облаке

Инициализация сети

Инициализация хранилища

Как сделать

Как сделать

Управление резервным копированием

Управление восстановлением

Архитектура

Основные понятия

Руководства

Как сделать

ALB

Устранение неполадок

Основные понятия

Руководства

Как сделать

Устранение неполадок

Установка

Основные понятия

Руководства

Как сделать

Восстановление после сбоев

Основные понятия

Руководства

Как сделать

Руководства

Как сделать

Соответствие требованиям

Как сделать

API Refiner

Пользователь

Руководства

Группа

Руководства

Роль

Руководства

IDP

Руководства

Устранение неполадок

Политика пользователя

Руководства

Обзор

Образы

Руководства

Как сделать

Виртуальная машина

Руководства

Как сделать

Устранение неполадок

Сеть

Руководства

Как сделать

Хранение данных

Руководства

Резервное копирование и восстановление

Руководства

Основные понятия

Пространства имён

Создание приложений

Эксплуатация и сопровождение приложений

Развертывание приложений

KEDA (Kubernetes Event-driven Autoscaling)

Как сделать

Рабочие нагрузки

Конфигурации

Наблюдаемость приложения

Как сделать

Как сделать

Установка

Руководство пользователя

Обзор

Установка

Обновление

Руководства

Как сделать

Основные понятия