• Русский
  • Оценка ресурсов для глобального кластера

    Overview

    В этой теме приведены рекомендуемые практики и рекомендации по оценке ресурсов для Multi-Cluster в .

    Правильный подбор размеров узлов обеспечивает эффективное управление глобальным кластером всеми зарегистрированными кластерами, обработку трафика синхронизации и запросов пользователей через API и Web Console без снижения производительности.

    Node Sizing

    Глобальный кластер отвечает за:

    • Поддержание регистрации кластеров и метаданных.
    • Обработку входящих API-запросов от Web Console и CLI.
    • Координацию сообщений синхронизации и heartbeat с управляемыми кластерами.
    • Управление внутренними контроллерами и циклами согласования ресурсов.

    Поскольку глобальный кластер должен обрабатывать как операции управления, так и агрегацию данных со всех подключенных кластеров, распределение ресурсов следует планировать с учётом ожидаемого масштаба и интенсивности нагрузки.

    Baseline Production Sizing

    Размеры для производственной эксплуатации зависят в первую очередь от:

    • Количества управляемых кластеров
    • Частоты циклов синхронизации
    • Одновременной нагрузки API-запросов (от пользователей или автоматизации)
    • Объёма потоковых запросов
    • Количества установленных плагинов

    В следующей таблице приведены эталонные конфигурации, проверенные в ходе внутренних тестов производительности.

    Scale TierУправляемые кластерыКоличество узловCPU на узелПамять на узелПримечания
    Small≤ 1038 ядер16 ГБПодходит для небольших сред
    Medium≤ 50316 ядер32 ГБСтандартная производственная конфигурация
    Large≤ 100324 ядра48 ГБПоддерживает интенсивное использование Web Console и частые циклы синхронизации
    Extra Large≤ 500632 ядра64 ГБТребуется горизонтальное масштабирование и выделенные инфраструктурные узлы
    WARNING

    Эти рекомендации являются общими указаниями. Фактические требования зависят от топологии вашего кластера, одновременного числа пользователей и установленных плагинов.

    Vertical Scaling Guidelines

    При увеличении нагрузки на узел (например, в 2 раза больше кластеров или повышенная одновременная нагрузка пользователей) применяйте следующие корректировки:

    ПараметрРекомендация по масштабированию
    CPU+50% на каждые дополнительные 50 управляемых кластеров
    Память+50% на каждые дополнительные 50 управляемых кластеров

    Horizontal Scaling Guidelines

    При превышении 100 управляемых кластеров или при постоянной задержке API выше 500 мс:

    Добавляйте узлы для распределения обработки запросов и нагрузки контроллеров.

    Resource Validation and Monitoring

    После развертывания непрерывно контролируйте следующие метрики для проверки правильности размеров узлов:

    МетрикаРекомендуемый диапазон
    Использование CPU узла60–75% при пиковых нагрузках
    Использование памяти узла≤80% стабильно
    Задержка API-запросовP90 < 500 мс
    Задержка коммита etcdP99 < 50 мс
    Node CPU utilization
    Node Memory utilization
    API request latency
    etcd commit latency
    100 * (1 - avg by (instance)(rate(node_cpu_seconds_total{mode="idle"}[5m])))
    NOTE

    Если устойчивое использование ресурсов постоянно превышает рекомендуемые пороги, масштабируйте вертикально (добавляйте CPU/память) или горизонтально (добавляйте узлы) до того, как произойдет ухудшение производительности для пользователей.

    Summary

    При подборе размеров глобального кластера:

    1. Начинайте с 3 узлов × 16 ядер × 32 ГБ для средних развертываний (≤50 кластеров).
    2. Масштабируйте вертикально при увеличении одновременной нагрузки или интенсивном использовании Web Console.
    3. Масштабируйте горизонтально при превышении 100 кластеров для поддержания отзывчивости API.
    4. Переоценивайте размеры после каждого значительного увеличения количества управляемых кластеров или частоты синхронизации.

    Следование этим рекомендациям обеспечивает предсказуемую производительность и стабильность работы вашей среды Multi-Cluster по мере её роста.