• Русский
  • Мониторинг парка

    Обзор

    Fleet Monitoring предоставляет глобальное представление мониторинга по нескольким кластерам для администраторов платформы. Это помогает понять, какие кластеры подключены, насколько свежие данные мониторинга и есть ли в парке риски по ресурсной емкости или квотам.

    Fleet Monitoring не заменяет мониторинг одного кластера. Используйте Fleet Monitoring для управления на уровне парка, анализа емкости и отслеживания долгосрочных тенденций. Используйте мониторинг одного кластера, когда требуется детальное устранение неполадок для конкретного кластера, namespace, workload или metric.

    Предварительные требования

    Перед использованием Fleet Monitoring убедитесь, что выполнены следующие требования:

    • На Global cluster установлен Alauda Container Platform Fleet Monitoring Central Service.
    • В Global cluster существует ресурс FleetMonitoringHub.
    • На каждом кластере, который вы хотите включить в Fleet Monitoring, установлен Alauda Container Platform Fleet Monitoring Cluster Service.
    • На каждом кластере, который вы хотите включить, существует ресурс FleetMonitoringAgent.
    • Подключенные кластеры управляются Global cluster и для них включена функция Monitoring.
    • У вас есть разрешение на просмотр страницы Fleet Monitoring и данных мониторинга.

    Сведения о шагах включения см. в Configure Fleet Monitoring.

    Доступ к Fleet Monitoring

    Чтобы открыть Fleet Monitoring, перейдите в Platform > Observe > Fleet Monitoring.

    На странице отображается стандартная панель Fleet Monitoring. Используйте Switch, чтобы переключаться между встроенными и пользовательскими панелями Fleet Monitoring.

    В первой версии страницы Fleet Monitoring не предусмотрены действия Create, Import или редактирование панелей. Чтобы добавить пользовательскую панель Fleet Monitoring, используйте существующий рабочий процесс ресурса Monitoring Dashboard. Дополнительные сведения см. в Добавление пользовательских панелей Fleet Monitoring.

    Встроенные дашборды

    Fleet Monitoring включает предустановленные дашборды для мониторинга на уровне парка.

    Обзор Fleet Monitoring

    Панель Fleet Monitoring Overview — это дашборд по умолчанию из набора предустановленных. Она помогает ответить на следующие вопросы:

    • Какие кластеры подключены к Fleet Monitoring?
    • Сколько в парке узлов, pod, проектов, ядер CPU и ресурсов памяти?
    • Каковы текущие уровни использования и запроса CPU и памяти во всем парке?
    • На каких узлах выше использование CPU или памяти?
    • Каковы тенденции утилизации CPU и памяти на уровне парка?

    Используйте этот дашборд для ежедневной проверки состояния парка, анализа емкости и быстрого выявления кластеров, которые требуют внимания.

    Дашборд содержит следующую информацию:

    ОбластьОписание
    Инвентаризация паркаКоличество кластеров, количество узлов, количество pod, количество проектов, общий объем CPU, общий объем памяти, количество устаревших сборов и количество активных предупреждений.
    Использование паркаКоэффициент использования CPU, коэффициент запроса CPU, коэффициент использования памяти и коэффициент запроса памяти.
    Рейтинг узловУзлы с наибольшим использованием CPU и памяти среди подключенных кластеров.
    Тенденции использованияТренд использования CPU и тренд использования памяти.
    Сведения о кластерахСведения о ресурсах и использовании на уровне кластера.

    Квота проектов Fleet Monitoring

    Панель Fleet Monitoring Project Quota — это предустановленный дашборд, который помогает понять распределение и использование проектных квот между подключенными кластерами.

    Используйте этот дашборд, чтобы проверить распределение проектных квот и выявить проекты с рисками по выделению или использованию квот.

    Дашборд содержит следующую информацию:

    ОбластьОписание
    Определения и порогиОпределения quota, allocated, used и usage ratio, а также значения порогов для нормального, высокого и близкого к пределу использования.
    Обзор использования квотКоличество проектов, количество объектов квот, количество объектов с высоким использованием, коэффициенты использования CPU и памяти, итоги квот, выделенные объемы и использованные объемы.
    Распределение квотРаспределение квот CPU и памяти между невыделенными, выделенными, но неиспользуемыми и занятыми ресурсами.
    Рейтинг использования квотПроекты с наибольшим использованием квот CPU и квот памяти.
    Сведения о квотах проектовСведения о распределении, использовании и рисках квот на уровне проекта.

    Фильтрация данных

    Панели Fleet Monitoring предоставляют переменные, которые помогают сузить представление до определенного набора кластеров или проектов.

    ПеременнаяОписание
    Cluster Label KeyВыбирает ключ метки кластера, используемый для фильтрации.
    Cluster Label ValueВыбирает значение для выбранного ключа метки кластера.
    ClusterВыбирает один или несколько кластеров. Этот список можно сузить с помощью переменных меток кластера.
    ProjectВыбирает один или несколько проектов. Эта переменная доступна на панели квот проектов.
    Quota Resource TypeПереключает между limits и requests. Эта переменная доступна на панели квот проектов.
    Временной диапазонУправляет временным диапазоном запроса панели.

    Переменная Cluster может перечислять все известные кластеры. Метрика Connected Clusters учитывает только те кластеры, которые фактически записывают данные Fleet Monitoring. Поэтому список кластеров и число подключенных кластеров могут различаться.

    Добавление пользовательских панелей Fleet Monitoring

    Вы можете добавить пользовательские мультикластерные панели в Fleet Monitoring, используя существующий рабочий процесс ресурса Monitoring Dashboard.

    Используйте один из следующих способов:

    • На существующей странице Dashboard создайте дашборд в Global cluster и добавьте тег fleet-monitoring, используя действия страницы.
    • Отправьте ресурс MonitorDashboard YAML в namespace, где в Global cluster установлен Alauda Container Platform Fleet Monitoring Central Service. Убедитесь, что у ресурса есть метка cpaas.io/dashboard.tag.fleet-monitoring: "true". Эта метка добавляет к дашборду тег fleet-monitoring.

    Пример:

    apiVersion: ait.alauda.io/v1alpha2
    kind: MonitorDashboard
    metadata:
      name: my-fleet-dashboard
      namespace: <fleet-monitoring-namespace>
      labels:
        cpaas.io/dashboard.folder: fleet
        cpaas.io/dashboard.tag.fleet-monitoring: "true"
        cpaas.io/dashboard.tag.multi-cluster: "true"
        cpaas.io/published: "true"
    spec:
      body: {}

    Замените <fleet-monitoring-namespace> на namespace, в котором установлен Alauda Container Platform Fleet Monitoring Central Service.

    Система не проверяет, использует ли пользовательский дашборд метрики Fleet Monitoring. Автор дашборда должен убедиться, что дашборд использует источники данных, метрики и переменные, которые работают в контексте Fleet Monitoring.

    Для мультикластерных дашбордов используйте метку cluster, чтобы идентифицировать исходный кластер. Если исходная метрика уже имеет метку cluster, Fleet Monitoring сохраняет исходное значение как exported_cluster.

    В текущем пути запросов платформы запросы к дашборду Fleet Monitoring должны явно включать vmcluster=~".*" при прямом запросе метрик Fleet. Без этого селектора proxy мониторинговых запросов может сузить запрос до backend мониторинга Global и вернуть данные метрик Fleet для подключенных кластеров отсутствующими.

    Примеры:

    avg_over_time(fleet:node:node_load15:avg{vmcluster=~".*",cluster="g1-c1"}[1h])
    last_over_time(fleet:node:node_load15:avg:avg_over_time_1h{vmcluster=~".*",cluster="g1-c1"}[2h])

    Ограничения

    В первой версии Fleet Monitoring существуют следующие ограничения:

    • Fleet Monitoring не предоставляет отдельную страницу оповещений для нескольких кластеров.
    • Данные Fleet Monitoring могут использоваться существующим механизмом оповещений, но правила оповещений по-прежнему управляются через существующие рабочие процессы оповещений.
    • Fleet Monitoring не предоставляет страницу самообслуживания для обычных пользователей для настройки собираемых метрик или правил записи.
    • Fleet Monitoring не выполняет заполнение исторических данных. Данные собираются только после включения Fleet Monitoring.
    • Fleet Monitoring не предназначен для устранения неполадок на уровне секунды. Для детального устранения неполадок используйте мониторинг одного кластера.