• Русский
  • Мониторинг узлов

    Просмотр данных мониторинга узла на странице сведений об узле.

    TIP
    • Когда в кластере более 1 узла, вы можете нажать на текущее имя узла в области пути ресурса на странице сведений об узле, чтобы развернуть выпадающий список узлов, затем нажать для выбора узла и быстрого переключения на страницу сведений другого узла.

    • Когда для кластера настроены компоненты мониторинга, вы можете просматривать данные мониторинга узла, включая статус работы ресурсов, использование ресурсов и статистику тенденций ресурсов.

    Содержание

    Процедура

    Процедура

    1. В левой навигационной панели нажмите Clusters > Clusters.

    2. Нажмите на имя кластера, в котором находится целевой узел.

    3. Во вкладке Nodes нажмите на целевое имя узла.

    4. Нажмите на вкладку Monitoring, чтобы перейти на страницу отображения данных мониторинга узла и просмотреть соответствующие данные мониторинга узла.

      TIP
      • Наведите курсор на карточку и нажмите на значок Details, чтобы просмотреть выражения PromQL; нажмите на значок Export, чтобы экспортировать выражения PromQL для всех графиков на текущей странице.

      • Когда в кластере более 1 узла, вы можете нажать на текущее имя узла в области пути ресурса на странице сведений об узле, чтобы развернуть выпадающий список узлов, затем нажать для выбора узла и быстрого переключения на страницу сведений другого узла.

      TIP

      В области отображения статистики пространства хранения, когда у узла более 4 разделов хранения:

      • В круговой диаграмме общего использования разделов отдельно отображаются 3 раздела с наибольшим использованием, а оставшиеся разделы показаны как Others с отображением их общего использования при наведении курсора;

      • В столбчатой диаграмме использования разделов отдельно отображаются 3 раздела с наибольшим использованием, а оставшиеся разделы показаны как Others с отображением их общего использования и индивидуальных показателей при наведении курсора на столбцы.

      Статистика тенденций мониторинга описана в следующей таблице.

      ПараметрОписание
      CPUУровень использования, уровень запросов и уровень лимитов CPU за указанный период времени.

      Уровень использования = использование CPU всеми подами на узле / общий CPU узла.
      Примечание: Если в определённый период наблюдается резкий рост уровня использования CPU узла, необходимо сначала определить процесс, потребляющий наибольшее количество ресурсов CPU. Например, для Java-приложений с пользовательским кодом утечки памяти или бесконечные циклы могут вызывать высокое использование CPU.

      Уровень запросов = запросы CPU всех подов на узле / общий CPU узла.
      Примечание: Если в определённый период наблюдается резкий рост уровня запросов CPU узла, это может быть связано с неправильными настройками коэффициента over-subscription кластера или чрезмерно высокими значениями запросов для подов, работающих на узле, что может привести к перерасходу ресурсов.

      Уровень лимитов = лимиты CPU всех подов на узле / общий CPU узла.
      Примечание: Если в определённый период наблюдается резкий рост уровня лимитов CPU узла, это указывает на слишком высокие значения лимитов для подов, работающих на узле, что может привести к перерасходу ресурсов CPU.
      MemoryУровень использования, уровень запросов и уровень лимитов памяти за указанный период времени.

      Уровень использования = использование памяти всеми подами на узле / общий объём памяти узла.
      Память является одним из важных компонентов сервера и служит связующим звеном для коммуникации CPU. Поэтому производительность памяти существенно влияет на работу машины. При запуске программ загрузка данных, параллелизм потоков и буферизация ввода-вывода зависят от памяти. Доступный объём памяти определяет, могут ли программы работать нормально и как именно.

      Уровень запросов = запросы памяти всех подов на узле / общий объём памяти узла.
      Примечание: Если в определённый период наблюдается резкий рост уровня запросов памяти узла, это может быть связано с неправильными настройками коэффициента over-subscription кластера или чрезмерно высокими значениями запросов для подов, работающих на узле, что может привести к перерасходу ресурсов.

      Уровень лимитов = лимиты памяти всех подов на узле / общий объём памяти узла.
      Примечание: Если в определённый период наблюдается резкий рост уровня лимитов памяти узла, это указывает на слишком высокие значения лимитов для подов, работающих на узле, что может привести к перерасходу ресурсов памяти.
      StorageУровень использования пространства и уровень использования inode за указанный период времени.

      Уровень использования пространства = использованное пространство хранения / общее пространство хранения.
      Мониторинг исторических данных использования дискового пространства позволяет оценить использование диска за заданный период времени. При высоком использовании диска можно освободить место, очистив ненужные образы или контейнеры.

      Уровень использования inode = использованные inode / общее количество inode.
      Примечание: Каждый файл должен иметь inode для хранения метаданных файла, таких как создатель файла и дата создания. Inode также занимают место на диске, и большое количество мелких файлов кэша может привести к исчерпанию ресурсов inode. Кроме того, при исчерпании inode, но при наличии свободного места на диске, создание новых файлов становится невозможным.
      System LoadСредняя загрузка CPU за 1, 5 и 15 минут. Значение представляет собой отношение общего числа процессов, которые в данный момент выполняются CPU или ожидают выполнения CPU, к максимальному числу процессов, которые CPU может выполнить, что является важным показателем занятости/простоя системы.

      Примечание: Если кривые за 1, 5 и 15 минут схожи в течение определённого периода, это указывает на относительно стабильную загрузку CPU кластера.
      Если значение за 1 минуту значительно выше значения за 15 минут в определённый период или точку времени, это указывает на рост нагрузки за последнюю минуту и требует дальнейшего наблюдения. Если значение за 1 минуту превышает количество CPU, это может свидетельствовать о перегрузке системы. Необходимо провести дополнительный анализ причин.
      Если значение за 1 минуту значительно ниже значения за 15 минут в определённый период или точку времени, это указывает на снижение нагрузки за последнюю минуту после высокого уровня нагрузки в предыдущие 15 минут.
      Disk ThroughputПропускная способность диска за указанный период времени — скорость передачи данных диском, где передаваемые данные — это сумма прочитанных и записанных данных.
      Disk IOPSIOPS диска за указанный период времени — сумма операций чтения и записи в секунду, представляющая собой показатель производительности количества операций чтения и записи в секунду диска.
      Network Traffic RateСкорость входящего и исходящего сетевого трафика за указанный период времени, учитываемая по физическому сетевому интерфейсу узла.
      Network Packet Rate (packets/sec)Скорость приёма и отправки сетевых пакетов за указанный период времени, учитываемая по физическому сетевому интерфейсу узла.