| CPU | Процент использования, процент запросов и процент лимитов CPU за указанный период времени. Процент использования = использование CPU всеми подами на узле / общий CPU узла. Примечание: Если в определённый период наблюдается резкий рост использования CPU узлом, необходимо сначала определить процесс, потребляющий наибольшее количество CPU. Например, для Java-приложений с пользовательским кодом утечки памяти или бесконечные циклы могут вызывать высокое использование CPU.
Процент запросов = запросы CPU всех подов на узле / общий CPU узла. Примечание: Если в определённый период наблюдается резкий рост запросов CPU узлом, это может быть связано с неправильной настройкой коэффициента over-subscription кластера или чрезмерно высокими значениями запросов для подов, работающих на узле, что может привести к неэффективному использованию ресурсов.
Процент лимитов = лимиты CPU всех подов на узле / общий CPU узла. Примечание: Если в определённый период наблюдается резкий рост лимитов CPU узлом, это указывает на слишком высокие значения лимитов для подов, работающих на узле, что может привести к неэффективному использованию CPU. |
| Memory | Процент использования, процент запросов и процент лимитов памяти за указанный период времени. Процент использования = использование памяти всеми подами на узле / общий объём памяти узла. Память является одним из важных компонентов сервера и служит связующим звеном для взаимодействия CPU. Поэтому производительность памяти существенно влияет на работу машины. При запуске программ загрузка данных, параллелизм потоков и буферизация ввода-вывода зависят от памяти. Доступный объём памяти определяет, смогут ли программы работать нормально и как именно.
Процент запросов = запросы памяти всех подов на узле / общий объём памяти узла. Примечание: Если в определённый период наблюдается резкий рост запросов памяти узлом, это может быть связано с неправильной настройкой коэффициента over-subscription кластера или чрезмерно высокими значениями запросов для подов, работающих на узле, что может привести к неэффективному использованию ресурсов.
Процент лимитов = лимиты памяти всех подов на узле / общий объём памяти узла. Примечание: Если в определённый период наблюдается резкий рост лимитов памяти узлом, это указывает на слишком высокие значения лимитов для подов, работающих на узле, что может привести к неэффективному использованию памяти. |
| Storage | Процент использования пространства и процент использования inode за указанный период времени.
Процент использования пространства = использованное пространство хранения / общий объём пространства хранения. Отслеживая исторические данные по использованию дискового пространства, можно оценить использование диска за определённый период. При высоком использовании диска можно освободить место, очистив ненужные образы или контейнеры.
Процент использования inode = использованные inode / общее количество inode. Примечание: Каждый файл должен иметь inode для хранения метаданных файла, таких как создатель файла и дата создания. Inode также занимают место на диске, и большое количество мелких файлов кэша может привести к исчерпанию ресурсов inode. Кроме того, при исчерпании inode, но при наличии свободного места на диске, новые файлы создать нельзя. |
| System Load | Средняя нагрузка CPU за 1, 5 и 15 минут. Значение представляет собой отношение общего количества процессов, которые в данный момент выполняются CPU или ожидают выполнения, к максимальному количеству процессов, которое CPU может выполнить, что является важным показателем занятости/простоя системы.
Примечание: Если кривые за 1, 5 и 15 минут похожи в течение определённого периода, это указывает на стабильную нагрузку CPU в кластере. Если значение за 1 минуту значительно выше значения за 15 минут в определённый период или момент времени, это указывает на рост нагрузки в последние 1 минуту и требует дальнейшего наблюдения. Если значение за 1 минуту превышает количество CPU, это может свидетельствовать о перегрузке системы. Необходимо провести дополнительный анализ причин. Если значение за 1 минуту значительно ниже значения за 15 минут в определённый период или момент времени, это указывает на снижение нагрузки в последние 1 минуту после высокого уровня нагрузки в предыдущие 15 минут. |
| Disk Throughput | Пропускная способность диска за указанный период времени, то есть скорость передачи данных диском, где передаваемые данные — это сумма прочитанных и записанных данных. |
| Disk IOPS | IOPS диска за указанный период времени — сумма операций чтения и записи в секунду, представляющая собой показатель производительности количества операций чтения и записи диска в секунду. |
| Network Traffic Rate | Скорость входящего и исходящего сетевого трафика за указанный период времени, учитываемая по физическому сетевому интерфейсу узла. |
| Network Packet Rate (packets/sec) | Скорость приёма и отправки сетевых пакетов за указанный период времени, учитываемая по физическому сетевому интерфейсу узла. |