Мониторинг ожидающих workloads
Alauda Build of Kueue предоставляет функцию VisibilityOnDemand для мониторинга ожидающих workloads. Workload — это приложение, которое выполняется до завершения. Оно может состоять из одного или нескольких подов, которые, слабо или тесно связанные, в совокупности выполняют задачу. Workload является единицей допуска в Alauda Build of Kueue.
Функция VisibilityOnDemand предоставляет администраторам batch возможность мониторить очередь ожидающих заданий в кластерной очереди и локальной очереди, а пользователям batch — только локальную очередь, помогая им оценить, когда их задания начнут выполняться.
Вы можете регулировать входящие запросы и большие объемы запросов, а также предоставлять пользователям права на просмотр ожидающих workloads.
Содержание
1. API Priority and Fairness2. Предоставление прав пользователям3. Мониторинг ожидающих workloads по требованию3.1. Предварительные требования3.2. Процедура3.2.1. Просмотр ожидающих workloads в ClusterQueue3.2.2. Просмотр ожидающих workloads в LocalQueue1. API Priority and Fairness
Alauda Build of Kueue использует Kubernetes API Priority and Fairness (APF) для управления ожидающими workloads. APF — это механизм управления потоком, который позволяет задавать политики на уровне API для регулирования входящих запросов к API-серверу. Он защищает API-сервер от перегрузки неожиданно высоким объемом запросов, при этом защищая критический трафик от эффекта ограничения для workloads с лучшими усилиями (best-effort).
пример
2. Предоставление прав пользователям
Вы можете настроить объекты контроля доступа на основе ролей (RBAC) для пользователей вашей установки Alauda Build of Kueue. Эти объекты определяют, какие типы пользователей могут создавать какие типы объектов Alauda Build of Kueue.
Необходимо предоставить права тем пользователям, которым требуется доступ к конкретным API.
- Если пользователю нужен доступ к ожидающим workloads из ресурса
ClusterQueue, необходимо создать схему ClusterRoleBinding, ссылающуюся на ClusterRolekueue-batch-admin-role. - Если пользователю нужен доступ к ожидающим workloads из ресурса
LocalQueue, необходимо создать схему RoleBinding, ссылающуюся на ClusterRolekueue-batch-user-role.
3. Мониторинг ожидающих workloads по требованию
Для тестирования мониторинга ожидающих workloads необходимо правильно настроить ресурсы ClusterQueue и LocalQueue. После этого можно создавать задания в этой LocalQueue. Kueue управляет объектом workload, созданным из задания, поэтому, когда задание отправляется и насыщает ClusterQueue, соответствующие workloads можно увидеть в списке ожидающих workloads.
3.1. Предварительные требования
- Web CLI Alauda Container Platform имеет связь с вашим кластером.
- У вас есть права администратора кластера.
Следующая процедура описывает, как установить и протестировать мониторинг workloads.
3.2. Процедура
-
Создайте ресурсы, выполнив следующую команду:
-
Создайте следующий файл с манифестом задания:
-
Создайте шесть заданий, выполнив следующую команду:
3.2.1. Просмотр ожидающих workloads в ClusterQueue
Для просмотра всех ожидающих workloads на уровне кластера администраторы могут использовать endpoint видимости объекта ClusterQueue из visibility API для Alauda Build of Kueue. Этот endpoint возвращает список всех workloads, которые в данный момент ожидают допуска этим ресурсом ClusterQueue.
Процедура
-
Для просмотра ожидающих workloads в
ClusterQueueвыполните следующую команду:Вы должны получить результат, похожий на:
Вы можете передать следующие необязательные параметры запроса:
limit <integer>: по умолчанию 1000. Указывает максимальное количество ожидающих workloads, которые должны быть получены.offset <integer>: по умолчанию 0. Указывает позицию первого ожидающего workload, который должен быть получен, начиная с 0. -
Чтобы просмотреть только 1 ожидающий workload, начиная с позиции 1 в ClusterQueue, выполните:
3.2.2. Просмотр ожидающих workloads в LocalQueue
Для просмотра ожидающих workloads, отправленных конкретным арендатором в их namespace, пользователи могут запросить endpoint видимости ресурса LocalQueue из visibility API для Alauda Build of Kueue. Это предоставляет упорядоченный список их заданий, ожидающих в этой очереди.
Процедура
-
Для просмотра ожидающих workloads в LocalQueue выполните следующую команду:
Вы должны получить результат, похожий на:
Вы можете передать следующие необязательные параметры запроса:
limit <integer>: по умолчанию 1000. Указывает максимальное количество ожидающих workloads, которые должны быть получены.offset <integer>: по умолчанию 0. Указывает позицию первого ожидающего workload, который должен быть получен, начиная с 0. -
Чтобы просмотреть только один ожидающий workload, начиная с позиции 0 в LocalQueue, выполните следующую команду: