Как определить модель стоимости pGPU
Содержание
Предварительные требованияО Alauda Build NVIDIA GPU Device PluginПроцедураСоздание PrometheusRule для генерации необходимых метрикДобавление конфигурации сбора (Cost Management Agent)Добавление конфигурации отображения/хранения (Cost Management Server)Добавление цены для модели стоимости pGPUОписание методов биллингаДетали стоимости и статистика стоимостиПредварительные требования
В GPU-кластере:
- Установлен Alauda Build NVIDIA GPU Device Plugin
- Установлен Cost Management Agent
О Alauda Build NVIDIA GPU Device Plugin
NVIDIA device plugin для Kubernetes — это Daemonset, который позволяет автоматически:
- Отображать количество GPU на каждом узле вашего кластера
- Отслеживать состояние ваших GPU
- Запускать контейнеры с поддержкой GPU в вашем Kubernetes кластере.
Процедура
Создание PrometheusRule для генерации необходимых метрик
Создайте PrometheusRule в GPU-кластере.
Добавление конфигурации сбора (Cost Management Agent)
Создайте ConfigMap в GPU-кластере, где работает Cost Management Agent, чтобы объявить, что нужно собирать.
После добавления yaml необходимо перезапустить Pod агента для перезагрузки конфигураций.
Добавление конфигурации отображения/хранения (Cost Management Server)
Создайте ConfigMap в кластере, где работает Cost Management Server, чтобы объявить элементы биллинга, методы, единицы и отображаемые имена. Это указывает серверу, что и как учитывать.
После добавления yaml необходимо перезапустить Pod сервера для перезагрузки конфигураций.
Добавление цены для модели стоимости pGPU
Описание методов биллинга
Если в GPU-кластере отсутствует модель стоимости, необходимо создать новую модель стоимости. Затем можно добавить цену для модели стоимости GPU-кластера:
- Выберите
pGPUв Billing Items. - Выберите
Request Usage (count-hours)илиProject Quota (count-hours)в Method. - Установите Default Price.
- Настройте Price By Label (опционально).
Пример:
key: modelName
value: "Tesla P100-PCIE-16GB" или "Tesla T4" или "NVIDIA A30" (получается при запускеnvidia-smi)
Детали стоимости и статистика стоимости
Наконец, после ожидания 1 или более часов вы сможете увидеть детали стоимости в Cost Details с измерениями namespace и UUID карты.
Также вы сможете увидеть общие затраты по кластеру, проекту и namespace в Cost Statistics.