• Русский
  • Обновление

    В этой статье описывается, как выполнить обновление с GPU-manager или старой версии Hami (версия 2.5) до самой новой версии Hami.

    GPU-manager на Hami

    Примечание

    1. GPU-manager и Hami не могут быть развернуты на одном и том же узле, но могут быть развернуты в одном кластере.
    2. При начале обновления приложения необходимо изменять по одному, что приведёт к перезапуску бизнес-подов.
    3. Если у вас только один GPU-узел, необходимо сначала удалить GPU-manager, а затем установить Hami. Это можно сделать, изменив метку узла при развертывании обоих плагинов. Например, можно удалить метку узла nvidia-device-enable=vgpu, чтобы удалить экземпляр gpu-manager на этом узле, а затем добавить метку gpu=on для развертывания плагина hami на этом узле.

    Процедура

    Измените ваши приложения по одному, пример:

    Ваш старый экземпляр GPU-manager:

    spec:
      containers:
        - image: your-image
          imagePullPolicy: IfNotPresent
          name: gpu
          resources:
            limits:
              cpu: '2'
              memory: 4Gi
              tencent.com/vcuda-core: "50"
              tencent.com/vcuda-memory: "8000"

    Миграция на Hami:

    spec:
      containers:
        - image: your-image
          imagePullPolicy: IfNotPresent
          name: gpu
          resources:
            limits:
              cpu: '2'
              memory: 4Gi
              nvidia.com/gpualloc: 1     # Запрос 1 физического GPU (обязательно)
              nvidia.com/gpucores: "50"  # Запрос 50% вычислительных ресурсов на GPU (необязательно)
              nvidia.com/gpumem: 8000    # Запрос 8000 МБ видеопамяти на GPU (необязательно)

    Hami на Hami

    Важные изменения (v2.5 → v2.6)

    ВерсияДоступность параметровНеобходимые действия после обновления
    Hami v2.5Nvidia Runtime Class Name и Create Nvidia Runtime Class не включены в всплывающую форму.Не требуется
    Hami v2.6Эти параметры обязательны для настройки при развертывании экземпляра плагина на новом узле.Обновите параметры развертывания плагина:
    - Nvidia Runtime Class Name: hami-nvidia
    - Create Nvidia Runtime Class: true (включить)

    ⚠️ Обновление с v2.5 до v2.6 не должно повлиять на существующие приложения. ✅ Рекомендуется выполнить перезапуск приложений с помощью rolling update, чтобы избежать неожиданных проблем.


    Процедура

    1. При необходимости обновите версию ACP.
    2. Загрузите пакет плагина Hami v2.6 в ACP.
    3. Перейдите на страницу Administrator -> Clusters -> Tartget Cluster -> Functional Components, затем нажмите кнопку Updrade, и вы увидите, что Alauda Build of HAMi доступен для обновления. Clusters -> Tartget Cluster -> Functional Components, затем нажмите кнопку Updrade, и вы увидите, что Alauda Build of HAMi доступен для обновления.