• Русский
  • Обновление Alauda AI

    INFO

    Обновление с версии 1.5 до 2.0

    Установка компонентов кластера Alauda AI

    Пожалуйста, посетите Alauda AI Cluster для:

    WARNING

    Игнорируйте раздел Creating Alauda AI Cluster Instance, так как мы обновляем Alauda AI с ранее управляемой версии.

    1. Загрузка пакетов операторов для Alauda AI Cluster и KServeless.
    2. Загрузка пакетов операторов в целевой кластер.
    3. Для обновления следуйте описанному ниже процессу.

    Предварительные операции перед обновлением

    Аннотирование остановленных сервисов вывода

    Начиная с версии 2.0, платформа использует нативную возможность остановки, предоставляемую KServe. Для обеспечения плавного обновления все сервисы вывода, находящиеся в состоянии остановлено, должны быть явно аннотированы перед обновлением.

    WARNING

    Этот шаг является обязательным перед обновлением. Отсутствие аннотирования остановленных сервисов вывода может привести к непредвиденному поведению после обновления.

    1. Выведите список всех сервисов вывода, которые в данный момент остановлены:

      kubectl get inferenceservices --all-namespaces
    2. Для каждого остановленного сервиса вывода добавьте следующую аннотацию:

      kubectl annotate inferenceservice <name> -n <namespace> serving.kserve.io/stop='true'

      Либо отредактируйте ресурс напрямую, добавив аннотацию в metadata.annotations:

      apiVersion: serving.kserve.io/v1beta1
      kind: InferenceService
      metadata:
        name: <name>
        annotations:
          serving.kserve.io/stop: 'true'
    3. Повторите этот шаг для всех остановленных сервисов вывода во всех пространствах имён.

    Обновление

    Ниже описана процедура обновления с версии Alauda AI 1.5 до 2.0.

    Обновление Alauda AI Essentials

    Обновите Alauda AI Essentials на вкладке Функциональные компоненты глобального кластера.

    В режиме Administrator перейдите в Clusters / Cluster в левом меню, найдите кластер global в правой панели и нажмите кнопку Upgrade на вкладке Functional Components, чтобы запустить обновление.

    INFO

    Все компоненты, требующие обновления, включая Alauda AI Essentials, будут обновлены одновременно и не могут быть обновлены по отдельности.

    После завершения обновления убедитесь, что статус Alauda AI Essentials в списке — Running, а версия — v2.0.x.

    Обновление операторов Alauda AI

    Процедура обновления обоих операторов практически идентична, отличается только целевой компонент.

    ШагAlauda AI OperatorAlauda AI Model Serving Operator
    1. ПерейтиВойдите в Web Console, затем перейдите в Marketplace > OperatorHub в режиме Administrator.Войдите в Web Console, затем перейдите в Marketplace > OperatorHub в режиме Administrator.
    2. ВыбратьВыберите целевой кластер.Выберите целевой кластер.
    3. НажатьНажмите на карточку Alauda AI.Нажмите на карточку Alauda AI Model Serving.
    4. ПодтвердитьПодтвердите обновление, нажав Confirm в появившемся окне.Подтвердите обновление, нажав Confirm в появившемся окне.
    INFO

    После загрузки новой версии и её распознавания платформой в верхней части страницы оператора появится запрос на обновление.

    Обновление плагинов кластера

    INFO

    Этот шаг требуется только если вы развернули один из следующих плагинов кластера: Alauda AI Workbench, Alauda AI MLflow или Alauda AI Volcano. Если ни один из этих плагинов не развернут, этот шаг можно пропустить.

    Для получения дополнительной информации о плагинах кластера обратитесь к Alauda Container Platform - Extend.

    Процедура обновления плагинов кластера включает загрузку новых версий пакетов и последующее обновление через Web Console. Следующие плагины требуют обновления:

    • Alauda AI Workbench
    • Alauda AI MLflow
    • Alauda AI Volcano

    Загрузка плагинов кластера

    Загрузите новые пакеты плагинов кластера в глобальный кластер. Подробные инструкции по загрузке плагинов кластера смотрите в Uploading Cluster Plugins.

    Повторите процесс загрузки для каждого развернутого плагина.

    INFO

    После завершения загрузки подождите примерно 10–15 минут, чтобы платформа синхронизировала информацию о новой версии.

    Проверка новой версии

    Перейдите в Administrator > Marketplace > Upload Packages и переключитесь на вкладку Cluster Plugin. Найдите каждый загруженный плагин и убедитесь, что отображается новая версия.

    Обновление через Web Console

    1. Перейдите в Administrator > Clusters > Clusters.
    2. Нажмите на кластер, в котором развернуты плагины.
    3. Перейдите на вкладку Functional Components на странице деталей кластера.
    4. Найдите плагины кластера, для которых доступны обновления — рядом с ними будет отображён значок обновления.
    5. Нажмите кнопку Upgrade для нужного плагина.
    6. Ознакомьтесь с информацией об обновлении в всплывающем окне, подтвердите версию плагина для обновления и нажмите Upgrade для запуска процесса.

    Повторите этот процесс для каждого развернутого плагина.

    INFO

    После загрузки новой версии и её распознавания платформой кнопка Upgrade станет доступна для каждого плагина на вкладке Features страницы деталей кластера.

    Операции после обновления

    Обновление существующих сервисов вывода

    Из-за несовместимых изменений в определении product mode KServe и ресурсе InferenceService, введённых в версии 2.0, все сервисы вывода, существовавшие до обновления, должны быть обновлены вручную.

    WARNING

    Этот шаг обязателен для всех сервисов вывода, созданных до обновления. Отсутствие обновления может привести к некорректной работе сервисов вывода.

    Для каждого существующего сервиса вывода выполните следующие действия:

    1. Перейдите на страницу деталей сервиса вывода.

    2. Нажмите Update Inference Service.

    3. На странице обновления нажмите кнопку переключения YAML в правом верхнем углу, чтобы перейти в режим редактирования YAML.

    4. Найдите поле spec.predictor.model.name.

    5. Полностью удалите поле name и его значение.

      Например, если YAML содержит:

      spec:
        predictor:
          model:
            name: kserve-container
            modelFormat:
              name: sklearn

      После удаления должно быть:

      spec:
        predictor:
          model:
            modelFormat:
              name: sklearn
    6. Нажмите Save для применения изменений.

    7. Повторите этот процесс для всех сервисов вывода, существовавших до обновления.

    Проверка

    Alauda AI

    Проверьте поле статуса ресурса AmlCluster с именем default:

    kubectl get amlcluster default

    Должен вернуть Ready:

    NAME      READY   REASON
    default   True    Succeeded

    Alauda AI Model Serving

    Проверьте поле статуса ресурса KnativeServing с именем default-knative-serving:

    kubectl get KnativeServing.components.aml.dev default-knative-serving

    Должен вернуть InstallSuccessful:

    NAME                      DEPLOYED   REASON
    default-knative-serving   True       UpgradeSuccessful

    Плагины кластера Alauda AI

    В режиме Administrator перейдите в Marketplace > Cluster Plugins и убедитесь, что следующие плагины кластера отображаются со статусом Installed и новой версией:

    • Alauda AI Workbench (если развернут)
    • Alauda AI MLflow (если развернут)
    • Alauda AI Volcano (если развернут)