Обновление с AI 1.3
Содержание
Перед обновлениемУстановка компонентов кластера Alauda AIОбновлениеОбновление Alauda AI EssentialsОбновление операторов Alauda AIПроверкаПеред обновлением
Сохранение Inference Service Runtimes
Этот шаг гарантирует, что старые ресурсы ClusterServingRuntime не будут случайно удалены в процессе обновления. Скрипт добавляет аннотацию "helm.sh/resource-policy": "keep" ко всем ресурсам ClusterServingRuntime, что указывает Helm сохранить их при обновлении.
Выполните следующий скрипт в целевом кластере:
Миграция ресурсов InferenceService
До версии Alauda AI 1.4 ресурсы InferenceService не указывали явно режим развертывания. Теперь перед обновлением необходимо явно определить режим развертывания для всех ваших inference сервисов.
Эта миграция обновляет ваши inference сервисы. В режиме Knative Serverless это вызывает rolling update: создаётся новая revision, а старая удаляется только после того, как новая станет Ready.
Если сервис может испытывать ограничения по ресурсам (GPU/CPU/память), запланируйте окно обслуживания или временно остановите сервис перед запуском скрипта.
Выполните следующий скрипт в целевом кластере:
Установка компонентов кластера Alauda AI
Пожалуйста, посетите Alauda AI Cluster для:
Игнорируйте раздел Creating Alauda AI Cluster Instance, так как мы обновляем Alauda AI с ранее управляемой версии.
- Загрузка пакетов операторов для
Alauda AI ClusterиKServeless. - Загрузка пакетов операторов в целевой кластер.
- Для обновления следуйте описанному ниже процессу.
Обновление
Ниже описана процедура обновления с AI 1.3 до Alauda AI 1.4.
Обновление Alauda AI Essentials
Alauda AI Essentials будет обновлен вместе с функциональными компонентами глобального кластера.
В представлении Administrator перейдите в Clusters / Cluster в левой навигации, найдите кластер global в правой панели и нажмите кнопку Upgrade на вкладке Functional Components, чтобы запустить обновление.
Все компоненты, требующие обновления, включая Alauda AI Essentials, будут обновлены одновременно и не могут быть обновлены по отдельности.
После завершения обновления убедитесь, что статус Alauda AI Essentials в списке — Running, а версия — v1.4.x.
Обновление операторов Alauda AI
Процедура обновления обоих операторов практически идентична, отличается только целевой компонент.
После загрузки новой версии и её распознавания платформой, в верхней части страницы оператора появится запрос на обновление.
Проверка
Alauda AI
Проверьте поле статуса ресурса AmlCluster с именем default:
Должно вернуть Ready:
Alauda AI Model Serving
Проверьте поле статуса ресурса KnativeServing с именем default-knative-serving:
Должно вернуть InstallSuccessful: