Установка Alauda AI
Alauda AI теперь предлагает гибкие варианты развертывания. Начиная с версии Alauda AI 1.4, функциональность Serverless является опциональной, что позволяет упростить установку, если она не требуется.
Для начала необходимо развернуть Alauda AI Operator. Это основной движок для всех продуктов Alauda AI. По умолчанию он использует режим KServe Raw Deployment для inference backend, который особенно рекомендуется для ресурсоёмких генеративных нагрузок. Этот режим обеспечивает простой способ развертывания моделей и предоставляет надёжные, настраиваемые возможности деплоя, используя базовые функции Kubernetes.
Если ваш сценарий требует функциональность Serverless, которая позволяет использовать расширенные возможности, такие как масштабирование до нуля по требованию для оптимизации затрат, вы можете опционально установить Alauda AI Model Serving Operator. Этот оператор не входит в стандартную установку и может быть добавлен в любой момент для включения функциональности Serverless.
Рекомендуемый вариант развертывания: Для генеративных inference нагрузок рекомендуется подход Raw Kubernetes Deployment, так как он обеспечивает максимальный контроль над распределением ресурсов и масштабированием.
Содержание
ЗагрузкаЗагрузка в кластерУстановка Alauda AI OperatorСоздание экземпляра Alauda AIВключение функциональности Serverless1. Установка Alauda AI Model Serving Operator2. Создание экземпляра Alauda AI Model ServingАвтоматическое создание (рекомендуется)Ручное создание и интеграцияЗамена сервиса GitLab после установкиFAQЗагрузка
Компоненты оператора:
-
Alauda AI Operator
Alauda AI Operator — основной движок, обеспечивающий работу продуктов Alauda AI. Он фокусируется на двух ключевых функциях: управлении моделями и inference-сервисах, предоставляя гибкую платформу, которую легко расширять.
Пакет для загрузки: aml-operator.xxx.tgz
-
Alauda AI Model Serving Operator
Alauda AI Model Serving Operator обеспечивает serverless inference моделей.
Пакет для загрузки: kserveless-operator.xxx.tgz
Вы можете скачать приложения с названиями 'Alauda AI' и 'Alauda AI Model Serving' из Marketplace на сайте Customer Portal.
Загрузка в кластер
Необходимо загрузить оба пакета — Alauda AI и Alauda AI Model Serving — в кластер, где будет использоваться Alauda AI.
Загрузка инструмента violet
Сначала нужно скачать инструмент violet, если он отсутствует на вашей машине.
Войдите в Web Console и переключитесь в режим Administrator:
- Нажмите Marketplace / Upload Packages.
- Нажмите Download Packaging and Listing Tool.
- Выберите подходящую ОС / архитектуру CPU в разделе Execution Environment.
- Нажмите Download для скачивания инструмента
violet. - Выполните
chmod +x ${PATH_TO_THE_VIOLET_TOOL}, чтобы сделать инструмент исполняемым.
Загрузка пакетов
Сохраните следующий скрипт в файл uploading-ai-cluster-packages.sh, затем обновите переменные окружения в комментариях для настройки.
${PLATFORM_ADDRESS}— адрес вашей платформы ACP.${PLATFORM_ADMIN_USER}— имя пользователя администратора платформы ACP.${PLATFORM_ADMIN_PASSWORD}— пароль администратора платформы ACP.${CLUSTER}— имя кластера для установки компонентов Alauda AI.${AI_CLUSTER_OPERATOR_NAME}— путь к архиву пакета оператора Alauda AI Cluster.${KSERVELESS_OPERATOR_PKG_NAME}— путь к архиву пакета оператора KServeless.${REGISTRY_ADDRESS}— адрес внешнего реестра.${REGISTRY_USERNAME}— имя пользователя внешнего реестра.${REGISTRY_PASSWORD}— пароль внешнего реестра.
После настройки выполните скрипт командой bash ./uploading-ai-cluster-packages.sh для загрузки операторов Alauda AI и Alauda AI Model Serving.
Установка Alauda AI Operator
Процедура
В режиме Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли выберите из выпадающего списка Cluster целевой кластер для установки Alauda AI.
-
Выберите Alauda AI, затем нажмите Install.
Откроется окно Install Alauda AI.
-
В окне Install Alauda AI:
-
Оставьте Channel без изменений.
-
Проверьте, что Version соответствует версии Alauda AI, которую хотите установить.
-
Оставьте Installation Location без изменений, по умолчанию это
aml-operator. -
Выберите Manual для Upgrade Strategy.
-
Нажмите Install.
Проверка
Убедитесь, что плитка Alauda AI отображает одно из следующих состояний:
Installing: установка в процессе; дождитесь смены наInstalled.Installed: установка завершена.
Создание экземпляра Alauda AI
После установки оператора Alauda AI вы можете создать экземпляр Alauda AI.
Процедура
В режиме Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли выберите из выпадающего списка Cluster целевой кластер, где установлен оператор Alauda AI.
-
Выберите Alauda AI, затем нажмите.
-
На странице Alauda AI выберите вкладку All Instances.
-
Нажмите Create.
Откроется окно Select Instance Type.
-
Найдите плитку AmlCluster в окне Select Instance Type, затем нажмите Create.
Появится форма Create AmlCluster.
-
Оставьте
defaultбез изменений в поле Name. -
Выберите Deploy Flavor из выпадающего списка:
single-nodeдля развертываний без HA.ha-clusterдля HA кластера (Рекомендуется для продакшена).
-
Установите KServe Mode в значение Managed.
-
Введите действительный домен в поле Domain.
INFOЭтот домен используется ingress gateway для экспонирования сервисов model serving. Скорее всего, вы захотите использовать wildcard-имя, например *.example.com.
Вы можете указать следующие типы сертификатов, обновив поле Domain Certificate Type:
ProvidedSelfSignedACPDefaultIngress
По умолчанию используется сертификат типа
SelfSignedдля защиты ingress-трафика к вашему кластеру, сертификат хранится в секретеknative-serving-cert, указанном в поле Domain Certificate Secret.Чтобы использовать собственный сертификат, сохраните секрет сертификата в namespace
istio-system, затем обновите значение поля Domain Certificate Secret и измените тип сертификата наProvided. -
В разделе Serverless Configuration установите Knative Serving Provider в значение Operator; остальные параметры оставьте пустыми.
-
В разделе Gitlab:
- Введите URL self-hosted Gitlab в поле Base URL.
- Введите
cpaas-systemв поле Admin Token Secret Namespace. - Введите
aml-gitlab-admin-tokenв поле Admin Token Secret Name.
-
Проверьте настройки и нажмите Create.
Проверка
Проверьте статус ресурса AmlCluster с именем default:
Должно вернуть Ready:
Теперь основные возможности Alauda AI успешно развернуты. Если вы хотите быстро ознакомиться с продуктом, обратитесь к разделу Quick Start.
Включение функциональности Serverless
Функциональность Serverless является опциональной и требует установки дополнительного оператора и создания экземпляра.
1. Установка Alauda AI Model Serving Operator
Предварительные требования
Функциональность Serverless зависит от Istio Gateway для сетевого взаимодействия. Пожалуйста, сначала установите Service Mesh, следуя документации.
Процедура
В режиме Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли выберите из выпадающего списка Cluster целевой кластер для установки.
-
Выберите Alauda AI Model Serving, затем нажмите Install.
Откроется окно Install Alauda AI Model Serving.
-
В окне Install Alauda AI Model Serving:
-
Оставьте Channel без изменений.
-
Проверьте, что Version соответствует версии Alauda AI Model Serving, которую хотите установить.
-
Оставьте Installation Location без изменений, по умолчанию это
kserveless-operator. -
Выберите Manual для Upgrade Strategy.
-
Нажмите Install.
Проверка
Убедитесь, что плитка Alauda AI Model Serving отображает одно из следующих состояний:
Installing: установка в процессе; дождитесь смены наInstalled.Installed: установка завершена.
2. Создание экземпляра Alauda AI Model Serving
После установки Alauda AI Model Serving Operator вы можете создать экземпляр двумя способами:
Автоматическое создание (рекомендуется)
Экземпляр может быть автоматически создан и управляться AmlCluster путём редактирования его параметров.
В режиме Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли выберите из выпадающего списка Cluster целевой кластер, где ранее был установлен
AmlCluster. -
Выберите Alauda AI, затем нажмите.
-
На странице Alauda AI выберите вкладку All Instances.
-
Нажмите на имя default.
-
В выпадающем списке Actions выберите обновление.
Откроется форма update default.
-
В разделе Serverless Configuration:
- Установите Knative Serving Provider в
Legacy. - Установите BuiltIn Knative Serving в
Managed.
- Установите Knative Serving Provider в
-
Остальные параметры оставьте без изменений. Нажмите Update.
Ручное создание и интеграция
Вы можете вручную создать экземпляр KnativeServing (knativeservings.components.aml.dev).
В режиме Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли выберите из выпадающего списка Cluster целевой кластер для установки.
-
Выберите Alauda AI Model Serving, затем нажмите.
-
На странице Alauda AI Model Serving выберите вкладку All Instances.
-
Нажмите Create.
Откроется окно Select Instance Type.
-
Найдите плитку KnativeServing в окне Select Instance Type, затем нажмите Create.
Появится форма Create KnativeServing.
-
Оставьте
default-knative-servingбез изменений в поле Name. -
Оставьте
knative-servingбез изменений в поле Knative Serving Namespace. -
В разделе Ingress Gateway настройте следующее:
- Установите Ingress Gateway Istio Revision в значение, соответствующее вашей версии Istio (например,
1-22). - Введите действительный домен в поле Domain.
- Установите соответствующий Domain Certificate Type.
INFOПодробности о настройке домена и типа сертификата смотрите в соответствующем разделе.
- Установите Ingress Gateway Istio Revision в значение, соответствующее вашей версии Istio (например,
-
В разделе Values настройте следующее:
-
Выберите Deploy Flavor из выпадающего списка:
single-nodeдля развертываний без HA.ha-clusterдля HA кластера (Рекомендуется для продакшена).
-
Установите Global Registry Address в соответствии с вашим кластером
Адрес приватного реестра вашего кластера можно найти следующим образом:
- В Web Console перейдите в Administrator / Clusters.
- Выберите нужный кластер.
- На вкладке Overview найдите значение
Private Registry addressв разделе Basic Info.
-
Настройте экземпляр AmlCluster для интеграции с экземпляром KnativeServing.
В окне обновления экземпляра AmlCluster заполните необходимые параметры в разделе Serverless Configuration.
После первоначальной установки вы увидите, что только параметр Knative Serving Provider установлен в Operator. Теперь необходимо указать значения для следующих параметров:
- APIVersion:
components.aml.dev/v1alpha1 - Kind:
KnativeServing - Name:
default-knative-serving - Оставьте поле Namespace пустым.
Замена сервиса GitLab после установки
Если вы хотите заменить сервис GitLab после установки, выполните следующие шаги:
-
Переконфигурируйте сервис GitLab
Обратитесь к разделу Pre-installation Configuration и повторно выполните его шаги. -
Обновите экземпляр Alauda AI
- В режиме Administrator перейдите в Marketplace > OperatorHub
- В выпадающем списке Cluster выберите целевой кластер
- Выберите Alauda AI и перейдите на вкладку All Instances
- Найдите экземпляр 'default' и нажмите Update
-
Измените конфигурацию GitLab
В форме Update default:- Найдите раздел GitLab
- Введите:
- Base URL: URL вашего нового экземпляра GitLab
- Admin Token Secret Namespace:
cpaas-system - Admin Token Secret Name:
aml-gitlab-admin-token
-
Перезапустите компоненты
Перезапустите деплойментaml-controllerв namespacekubeflow. -
Обновите данные платформы
В интерфейсе управления Alauda AI повторно управляйте всеми namespace:- В режиме Alauda AI перейдите в Admin из Business View
- На странице Namespace Management удалите все существующие управляемые namespace
- Используйте "Managed Namespace" для добавления namespace, требующих интеграции с Alauda AI
INFO
Исходные модели не будут мигрированы автоматически.
Чтобы продолжить использовать эти модели:- Воссоздайте и загрузите их заново в новый GitLab ИЛИ
- Вручную перенесите файлы моделей в новый репозиторий
FAQ
- Почему
aml-api-deployне удаётся обновить базу данных после установки или обновления?
Известна проблема, при которой компонент aml-api-deploy может некорректно инициализировать базу данных после установки, а также не выполнять миграцию схемы базы данных при обновлении. Это может повлиять на расширенные функции, такие как предпросмотр датасетов и дообучение.
Для исправления войдите в Pod деплоймента aml-api-deploy в namespace kubeflow:
Затем выполните следующие команды внутри контейнера: