Установка Alauda AI
Alauda AI теперь предлагает гибкие варианты развертывания. Начиная с Alauda AI 1.4, возможность Knative является необязательной функцией, что позволяет упростить установку, если она не требуется.
Для начала необходимо развернуть Alauda AI Operator. Это основной механизм для всех продуктов Alauda AI. По умолчанию он использует режим Standard KServe для backend инференса, который особенно рекомендуется для ресурсоемких генеративных нагрузок. Этот режим предоставляет простой способ развертывания моделей и обеспечивает надежные, настраиваемые возможности развертывания за счет использования базовых возможностей Kubernetes.
Если ваш сценарий использования требует функциональности Knative, которая включает расширенные возможности, такие как масштабирование до нуля по требованию для оптимизации затрат, вы можете дополнительно установить Knative Operator. Этот оператор не входит в установку по умолчанию и может быть добавлен в любое время для включения функциональности Knative.
Рекомендуемый вариант развертывания: для генеративных инференс-нагрузок рекомендуется подход Standard (ранее известный как RawKubernetes Deployment), поскольку он обеспечивает максимальный контроль над распределением ресурсов и масштабированием.
Содержание
ЗагрузкаЗагрузкаУстановка Alauda AI OperatorУстановка Alauda Build of KServe OperatorВключение функциональности Knative1. Установка Knative Operator2. Создание экземпляра Knative ServingСоздание экземпляра Alauda AIFAQ1. Настройка каталога вывода аудита для aml-skipperЗагрузка
Компоненты Operator:
-
Alauda AI Operator
Alauda AI Operator — это основной механизм, обеспечивающий работу продуктов Alauda AI. Он сосредоточен на двух ключевых функциях: управлении моделями и сервисами инференса, а также предоставляет гибкую платформу, которую можно легко расширять.
Пакет для загрузки: aml-operator.xxx.tgz
-
Knative Operator
Knative Operator предоставляет serverless-инференс моделей.
Пакет для загрузки: knative-operator.ALL.v1.x.x-yymmdd.tgz
Вы можете загрузить приложения с именами 'Alauda AI' и 'Knative Operator' из Marketplace на сайте Customer Portal.
Загрузка
Необходимо загрузить как Alauda AI, так и Knative Operator в кластер, где будет использоваться Alauda AI.
Загрузка инструмента violet
Сначала необходимо загрузить инструмент violet, если он отсутствует на машине.
Войдите в Web Console и переключитесь в представление Administrator:
- Нажмите Marketplace / Upload Packages.
- Нажмите Download Packaging and Listing Tool.
- Найдите нужную ОС / архитектуру CPU в разделе Execution Environment.
- Нажмите Download, чтобы загрузить инструмент
violet. - Выполните
chmod +x ${PATH_TO_THE_VIOLET_TOOL}, чтобы сделать инструмент исполняемым.
Загрузка пакета
Сначала сохраните следующий скрипт в uploading-ai-cluster-packages.sh, затем прочитайте комментарии ниже и обновите переменные окружения для настройки в этом скрипте.
${PLATFORM_ADDRESS}— это адрес вашей платформы ACP.${PLATFORM_ADMIN_USER}— это имя пользователя администратора платформы ACP.${PLATFORM_ADMIN_PASSWORD}— это пароль администратора платформы ACP.${CLUSTER}— это имя кластера, в который будут установлены компоненты Alauda AI.${AI_CLUSTER_OPERATOR_NAME}— это путь к архиву пакета Alauda AI Cluster Operator.${KNATIVE_OPERATOR_PKG_NAME}— это путь к архиву пакета Knative Operator.${REGISTRY_ADDRESS}— это адрес внешнего реестра.${REGISTRY_USERNAME}— это имя пользователя внешнего реестра.${REGISTRY_PASSWORD}— это пароль внешнего реестра.
После настройки выполните файл скрипта с помощью bash ./uploading-ai-cluster-packages.sh, чтобы загрузить как Alauda AI, так и Knative Operator.
Установка Alauda AI Operator
Процедура
В представлении Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли в выпадающем списке Cluster выберите целевой кластер, в который вы хотите установить Alauda AI.
-
Выберите Alauda AI, затем нажмите Install.
Откроется окно Install Alauda AI.
-
Затем в окне Install Alauda AI.
-
Оставьте Channel без изменений.
-
Проверьте, соответствует ли Version версии Alauda AI, которую вы хотите установить.
-
Оставьте Installation Location без изменений; по умолчанию должно быть
aml-operator. -
Для Upgrade Strategy выберите Manual.
-
Нажмите Install.
Проверка
Убедитесь, что плитка Alauda AI показывает одно из следующих состояний:
Installing: установка выполняется; дождитесь, пока состояние изменится наInstalled.Installed: установка завершена.
Установка Alauda Build of KServe Operator
Подробные шаги установки см. в Install KServe в Alauda Build of KServe.
Включение функциональности Knative
Функциональность Knative является дополнительной возможностью, для которой требуется развернуть дополнительный оператор и экземпляр.
Если вы планируете использовать функциональность Knative, вы ДОЛЖНЫ установить Knative Operator и создать экземпляр Knative Serving ДО создания экземпляра Alauda AI, чтобы гарантировать наличие необходимых CRD в кластере.
1. Установка Knative Operator
Начиная с Knative Operator, сетевой уровень Knative переключается на Kourier, поэтому установка Istio больше не требуется.
Процедура
В представлении Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли в выпадающем списке Cluster выберите целевой кластер, в который вы хотите установить.
-
Найдите и выберите Knative Operator, затем нажмите Install.
Откроется окно Install Knative Operator.
-
Затем в окне Install Knative Operator.
-
Оставьте Channel без изменений.
-
Проверьте, соответствует ли Version версии Knative Operator, которую вы хотите установить.
-
Оставьте Installation Location без изменений.
-
Для Upgrade Strategy выберите Manual.
-
Нажмите Install.
Проверка
Убедитесь, что плитка Knative Operator показывает одно из следующих состояний:
Installing: установка выполняется; дождитесь, пока состояние изменится наInstalled.Installed: установка завершена.
2. Создание экземпляра Knative Serving
После установки Knative Operator необходимо вручную создать экземпляр KnativeServing.
Процедура
-
Создайте namespace
knative-serving. -
В представлении Administrator перейдите в Operators -> Installed Operators.
-
Выберите Knative Operator.
-
В разделе Provided APIs найдите KnativeServing и нажмите Create Instance.
-
Переключитесь в YAML view.
-
Замените содержимое следующим YAML:
-
Нажмите Create.
- Для ACP 4.0 используйте версию 1.18.1
- Для ACP 4.1 и выше используйте версию 1.19.6
-
Укажите версию Knative Serving, которую необходимо развернуть.
-
private-registry— это заглушка для адреса вашего private registry. Вы можете найти его в представлении Administrator, затем нажать Clusters, выбратьyour clusterи проверить значение Private Registry в разделе Basic Info.
Создание экземпляра Alauda AI
После установки Alauda AI Operator (и, при необходимости, Knative Operator) вы можете создать экземпляр Alauda AI.
Процедура
В представлении Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли в выпадающем списке Cluster выберите целевой кластер, в который вы хотите установить Alauda AI Operator.
-
Выберите Alauda AI, затем нажмите Click.
-
На странице Alauda AI нажмите All Instances на вкладке.
-
Нажмите Create.
Откроется окно Select Instance Type.
-
Найдите плитку AmlCluster в окне Select Instance Type, затем нажмите Create.
Отобразится форма Create AmlCluster.
-
Для Name оставьте
defaultбез изменений. -
В выпадающем списке Deploy Flavor выберите:
single-nodeдля развертываний без HA.ha-clusterдля HA-кластеров (рекомендуется для production).
-
Установите для KServe Mode значение Managed.
-
Введите допустимый домен в поле Domain.
INFOЭтот домен используется ingress gateway для публикации сервисов модели. Скорее всего, вам потребуется использовать wildcard-имя, например *.example.com.
Вы можете указать следующие типы сертификатов, обновив поле Domain Certificate Type:
ProvidedSelfSignedACPDefaultIngress
По умолчанию конфигурация использует тип сертификата
SelfSignedдля защиты ingress-трафика к вашему кластеру; сертификат хранится в секретеknative-serving-cert, указанном в поле Domain Certificate Secret. -
(Необязательно) Если вы хотите включить функциональность Knative, в разделе Serverless Configuration установите для Knative Serving Provider значение Operator.
INFOЕсли вы установили Knative Operator для включения функциональности Serverless в предыдущих шагах, укажите следующие параметры для его интеграции:
- APIVersion:
operator.knative.dev/v1beta1 - Kind:
KnativeServing - Name:
knative-serving - Namespace:
knative-serving
Если вы не используете функциональность Knative, оставьте для Knative Serving Provider значение
Removed(или пустым), а остальные параметры — пустыми. - APIVersion:
-
В разделе Gitlab:
- Введите URL самостоятелно размещенного Gitlab в поле Base URL.
- Введите
cpaas-systemдля Admin Token Secret Namespace. - Введите
aml-gitlab-admin-tokenдля Admin Token Secret Name.
-
Проверьте указанные выше настройки, затем нажмите Create.
Проверка
Проверьте поле статуса ресурса AmlCluster с именем default:
Должно вернуть Ready:
Теперь основные возможности Alauda AI успешно развернуты. Если вы хотите быстро ознакомиться с продуктом, обратитесь к Quick Start.
FAQ
1. Настройка каталога вывода аудита для aml-skipper
Путь вывода аудита по умолчанию — /cpaas/audit на хосте. Однако в некоторых операционных системах (например, MicroOS) корневой путь хоста доступен только для чтения, и каталог /cpaas не может быть создан. В этом случае пользователям необходимо изменить путь вывода аудита.
Чтобы изменить путь вывода аудита, обновите ресурс AmlCluster по умолчанию и добавьте конфигурацию amlSkipper.auditLogHostPath.path в раздел spec.values. Например:
Конкретный путь должен соответствовать настройкам сбора Alauda Container Platform Log Collector.