• Русский
  • Установка Alauda AI

    В кластере, где планируется использовать Alauda AI, необходимо развернуть два оператора:

    1. Alauda AI Operator

    Alauda AI Operator — основной движок, обеспечивающий работу продуктов Alauda AI. Он сосредоточен на двух ключевых функциях: управлении моделями и сервисах вывода, предоставляя гибкую платформу, которую легко расширять.

    1. Alauda AI Model Serving Operator

    Alauda AI Model Serving Operator обеспечивает безсерверный вывод моделей.

    INFO

    Во время процесса развертывания Alauda AI оператор Alauda AI Model Serving будет автоматически установлен, без необходимости ручных действий или изменений конфигурации.

    Содержание

    Загрузка

    INFO

    Вы можете скачать «Alauda AI» и «Alauda AI Model Serving» из Marketplace на сайте Customer Portal. Следуйте этим шагам:

    1. Скачайте приложение с названием "AI".
    2. Распакуйте загруженный файл, чтобы получить пакеты aml-operator.xxx.tgz и kserveless-operator.xxx.tgz.

    Загрузка в кластер

    Необходимо загрузить оба пакета — Alauda AI и Alauda AI Model Serving — в кластер, где будет использоваться Alauda AI.

    Загрузка инструмента violet

    Сначала нужно скачать инструмент violet, если он отсутствует на вашей машине.

    Войдите в Web Console и переключитесь в режим Administrator:

    1. Нажмите Marketplace / Upload Packages.
    2. Нажмите Download Packaging and Listing Tool.
    3. Выберите подходящую ОС и архитектуру CPU в разделе Execution Environment.
    4. Нажмите Download для загрузки инструмента violet.
    5. Выполните chmod +x ${PATH_TO_THE_VIOLET_TOOL}, чтобы сделать инструмент исполняемым.

    Загрузка пакетов

    Сохраните следующий скрипт в файл uploading-ai-cluster-packages.sh, затем ознакомьтесь с комментариями ниже для настройки переменных окружения в скрипте.

    uploading-ai-cluster-packages.sh
    #!/usr/bin/env bash
    export PLATFORM_ADDRESS=https://platform-address  
    export PLATFORM_ADMIN_USER=<admin>
    export PLATFORM_ADMIN_PASSWORD=<admin-password>
    export CLUSTER=<cluster-name>
    
    export AI_CLUSTER_OPERATOR_NAME=<path-to-aml-operator-tarball>
    export KSERVELESS_OPERATOR_PKG_NAME=<path-to-kserveless-operator-tarball>
    
    VIOLET_EXTRA_ARGS=()
    IS_EXTERNAL_REGISTRY=
    
    # Если тип реестра образов целевого кластера не является встроенным в платформу (внешний приватный или публичный репозиторий),
    # требуется дополнительная настройка (раскомментируйте следующую строку):
    # IS_EXTERNAL_REGISTRY=true
    if [[ "${IS_EXTERNAL_REGISTRY}" == "true" ]]; then
        REGISTRY_URL=<external-registry-url>
        REGISTRY_USERNAME=<registry-username>
        REGISTRY_PASSWORD=<registry-password>
    
        VIOLET_EXTRA_ARGS+=(
            --dst-repo "${REGISTRY_ADDRESS}"
            --username "${REGISTRY_USERNAME}"
            --password "${REGISTRY_PASSWORD}"
        )
    fi
    
    # Отправка пакета оператора **Alauda AI Cluster** в целевой кластер
    violet push \
        ${AI_CLUSTER_OPERATOR_NAME} \
        --platform-address=${PLATFORM_ADDRESS} \
        --platform-username=${PLATFORM_ADMIN_USER} \
        --platform-password=${PLATFORM_ADMIN_PASSWORD} \
        --clusters=${CLUSTER} \
        ${VIOLET_EXTRA_ARGS[@]}
    
    # Отправка пакета оператора **KServeless** в целевой кластер
    violet push \
        ${KSERVELESS_OPERATOR_PKG_NAME} \
        --platform-address=${PLATFORM_ADDRESS} \
        --platform-username=${PLATFORM_ADMIN_USER} \
        --platform-password=${PLATFORM_ADMIN_PASSWORD} \
        --clusters=${CLUSTER} \
        ${VIOLET_EXTRA_ARGS[@]}
    1. ${PLATFORM_ADDRESS} — адрес вашей платформы ACP.
    2. ${PLATFORM_ADMIN_USER} — имя пользователя администратора платформы ACP.
    3. ${PLATFORM_ADMIN_PASSWORD} — пароль администратора платформы ACP.
    4. ${CLUSTER} — имя кластера, в который нужно установить компоненты Alauda AI.
    5. ${AI_CLUSTER_OPERATOR_NAME} — путь к архиву пакета оператора Alauda AI Cluster.
    6. ${KSERVELESS_OPERATOR_PKG_NAME} — путь к архиву пакета оператора KServeless.
    7. ${REGISTRY_ADDRESS} — адрес внешнего реестра.
    8. ${REGISTRY_USERNAME} — имя пользователя внешнего реестра.
    9. ${REGISTRY_PASSWORD} — пароль внешнего реестра.

    После настройки выполните скрипт командой bash ./uploading-ai-cluster-packages.sh для загрузки операторов Alauda AI и Alauda AI Model Serving.

    Установка оператора Alauda AI

    Процедура

    В режиме Administrator:

    1. Нажмите Marketplace / OperatorHub.

    2. В верхней части консоли выберите из выпадающего списка Cluster целевой кластер, в который хотите установить Alauda AI.

    3. Выберите Alauda AI, затем нажмите Install.

      Появится окно Install Alauda AI.

    4. В окне Install Alauda AI:

    5. Оставьте Channel без изменений.

    6. Проверьте, что Version соответствует версии Alauda AI, которую вы хотите установить.

    7. Оставьте Installation Location без изменений, по умолчанию должно быть aml-operator.

    8. Выберите Manual для Upgrade Strategy.

    9. Нажмите Install.

    Проверка

    Убедитесь, что плитка Alauda AI отображает одно из следующих состояний:

    • Installing: установка в процессе; дождитесь изменения на Installed.
    • Installed: установка завершена.

    Создание экземпляра Alauda AI

    После установки оператора Alauda AI можно создать экземпляр Alauda AI.

    Процедура

    В режиме Administrator:

    1. Нажмите Marketplace / OperatorHub.

    2. В верхней части консоли выберите из выпадающего списка Cluster целевой кластер, в который хотите установить оператор Alauda AI.

    3. Выберите Alauda AI, затем нажмите.

    4. На странице Alauda AI перейдите на вкладку All Instances.

    5. Нажмите Create.

      Появится окно Select Instance Type.

    6. Найдите плитку AmlCluster в окне Select Instance Type, затем нажмите Create.

      Откроется форма Create AmlCluster.

    7. Оставьте значение default без изменений в поле Name.

    8. Выберите Deploy Flavor из выпадающего списка:

      1. single-node для развертываний без HA.
      2. ha-cluster для развертываний HA кластера (Рекомендуется для продакшена).
    9. Выберите Managed для Knative Serving Mode.

    10. Выберите Managed для KServe Mode.

    11. Введите действительный домен в поле Domain.

      INFO

      Этот домен используется ingress gateway для экспонирования сервисов вывода моделей. Скорее всего, вам понадобится использовать wildcard-домен, например *.example.com.

      Вы можете указать следующие типы сертификатов, обновив поле Domain Certificate Type:

      • Provided
      • SelfSigned
      • ACPDefaultIngress

      По умолчанию используется сертификат типа SelfSigned для защиты ingress-трафика к вашему кластеру, сертификат хранится в секрете knative-serving-cert, указанном в поле Domain Certificate Secret.

      Чтобы использовать собственный сертификат, сохраните секрет сертификата в namespace istio-system, затем обновите значение поля Domain Certificate Secret и измените значение поля Domain Certificate Type на Provided.

    12. В разделе Gitlab:

      1. Введите URL вашего self-hosted Gitlab в поле Base URL.
      2. Введите cpaas-system в поле Admin Token Secret Namespace.
      3. Введите aml-gitlab-admin-token в поле Admin Token Secret Name.
    13. В разделе MySQL:

      1. Введите адрес MySQL-инстанса в поле Host.
      2. Введите порт MySQL-инстанса в поле Port (по умолчанию: 3306).
      3. Введите пользователя для подключения к MySQL в поле Username.
      4. Введите базу данных, используемую для Alauda AI, в поле Database (по умолчанию: aml).
      5. Выберите namespace секрета с паролем пользователя в поле Password Secret Namespace.
      6. Введите имя секрета с паролем пользователя в поле Password Secret Name.
      INFO

      О правах пользователя MySQL

      • Пользователь MySQL должен иметь права DDL.
      • Рекомендуется создать базу данных и предоставить пользователю доступ к ней.
      • Если база данных не создана, пользователю нужны права CREATE DATABASE для её создания.
    14. Проверьте настройки и нажмите Create.

    Проверка

    Проверьте поле статуса ресурса AmlCluster с именем default:

    kubectl get amlcluster default

    Должно вернуть Ready:

    NAME      READY   REASON
    default   True    Succeeded

    Теперь основные возможности Alauda AI успешно развернуты. Если вы хотите быстро ознакомиться с продуктом, обратитесь к разделу Quick Start.

    Замена сервиса GitLab после установки

    Если необходимо заменить сервис GitLab после установки, выполните следующие шаги:

    1. Переконфигурировать сервис GitLab
      Ознакомьтесь с разделом Pre-installation Configuration и повторно выполните его шаги.

    2. Обновить экземпляр Alauda AI

      • В режиме Administrator перейдите в Marketplace > OperatorHub
      • В выпадающем списке Cluster выберите целевой кластер
      • Выберите Alauda AI и перейдите на вкладку All Instances
      • Найдите экземпляр с именем 'default' и нажмите Update
    3. Изменить конфигурацию GitLab
      В форме Update default:

      • Найдите раздел GitLab
      • Введите:
        • Base URL: URL вашего нового GitLab-инстанса
        • Admin Token Secret Namespace: cpaas-system
        • Admin Token Secret Name: aml-gitlab-admin-token
    4. Перезапустить компоненты
      Перезапустите деплоймент aml-controller в namespace kubeflow.

    5. Обновить данные платформы
      В интерфейсе управления Alauda AI повторно управляйте всеми namespace.

      • В режиме Alauda AI перейдите в режим Admin из Business View
      • На странице Namespace Management удалите все существующие управляемые namespace
      • Используйте "Managed Namespace" для добавления namespace, требующих интеграции с Alauda AI
        INFO

        Исходные модели не будут мигрированы автоматически. Для продолжения работы с этими моделями:

        • Воссоздайте и загрузите их заново в новый GitLab ИЛИ
        • Вручную перенесите файлы моделей в новый репозиторий