Установка KServe
Содержание
Предварительные требованияНеобходимые зависимостиПримечания к установкеЗагрузка operatorУстановка OperatorПроверкаСоздание экземпляра KServeПроверкаКонфигурация Envoy GatewayКонфигурация Envoy AI GatewayКонфигурация KServe GatewayКонфигурация GIE (gateway-api-inference-extension)Обновление Alauda Build of KServeПроверкаПредварительные требования
Перед установкой Alauda Build of KServe необходимо убедиться, что установлены следующие зависимости:
Необходимые зависимости
Alauda build of Envoy Gateway нативно интегрирован в ACP 4.2. Для сред, работающих на более ранних версиях (включая ACP 4.0 и 4.1), обратитесь в Customer Support за информацией о совместимости и установке.
Примечания к установке
- Необходимые зависимости: все требуемые зависимости должны быть установлены до установки Alauda Build of KServe.
- Интеграция GIE: GIE включен и активен по умолчанию. Если в вашей среде GIE уже установлен отдельно, задайте
gie.builtInвfalseв конфигурации operator, чтобы отключить встроенную установку.
Загрузка operator
Скачайте установочный файл operator для Alauda Build of KServe (например, kserve-operator.ALL.xxxx.tgz).
Используйте команду violet, чтобы опубликовать его в репозитории платформы:
Установка Operator
В представлении Administrator:
-
Нажмите Marketplace / OperatorHub.
-
В верхней части консоли в раскрывающемся списке Cluster выберите целевой кластер, в который нужно установить KServe Operator.
-
Найдите и выберите Alauda Build of KServe, затем нажмите Install.
Откроется окно Install Alauda Build of KServe.
-
Оставьте поле Channel без изменений.
-
Проверьте, что значение Version соответствует версии Alauda Build of KServe, которую вы хотите установить.
-
Оставьте Installation Location без изменений; по умолчанию должно быть
kserve-operator. -
В поле Upgrade Strategy выберите Manual.
-
Нажмите Install.
Проверка
Убедитесь, что на плитке Alauda Build of KServe отображается одно из следующих состояний:
Installing: установка выполняется; дождитесь, пока состояние изменится наInstalled.Installed: установка завершена.
Создание экземпляра KServe
После установки operator создайте пользовательский ресурс KServe, чтобы развернуть экземпляр KServe.
Переключитесь в режим YAML view и примените следующую конфигурацию, затем скорректируйте поля callout в соответствии с вашей средой:
spec.namespace— пространство имен Kubernetes, в котором развертываются компоненты KServe. Значение по умолчанию:kserve.global.clusterName— имя кластера, зарегистрированное на платформе. Пример:business-1.global.deployFlavor—single-nodeдля не-HA,ha-clusterдля production HA.global.platformAddress— адрес management endpoint Alauda Container Platform. Пример:https://192.168.131.112.preset.GIE— встроенный Gateway API Inference Extension для расширенных AI-возможностей. См. GIE Configuration.preset.envoy_ai_gateway— gateway, специфичный для AI, для интеллектуальной маршрутизации и enforcement политик. См. Envoy AI Gateway Configuration.preset.envoy_gateway— базовая gateway-инфраструктура на основе Envoy. См. Envoy Gateway Configuration.preset.kserve_gateway— ingress gateway для сервисов InferenceService KServe. См. KServe Gateway Configuration.global.registry.address— endpoint container registry, используемый целевым кластером (global.clusterName) для загрузки инфраструктурных и runtime-образов KServe. Пример:registry.alauda.cn:60070.kserve.controller.deploymentMode— задайтеKnativeдля serverless-функций, таких как scale-to-zero, илиStandardдля нативных развертываний Kuberneteskserve.controller.gateway.domain— домен ingress gateway для публикации endpoints inference service. Используйте wildcard-домен, например*.example.com.kserve.storage.caBundleConfigMapName— имя ConfigMap, содержащего CA bundle для подключений к storage.
Проверка
Проверьте статус ресурса KServe:
Экземпляр готов, когда в статусе отображается DEPLOYED: True.
Конфигурация Envoy Gateway
Конфигурация Envoy AI Gateway
Конфигурация KServe Gateway
Конфигурация GIE (gateway-api-inference-extension)
Обновление Alauda Build of KServe
- Загрузите новую версию пакета operator Alauda Build of KServe с помощью инструмента
violet. - Перейдите на страницу
Administrator->Marketplace->OperatorHub, найдите Alauda Build of KServe и нажмите Confirm, чтобы применить новую версию.
Проверка
После обновления убедитесь, что на плитке Alauda Build of KServe отображается Installed, и проверьте статус экземпляра KServe: