Установка Alauda Build of KServe
Alauda Build of KServe — это облачный компонент, построенный на основе KServe для обслуживания моделей генеративного ИИ. В качестве расширения экосистемы Alauda AI он специально оптимизирован для Large Language Models (LLMs), предоставляя ключевые функции, такие как оркестрация инференса, потоковые ответы и автоматическое масштабирование ресурсов для генеративных нагрузок.
Содержание
Предварительные требованияОбязательные зависимостиНеобязательные зависимостиПримечания по установкеЗагрузка Cluster PluginЗагрузка Cluster PluginУстановка Alauda Build of KServeКонфигурация Envoy GatewayКонфигурация Envoy AI GatewayКонфигурация KServe GatewayКонфигурация GIE (gateway-api-inference-extension)Интеграция Alauda AIОбновление Alauda Build of KServeПредварительные требования
Перед установкой Alauda Build of KServe необходимо убедиться, что установлены следующие зависимости:
Обязательные зависимости
Alauda build of Envoy Gateway нативно интегрирован в ACP 4.2. Для сред с более ранними версиями (включая ACP 4.0 и 4.1) обратитесь в службу поддержки клиентов для получения рекомендаций по совместимости и установке.
Необязательные зависимости
Примечания по установке
- Обязательные зависимости: Все три обязательные зависимости должны быть установлены до установки Alauda Build of KServe.
- Интеграция GIE: Если вы хотите использовать GIE, его можно включить во время установки, выбрав опцию «Integrated GIE» в UI Alauda Build of KServe.
- Интеграция Alauda AI: Если вам не нужна функциональность KServe Predictive AI и вы хотите использовать только генеративный AI LLM, опцию «Integrated With Alauda AI» можно отключить при установке.
Загрузка Cluster Plugin
Плагин кластера Alauda Build of KServe можно получить через Customer Portal.
Для получения дополнительной информации обратитесь в службу поддержки потребителей.
Загрузка Cluster Plugin
Для получения дополнительной информации о загрузке плагина кластера обратитесь к Uploading Cluster Plugins
Установка Alauda Build of KServe
-
Перейдите на страницу
Administrator->Marketplace->Cluster Plugin, переключитесь на целевой кластер и разверните плагин кластераAlauda Build of KServe. -
В форме развертывания настройте следующие параметры по необходимости:
Конфигурация Envoy Gateway
Конфигурация Envoy AI Gateway
Конфигурация KServe Gateway
Конфигурация GIE (gateway-api-inference-extension)
Интеграция Alauda AI
-
Нажмите Install для начала процесса установки.
-
Проверьте результат. В UI должен отображаться статус «Installed».
Обновление Alauda Build of KServe
- Загрузите новую версию пакета плагина Alauda Build of KServe в ACP.
- Перейдите на страницу
Administrator->Clusters->Target Cluster->Functional Components, затем нажмите кнопкуUpgrade, и вы увидите, чтоAlauda Build of KServeдоступен для обновления.