Установка Alauda Build of KServe
Alauda Build of KServe — это облачный компонент, построенный на основе KServe для обслуживания моделей генеративного ИИ. В качестве расширения экосистемы Alauda AI он специально оптимизирован для Large Language Models (LLMs), предоставляя ключевые функции, такие как оркестрация инференса, потоковые ответы и масштабирование ресурсов на основе нагрузки для генеративных рабочих нагрузок.
Содержание
Предварительные требованияОбязательные зависимостиДополнительные зависимостиПримечания по установкеЗагрузка Cluster PluginЗагрузка Cluster PluginУстановка Alauda Build of KServeКонфигурация Envoy GatewayКонфигурация Envoy AI GatewayКонфигурация KServe GatewayКонфигурация GIE (gateway-api-inference-extension)Интеграция Alauda AIОбновление Alauda Build of KServeПредварительные требования
Перед установкой Alauda Build of KServe необходимо убедиться, что установлены следующие зависимости:
Обязательные зависимости
Alauda build of Envoy Gateway нативно интегрирован в ACP 4.2. Для сред с более ранними версиями (включая ACP 4.0 и 4.1) обратитесь в службу поддержки клиентов для получения информации о совместимости и рекомендаций по установке.
Дополнительные зависимости
Примечания по установке
- Обязательные зависимости: Все три обязательные зависимости должны быть установлены до установки Alauda Build of KServe.
- Интеграция GIE: Если вы хотите использовать GIE, вы можете включить его во время установки, выбрав опцию "Integrated GIE" в UI Alauda Build of KServe.
- Интеграция Alauda AI: Если вам не нужна функциональность KServe Predictive AI и вы хотите использовать только генеративный AI LLM, вы можете отключить опцию "Integrated With Alauda AI" во время установки.
Загрузка Cluster Plugin
Плагин кластера Alauda Build of KServe можно получить через Customer Portal.
Для получения дополнительной информации обратитесь в службу поддержки потребителей.
Загрузка Cluster Plugin
Для получения дополнительной информации о загрузке плагина кластера обратитесь к Uploading Cluster Plugins
Установка Alauda Build of KServe
-
Перейдите на страницу
Administrator->Marketplace->Cluster Plugin, переключитесь на целевой кластер и разверните плагин кластераAlauda Build of KServe. -
В форме развертывания настройте следующие параметры по необходимости:
Конфигурация Envoy Gateway
Конфигурация Envoy AI Gateway
Конфигурация KServe Gateway
Конфигурация GIE (gateway-api-inference-extension)
Интеграция Alauda AI
-
Нажмите Install для начала процесса установки.
-
Проверьте результат. В UI будет отображаться статус "Installed".
Обновление Alauda Build of KServe
- Загрузите новую версию пакета плагина Alauda Build of KServe в ACP.
- Перейдите на страницу
Administrator->Clusters->Target Cluster->Functional Components, затем нажмите кнопкуUpgrade, после чего будет доступно обновлениеAlauda Build of KServe.