Установка Llama Stack
В этом документе описывается, как установить и развернуть Llama Stack Server в Kubernetes с помощью Llama Stack Operator.
Загрузка оператора
Скачайте файл установки Llama Stack Operator (например, llama-stack-operator.alpha.ALL.xxxx.tgz).
Используйте команду violet для публикации в репозиторий платформы:
Установка оператора
-
Перейдите в представление
Administratorв Alauda Container Platform. -
В левой навигации выберите
Marketplace/Operator Hub. -
В правой панели найдите
Alauda build of Llama Stackи нажмитеInstall. -
Оставьте все параметры по умолчанию и завершите установку.
Развертывание Llama Stack Server
После установки оператора разверните Llama Stack Server, создав кастомный ресурс LlamaStackDistribution:
Примечание: Подготовьте следующее заранее, иначе дистрибутив может не перейти в состояние готовности:
- Secret: Создайте Secret (например,
deepseek-api) в том же namespace с токеном API LLM. Пример:kubectl create secret generic deepseek-api -n default --from-literal=token=<LLM_API_KEY>.- Storage Class: Убедитесь, что в кластере существует Storage Class с именем
default; иначе PVC не сможет привязаться, и ресурс не станет готовым.
После развертывания Llama Stack Server будет доступен внутри кластера. URL доступа отображается в status.serviceURL, например: