在安装之前,需要下载以下操作员包:
Alauda AI 集群
:用于管理 Alauda AI 集群组件。KServeless
:用于管理 KServe
和 Knative Serving
组件。这两个操作员包可以从灵雀云获取。
有关更多信息,请联系客户支持。
我们需要将 Alauda AI 集群
和 KServeless
上传到目标集群。
首先,如果机器上不存在,则需要下载 violet
工具。
在 ACP 控制台的 平台管理 中:
violet
工具。chmod +x ${PATH_TO_THE_VIOLET_TOOL}
使工具可执行。首先,将以下脚本保存在 uploading-ai-cluster-packages.sh
中,然后阅读下面的注释以更新该脚本中的环境变量配置。
${PLATFORM_ADDRESS}
是您的 ACP 平台地址。${PLATFORM_ADMIN_USER}
是 ACP 平台管理员的用户名。${PLATFORM_ADMIN_PASSWORD}
是 ACP 平台管理员的密码。${CLUSTER}
是要安装 Alauda AI 组件的集群名称。${AI_CLUSTER_OPERATOR_NAME}
是 Alauda AI 集群操作员包 tarball 的路径。${KSERVELESS_OPERATOR_PKG_NAME}
是 KServeless 操作员包 tarball 的路径。${REGISTRY_ADDRESS}
是外部注册表的地址。${REGISTRY_USERNAME}
是外部注册表的用户名。${REGISTRY_PASSWORD}
是外部注册表的密码。配置完成后,使用命令 bash ./uploading-ai-cluster-packages.sh
执行脚本文件,将 Alauda AI 集群
和 KServeless
操作员包上传到目标集群。
在 ACP 控制台的 平台管理 中:
在控制台顶部,从 集群 下拉列表中选择您希望安装 Alauda AI 集群操作员的目标集群。
点击 市场 / 操作员中心。
选择 Alauda AI 集群,然后点击 安装。
安装 Alauda AI 集群 窗口会弹出。
然后在 安装 Alauda AI 集群 窗口中。
保持 通道 不变。
检查 版本 是否与您要安装的 Alauda AI 集群 版本匹配。
保持 安装位置 不变,默认应为 aml-operator
。
对于 升级策略 选择 手动。
点击 安装。
确认 Alauda AI 集群 瓦片显示以下状态之一:
Installing
:安装正在进行中;等待其变为 Installed
。Installed
:安装已完成。一旦安装了 Alauda AI 集群操作员,您就可以创建一个 Alauda AI 集群实例。
在 ACP 控制台的 平台管理 中:
在控制台顶部,从 集群 下拉列表中选择您希望安装 Alauda AI 集群操作员的目标集群。
点击 市场 / 操作员中心。
选择 Alauda AI 集群,然后 点击。
在 Alauda AI 集群 页面,点击标签中的 所有实例。
点击 创建实例。
选择实例类型 窗口会弹出。
在 选择实例类型 窗口中找到 AmlCluster 瓦片,然后点击 创建实例。
创建 AmlCluster 表单将显示。
对于 名称 保持 default
不变。
从下拉列表中选择 部署风味:
single-node
适用于非 HA 部署。ha-cluster
适用于 HA 集群部署(建议用于生产环境)。对于 Knative Serving 模式 选择 Managed。
对于 KServe 模式 选择 Managed。
在 域名 字段输入有效的域名。
此域名由入口网关用于暴露模型服务。您可能会想使用通配符名称,例如 *.example.com。
您可以通过更新 域名证书类型 字段来指定以下证书类型:
Provided
SelfSigned
ACPDefaultIngress
默认情况下,配置使用 SelfSigned
证书类型来保护进件流量,证书存储在 域名证书密钥 字段中指定的 knative-serving-cert
秘密中。
要使用您自己的证书,请将证书密钥存储在 istio-system
命名空间中,然后更新 域名证书密钥 字段的值,并将 域名证书密钥 字段的值更改为 Provided
。
在 Gitlab 部分:
cpaas-system
。aml-gitlab-admin-token
。在 MySQL 部分:
3306
)。aml
)。关于 MySQL 用户权限
CREATE DATABASE
权限来创建 数据库。审核上述配置,然后点击 创建。
检查名为 default
的 AMLCluster
资源的状态字段:
应返回 Ready
: