由一个 global 集群 和一个或多个 workload 集群 组成。必须先升级 global 集群,之后才能升级任何 workload 集群。
本文档将引导您完成 global 集群的升级操作步骤。
如果 global 集群配置了 global DR(灾备) 方案,请严格按照global DR 操作步骤执行。否则,请按照标准操作步骤执行。
将升级包复制到 global 集群的 任意控制平面节点,解压后进入解压目录。
如果 global 集群使用 内置镜像仓库,执行:
如果 global 集群使用 外部镜像仓库,还需提供仓库地址:
上传镜像通常需要约 2 小时,具体时间取决于您的网络和磁盘性能。如果您的平台使用 global DR,记得 备用 global 集群也需要上传镜像,请合理安排维护时间窗口。
镜像上传完成后,执行以下命令开始升级流程:
等待脚本执行完成后再继续。
global
集群,打开详情视图。在弹出的对话框中查看可用的组件更新,确认后继续。
升级 Kubernetes 版本为可选操作。但由于升级过程中可能出现服务中断,建议一并升级 Kubernetes,以避免多次维护窗口。
如果 global 集群中安装了 Alauda Container Platform GitOps
,升级后插件的 Pod 出现异常运行,请参考升级 Alauda Container Platform GitOps。
Alauda Container Platform Product Docs 插件提供平台内的产品文档访问。平台中的所有帮助链接均指向该文档。如果未安装此插件,点击平台中的帮助链接将导致 404 访问错误。
从 ACP 4.0 开始,内置产品文档已拆分为 Alauda Container Platform Product Docs 插件。如果您从 3.18 版本升级,需要按照以下步骤安装此插件:
进入 管理员 页面。
在左侧边栏点击 Marketplace > 集群插件,选择 global
集群。
找到 Alauda Container Platform Product Docs 插件,点击 安装。
按照常规 global DR 检查流程,确保 备用 global 集群 的数据与 主 global 集群 一致。如发现不一致,请联系技术支持,切勿继续操作。
在 两个集群 上执行以下命令,确保没有处于非运行状态的 Machine
节点:
如果存在此类节点,请联系技术支持解决后再继续。
global
。按照标准操作步骤中描述的流程,先升级 备用 global 集群。
备用集群升级完成后,按照相同的标准操作步骤升级 主 global 集群。
重新安装前,确认端口 2379
已从两个 global 集群的 VIP 正确转发到控制平面节点。
重新安装步骤:
global
集群。验证安装:
执行以下命令检查同步状态:
输出说明:
"LOCAL ETCD missed keys:"
– 主集群存在但备用集群缺失的键,通常重启 pod 后可解决。"LOCAL ETCD surplus keys:"
– 备用集群存在但主集群缺失的键,请与运维团队确认后再删除。