在创建或访问集群后,建议定期备份集群数据。定期备份能够快速从意外事件中恢复,并便于跨集群数据迁移,同时确保数据的可靠性。
通过配置备份的数据类型(例如存储在 ETCD 中的集群配置数据和应用数据)、数据来源(节点、命名空间)、存储位置、备份方式和规则,创建备份计划。触发该计划后,平台会根据配置方案备份集群数据,实现按需或按定义的时间表自动备份。
要恢复集群应用数据,可基于已有备份文件执行应用恢复任务。
针对不同的备份和恢复场景,配置备份策略并执行恢复操作,具体如下。
当本地应用出现故障(例如命名空间被误删)时,可使用备份文件将应用恢复到当前集群。恢复过程中,应用资源通常无需修改(例如域名和服务端口);仅恢复对应的集群资源。
安装插件:在当前集群中安装备份与恢复插件。
配置备份仓库:在当前集群中配置备份仓库。
创建备份计划:在当前集群中创建应用备份计划,选择托管应用的命名空间并配置周期性计划。
运行恢复任务:需要恢复时,在当前集群中运行应用恢复任务。
常见的跨集群备份与恢复场景包括:
在传统的开发测试场景中,应用可能跨数据中心迁移,并通过备份文件恢复到其他集群。恢复后可能需要调整应用资源(例如域名和服务端口)。
将集群资源迁移到其他集群。
将生产集群资源复制到开发测试集群。
确保源集群和目标集群的 CPU、内存等规格相近,规格差异过大可能导致 Pod 无法调度,迁移后处于 Pending 状态。
确保源集群和目标集群的网络模式一致,否则恢复时部分资源可能无法正确恢复。若子网不同,恢复后 Pod IP 会发生变化。
安装插件:在当前集群中安装备份与恢复插件。
配置备份仓库:在当前集群中配置备份仓库。
创建备份任务:在源集群中创建应用备份任务,选择应用运行的命名空间并配置周期性计划。
判断是否需要镜像迁移:恢复数据前,评估是否需要进行镜像迁移。若镜像仓库位于两个集群外部且两个集群均可访问,则无需此步骤。需要镜像迁移的场景,请参见镜像仓库替换。
运行恢复任务:在目标集群中运行应用恢复任务。
导入命名空间:数据迁移完成后,需手动将命名空间导入到项目管理中的对应项目,否则恢复的应用可能无法在平台 UI 中显示。
在跨平台容灾场景中,当主平台集群故障且工作负载切换到次平台集群时,迁移后可能需要调整应用(例如域名和服务端口)。
确保源集群和目标集群的 CPU、内存等规格相近,避免因资源限制导致 Pod 无法调度。
确保源集群和目标集群的网络模式一致,否则恢复时部分资源可能无法正确恢复。若子网不同,恢复后 Pod IP 会发生变化。