节点预处理

在安装 global 集群之前,所有节点(控制平面节点和工作节点)必须完成预处理。

目录

执行快速配置脚本

安装包提供了一个用于快速配置节点的脚本。

解压安装包后,在 res 目录下可以获得 init.sh 脚本文件。将该脚本文件复制到节点上,并确保拥有 root 权限。

执行脚本:

bash init.sh
WARNING

init.sh 无法保证以下所有检查均被正确处理,仍需继续执行下面的步骤。

节点检查

以下列出了节点必须完成的所有检查。根据节点的角色,所需检查会有所不同。例如,有些检查仅适用于控制平面节点。

检查分为两类:

  • ✅ 表示必须通过的检查。
  • ⚠️ 表示在特定场景下必须满足的检查,请根据说明判断是否满足对应条件,若满足则必须解决。

以下是检查列表:

  • 操作系统与内核

    • ✅ 机器的 grub 启动配置必须包含参数 transparent_hugepage=never
    • ✅ CentOS 7.x 系统机器的 grub 启动配置必须包含参数 cgroup.memory=nokmem
    • ✅ 检查内核模块 ip_vsip_vs_rrip_vs_wrrip_vs_sh 是否已启用。
    • ⚠️ 当内核版本低于 4.19.0(或 RHEL 低于 4.18.0)时,检查内核模块 nf_conntrack_ipv4 和(IPv6 时)nf_conntrack_ipv6 是否已启用。
    • ⚠️ 若 global 集群计划使用 Kube-OVN CNI,内核模块 geneveopenvswitch 必须启用。
    • ✅ 禁用 apparmor/selinux 和防火墙。
    • ✅ 禁用 swap
  • 用户与权限

    • ✅ 节点的 SSH 用户具有 root 权限,且可无密码使用 sudo
    • /etc/ssh/sshd_config 中的 UseDNSUsePAM 参数必须设置为 no
    • ✅ 执行 systemctl show --property=DefaultTasksMax 返回 infinity 或非常大的值,否则需调整 /etc/systemd/system.conf
  • 节点网络

    • hostname 必须符合以下规则:
      • 不超过 36 个字符。
      • 以字母或数字开头和结尾。
      • 仅包含小写字母、数字、-.,但不能包含 .-..-.
    • /etc/hosts 中的 localhost 必须解析为 127.0.0.1
    • /etc/resolv.conf 文件必须存在且包含 nameserver 配置,但不能包含以 172 开头的地址(需禁用 systemd-resolved)。
    • ⚠️ /etc/resolv.conf 文件不应配置 search 域(如必须配置,请参见 配置 Search Domain)。
    • ✅ 机器的 IP 地址不能是回环、多播、链路本地、全 0 或广播地址。
    • ✅ 执行 ip route 必须返回默认路由或指向 0.0.0.0 的路由。
    • ✅ 节点不得占用以下端口:
      • 控制平面节点: 23792380644310249 ~ 10256
      • 安装程序所在节点: 808012080124431644323792380644310249 ~ 10256
      • 工作节点: 10249 ~ 10256
    • ✅ 若 global 集群使用 Kube-OVNCalico,确保以下端口未被占用:
      • Kube-OVN: 66416642
      • Calico: 179
    • ⚠️ 确保 Docker 所需的网络段 172.16.x.x ~ 172.32.x.x 的 IP 地址未被占用。如该网络段 IP 被占用且无法更改,请联系技术支持。
  • 软件与目录要求

    • ✅ 必须安装以下工具:ipsstarswapoffmodprobesysctlmd5sum 以及 scpsftp
    • ⚠️ 若计划使用本地存储 TopoLVMRook,需安装 lvm2
    • ✅ 不允许存在 /etc/systemd/system/kubelet.service 文件。
    • /tmp 挂载参数中不得包含 noexec
    • ✅ 删除与 global 集群组件冲突的软件包(详见 删除冲突软件包)。
    • ✅ 以下文件若存在,必须删除:
      • /var/lib/docker
      • /var/lib/containerd
      • /var/log/pods
      • /var/lib/kubelet/pki
  • 跨节点检查

    • global 集群节点间不得存在网络防火墙限制。
    • ✅ 集群中每个节点的 hostname 必须唯一。
    • ✅ 所有节点时区必须统一,且时间同步误差 ≤ 10 秒。

附录

删除冲突软件包

安装前,节点上可能已在 docker/containerd 环境中运行应用,或安装了与 global 集群冲突的软件,因此需要检查并卸载冲突的软件包。

DANGER
  • 为避免应用中断或数据丢失,请务必确认是否存在冲突软件包。发现冲突时,请制定应用切换方案并备份数据后再卸载。
  • 卸载冲突软件包后,还需检查 /usr/local/bin/ 等目录中是否存在其他潜在冲突的二进制文件(如与 docker、containerd、runc、podman、容器网络、容器运行时或 Kubernetes 相关的软件)。

以下命令供参考。

CentOS / RedHat
Ubuntu
Kylin

检查:

for x in \
    docker docker-client docker-common docker-latest \
    podman-docker podman \
    runc \
    containernetworking-plugins \
    apptainer \
    kubernetes kubernetes-master kubernetes-node kubernetes-client \
    ; do
    rpm -qa | grep -F "$x"
done

卸载:

for x in \
    docker docker-client docker-common docker-latest \
    podman-docker podman \
    runc \
    containernetworking-plugins \
    apptainer \
    kubernetes kubernetes-master kubernetes-node kubernetes-client \
    ; do
    yum remove "$x"
done

在 Linux 操作系统中,/etc/resolv.conf 文件用于配置 DNS 客户端的域名解析设置。search 行指定 DNS 查询的域搜索路径。

配置要求

  • 域数量: search 行中的域数量应小于 domainCountLimit - 3(默认 domainCountLimit 为 32)。
  • 单个域名长度: 每个域名不得超过 253 个字符。
  • 总字符长度: 所有域名及空格的总字符数不得超过 MaxDNSSearchListChar(默认 2048)。

示例

search domain1.com domain2.com domain3.com
  • 域数量为 3。
  • 单个域名长度,如 domain1.com,为 11。
  • 总字符长度为 35,即 11 + 11 + 11 + 2(两个空格)。
WARNING
  • /etc/resolv.conf 文件中的 search 行不满足上述限制,可能导致 DNS 查询失败或性能下降。
  • 修改 /etc/resolv.conf 文件前,建议先备份该文件。