专用集群部署是指使用一个独立的集群来部署平台的分布式存储,平台内的其他业务集群通过接入来访问和利用它提供的存储服务。
为了保证平台分布式存储的性能和稳定性,只将平台核心组件和分布式存储组件部署在专用存储集群中,避免其他业务工作负载的共置。这种分离部署方法是平台分布式存储的最佳实践。
存算分离架构
仅支持 3.18 及以上版本。
推荐使用裸金属集群作为专用存储集群。
有关分布式存储部署的组成部分,请参考核心概念。
每个组件有不同的 CPU 和内存需求,推荐配置如下:
进程 | CPU | 内存 |
---|---|---|
MON | 2c | 3Gi |
MGR | 3c | 4Gi |
MDS | 3c | 8Gi |
RGW | 2c | 4Gi |
OSD | 4c | 8Gi |
一个集群通常运行:
基于组件分布,以下每个节点的资源建议适用:
CPU | 内存 |
---|---|
16c + (4c * OSD 每节点) | 20Gi + (8Gi * OSD 每节点) |
建议每个节点部署 12 个或更少的存储设备。这有助于限制节点故障后的恢复时间。
推荐使用企业级 SSD,单个设备容量不超过 10TiB,并确保所有硬盘的大小和类型一致。
在部署之前,根据具体业务需求规划存储容量。默认情况下,分布式存储系统采用 3 副本冗余策略。因此,可用容量是所有存储设备总原始容量除以 3。
以30(N)个节点(副本数 = 3)为例,可用容量场景如下:
存储设备大小(D) | 节点上存储设备数量(M) | 总容量(DMN) | 可用容量(DMN/3) |
---|---|---|---|
0.5 TiB | 3 | 45 TiB | 15 TiB |
2 TiB | 6 | 360 TiB | 120 TiB |
4 TiB | 9 | 1080 TiB | 360 TiB |
主动容量规划
始终确保可用存储容量超过消耗量。如果存储完全耗尽,恢复需要手动干预,无法通过简单删除或迁移数据来解决。
容量告警
集群会在两个阈值触发告警:
务必及时处理警报,并定期监控存储使用情况,以避免服务中断。
扩容建议
分布式存储必须使用 主机网络。
网络分为两种类型:
为了确保服务质量和性能稳定:
网络隔离配置示例
存储节点
业务集群节点
进入 平台管理。
在左侧导航栏中,单击 存储管理 > 分布式存储。
单击 立即配置。
在 部署 Operator 向导页中,单击右下角 部署 Operator 按钮。
在存储集群的 控制节点 执行命令。
参数:
- 10.0.1.0/24
)。- 10.0.2.0/24
)。使用磁盘的 WWN(世界唯一标识符)进行稳定命名,避免依赖于重启后可能发生变化的 sdb
等易变设备路径。
提供三种存储池类型,根据您的业务需求选择并创建相应的存储池。
在存储集群的 控制节点 执行命令。
在存储集群的 控制节点 执行命令。
在存储集群的 控制节点 执行命令。
当其他集群需要使用分布式存储服务时,请参考以下指南。
接入存储服务