专用集群部署是指使用独立集群部署平台的分布式存储,平台内其他业务集群通过集成访问并使用该存储服务。
为保证平台分布式存储的性能和稳定性,专用存储集群仅部署平台核心组件和分布式存储组件,避免与其他业务负载混合部署。此种分离部署方式是平台分布式存储的推荐最佳实践。
存储计算分离架构
支持版本为 3.18 及以后版本。
建议使用裸金属集群作为专用存储集群。
请参考核心概念了解分布式存储部署的组件。
各组件对 CPU 和内存有不同需求,推荐配置如下:
进程 | CPU | 内存 |
---|---|---|
MON | 2c | 3Gi |
MGR | 3c | 4Gi |
MDS | 3c | 8Gi |
RGW | 2c | 4Gi |
OSD | 4c | 8Gi |
一个集群通常运行:
基于组件分布,单节点资源推荐如下:
CPU | 内存 |
---|---|
16c + (4c * 每节点 OSD 数量) | 20Gi + (8Gi * 每节点 OSD 数量) |
建议每节点部署不超过 12 个存储设备,有助于限制节点故障后的恢复时间。
建议使用企业级 SSD,单个设备容量不超过 10TiB,且所有磁盘大小和类型保持一致。
部署前需根据具体业务需求规划存储容量。默认分布式存储系统采用 3 副本冗余策略,因此可用容量为所有存储设备总原始容量除以 3。
以 30(N)节点(副本数 = 3)为例,可用容量示例如下:
存储设备大小(D) | 每节点存储设备数(M) | 总容量(DMN) | 可用容量(DMN/3) |
---|---|---|---|
0.5 TiB | 3 | 45 TiB | 15 TiB |
2 TiB | 6 | 360 TiB | 120 TiB |
4 TiB | 9 | 1080 TiB | 360 TiB |
主动容量规划
始终确保可用存储容量大于消耗容量。存储空间耗尽后,恢复需人工干预,无法通过删除或迁移数据自动解决。
容量告警
集群在两个阈值触发告警:
请及时处理告警并定期监控存储使用,避免服务中断。
扩容建议
分布式存储必须使用 HostNetwork。
网络分为两类:
为保证服务质量和性能稳定:
示例网络隔离配置
存储节点
业务集群节点
进入 管理员。
在左侧菜单点击 存储管理 > 分布式存储。
点击 立即创建。
在 部署 Operator 向导页面,点击右下角 部署 Operator 按钮。
在存储集群的 控制节点 执行命令。
参数说明:
- 10.0.1.0/24
)。- 10.0.2.0/24
)。使用磁盘的 World Wide Name (WWN) 进行稳定命名,避免依赖重启后可能变化的设备路径如 sdb
。
提供三种存储池类型,根据业务需求选择创建。
在存储集群的 控制节点 执行命令。
在存储集群的 控制节点 执行命令。
在存储集群的 控制节点 执行命令。
当其他集群需要使用分布式存储服务时,请参考以下指南。
访问存储服务