Monitoring Component Selection Guide

在安装集群监控时,平台提供了两种监控组件供您选择:VictoriaMetrics 和 Prometheus。本文将详细介绍这两种组件的特点及适用场景,帮助您做出最合适的选择。

目录

重要说明

  • 安装集群监控组件时,只能选择 VictoriaMetrics 或 Prometheus 其中之一。
  • 从版本 3.18 开始,VictoriaMetrics 已升级为 Beta 状态,满足生产环境使用条件。
  • VictoriaMetrics 适用于高可用需求及多集群监控场景。
  • Prometheus 适用于单集群监控场景,尤其是规模较小的情况。

组件列表

Prometheus 相关组件

组件名称功能描述
Prometheus Server负责采集、存储和查询监控数据的核心服务器
Exporters监控数据采集组件,通过 HTTP 接口暴露监控指标
AlertManager告警管理中心,负责告警规则和通知处理
PushGateway支持监控数据的推送模式,适用于特殊网络环境下的数据传输

VictoriaMetrics 相关组件

组件名称功能描述
VMStorage监控数据存储引擎
VMInsert负责数据分发和存储的数据写入组件
VMSelect提供数据查询能力的查询服务组件
VMAlert告警规则评估和处理组件
VMAgent监控指标采集组件

架构对比

Prometheus 架构

Prometheus 是成熟的开源监控系统,是 CNCF 继 Kubernetes 之后的第二个毕业项目,具有以下特点:

  • 强大的数据采集能力。
  • 灵活的查询语言 PromQL。
  • 完善的生态系统。
  • 支持千节点规模的集群监控。

VictoriaMetrics 架构

VictoriaMetrics 是下一代高性能时序数据库和监控解决方案,具备以下优势:

  • 更高的数据压缩率。
  • 更低的资源消耗。
  • 原生支持集群高可用。
  • 运维管理更简便。

功能对比

功能PrometheusVictoriaMetrics说明
高可用安装VictoriaMetrics 支持真正的集群高可用,且数据一致性更好
单节点安装两者均支持单节点安装模式
长期数据存储需要远程存储原生支持VictoriaMetrics 更适合长期数据存储
资源效率较高更优VictoriaMetrics 资源利用率更高
社区支持非常成熟快速发展Prometheus 拥有更大的社区生态

安装方案建议

监控安装架构概览

上图展示了平台支持的监控组件安装架构及数据流向。平台提供以下两种安装方式供选择:

注意:更换监控组件时,请确保已完全卸载现有组件,且监控数据不支持跨组件迁移。

Prometheus 安装方式

该方式对应上图中的 cluster4 架构:

  • 使用 Prometheus 组件采集和处理监控数据。
  • 通过监控面板查询和展示数据。
  • 适用于单集群场景。

VictoriaMetrics 安装方式

VictoriaMetrics 支持以下两种安装模式:

  1. 单集群安装模式

    • 对应上图中的 cluster2 架构。
    • 所有 VictoriaMetrics 组件安装在同一集群内。
    • 使用 VMAgent 采集数据并写入 VictoriaMetrics。
    • VMAlert 负责告警规则评估。
    • 通过监控面板查询和展示数据。 提示:建议数据规模低于每秒 100 万时使用此模式。
  2. 多集群安装模式

    • 对应上图中的 cluster1/cluster2/cluster3 架构。
    • 在业务集群中安装 VMAgent 作为数据采集智能体。
    • VMAgent 将数据写入中央监控集群中的 VictoriaMetrics。
    • 支持多集群统一监控管理。 提示:安装 VMAgent 前,请确保监控集群已安装 VictoriaMetrics 服务。

选择建议

适合使用 VictoriaMetrics 的场景

  • 高性能与可扩展性需求:适合处理高吞吐量数据和长期存储的监控场景。
  • 成本效益考虑:需要优化存储和计算资源成本。
  • 高可用需求:需要监控组件的高可用保障。
  • 多集群管理:需要跨多个集群统一管理监控数据。

适合使用 Prometheus 的场景

  • 单集群小规模:监控规模较小,无高可用需求。
  • 已有 Prometheus 用户:已有完整的 Prometheus 监控体系。
  • 简单稳定需求:追求简单可靠的监控方案。
  • 深度生态集成:与 Prometheus 生态紧密集成,迁移成本较高。