介绍

Monitoring 模块是 ACP 平台可观测性套件的核心组件,为平台管理员和运维团队提供全面的监控和告警能力。

该模块提供四项关键的监控功能:

  • 指标采集,用于实时收集集群、节点、应用和容器的性能数据
  • 仪表盘,用于直观展示和分析系统健康状况及性能趋势
  • 告警,通过可定制的规则和阈值实现问题的主动检测
  • 通知,及时将告警信息传达给运维人员

通过与 Prometheus 和 VictoriaMetrics 等开源组件的集成,该模块帮助组织维护系统可靠性,防止停机,降低运维成本,并确保整个基础设施的最佳性能。