指标用于量化描述系统的运行状态,每个指标包含四个基本要素:
cpu_usage
85.5
{pod="nginx-1", namespace="default"}
PromQL 是 Prometheus 的查询语言,用于从监控系统中查询和聚合指标数据。
平台基于长期运维经验,预置了一系列常用的监控指标。您可以在配置告警规则或创建监控面板时直接使用这些指标,无需额外配置。
Exporter 是用于收集监控数据的组件,主要职责包括:
ServiceMonitor 用于声明性地管理监控配置,主要定义:
告警规则定义了触发告警的具体条件:
告警策略将多个告警规则组合在一起进行统一配置:
通知策略管理发送告警消息的规则:
通知模板自定义告警消息的展示格式:
面板是多个相关图表的集合,为系统状态提供整体视图。支持灵活的布局安排,可以按行或列组织图表。
图表是监控数据的可视化表示,支持多种展示类型。
监控数据源的配置。目前仅支持当前集群的监控组件作为数据源,暂不支持自定义数据源。
变量作为值的占位符,可用于指标查询。通过面板顶部的变量选择器,您可以动态调整查询条件,使图表内容实时更新。