介绍
目录
Module Overview
该平台集成了 Kubernetes 事件,记录 Kubernetes 资源的重要状态变化及各种运行状态变更。同时提供存储、查询和可视化能力。当集群、节点或 Pod 等资源出现异常时,用户可以通过分析事件来确定具体原因。
基于事件中识别的根因,用户可以为工作负载创建告警策略。当关键事件数量达到告警阈值时,可自动触发告警,通知相关人员及时干预,从而降低平台的运维风险。
Functionality Overview
事件模块主要提供以下功能:
事件采集与持久化
- 自动采集:模块会自动采集 Kubernetes 集群中发生的所有事件,包括 Pod 创建、删除、调度失败等。
- 持久化存储:采集到的事件将被持久化存储,确保用户可以根据需要回溯历史事件。
事件查询
- 灵活查询:用户可以根据多种条件(如事件类型、命名空间、资源名称等)查询事件,快速定位问题。
- 时间范围过滤:支持按时间范围查询事件,方便用户查看特定时间段内的集群活动。
事件汇总与展示
- 事件汇总:模块会对事件进行汇总并生成统计信息,帮助用户了解集群的整体状态。
Use Cases
事件模块适用于以下场景:
- 集群监控:通过实时监控 Kubernetes 事件,用户可以及时发现集群异常。
- 故障排查:当集群出现问题时,用户可以通过查询事件日志快速定位根因。
- 性能优化:通过分析事件数据,用户可以了解集群中的资源使用情况,优化资源分配。
Usage Limitations
该功能依赖于日志系统。请确保平台内已安装 ACP Log Collector 和 ACP Log Storage 插件。