介绍

目录

Module Overview

该平台集成了 Kubernetes 事件,记录 Kubernetes 资源的重要状态变化及各种运行状态变更。同时提供存储、查询和可视化能力。当集群、节点或 Pod 等资源出现异常时,用户可以通过分析事件来确定具体原因。

基于事件中识别的根因,用户可以为工作负载创建告警策略。当关键事件数量达到告警阈值时,可自动触发告警,通知相关人员及时干预,从而降低平台的运维风险。

Functionality Overview

事件模块主要提供以下功能:

事件采集与持久化

  • 自动采集:模块会自动采集 Kubernetes 集群中发生的所有事件,包括 Pod 创建、删除、调度失败等。
  • 持久化存储:采集到的事件将被持久化存储,确保用户可以根据需要回溯历史事件。

事件查询

  • 灵活查询:用户可以根据多种条件(如事件类型、命名空间、资源名称等)查询事件,快速定位问题。
  • 时间范围过滤:支持按时间范围查询事件,方便用户查看特定时间段内的集群活动。

事件汇总与展示

  • 事件汇总:模块会对事件进行汇总并生成统计信息,帮助用户了解集群的整体状态。

Use Cases

事件模块适用于以下场景:

  • 集群监控:通过实时监控 Kubernetes 事件,用户可以及时发现集群异常。
  • 故障排查:当集群出现问题时,用户可以通过查询事件日志快速定位根因。
  • 性能优化:通过分析事件数据,用户可以了解集群中的资源使用情况,优化资源分配。

Usage Limitations

该功能依赖于日志系统。请确保平台内已安装 ACP Log Collector 和 ACP Log Storage 插件。