内嵌 Grafana 面板中的监控数据可用于从资源、性能等方面进行 Kafka 监控与告警,且支持配置通知策略。
平台默认收集 Kafka 的资源、性能及容量相关常用监控指标。实例的 监控 页签中提供了各指标的实时监控数据。
类别 | 指标 |
---|---|
资源监控 | 内存使用量、CPU 使用量、JVM 内存使用量等 |
性能监控 | 生产者请求速率、传入消息速率等 |
其他 | 日志大小等 |
支持使用平台通用的告警功能。进入 Alauda Application Services 的 告警 > 规则 页面,可为 Kafka 创建以下告警策略。
类型 | 监控对象 |
---|---|
指标告警 | 预定义的资源指标,仅适用于容器组层面,例如容器组的内存使用率。 |
自定义告警 | Kafka 性能指标。 |
配置告警策略:为启用告警,请先在 Alauda Application Services 中创建告警策略。告警策略描述了您希望监控的对象、在什么情况下希望收到告警,以及如何被通知相关告警。
处理告警:当界面提示有处于告警状态的规则时,请及时处理。
绑定通知策略:除了查看实时通知外,平台还支持通过邮件、短信等方式将告警信息发送给相关人员,通知其采取必要措施解决问题或防止故障发生。通知策略需在平台管理中设置。