ALB 监控

目录

术语

术语描述
ALB平台自研的第七层负载均衡器。

操作步骤

  1. 进入 管理员

  2. 在左侧导航栏,点击 运维中心 > 监控 > 监控面板

  3. 点击页面顶部的 集群,切换到要监控的集群。

  4. 点击页面右上角的 切换

  5. 你可以通过以下两种方式进入 ALB 状态 监控面板:

    • 方式一:点击 container-platform 卡片展开监控目录,然后点击 ALB 状态 名称进入监控面板。需要时可以将该监控面板设置为主面板。

    • 方式二:在搜索框输入关键词(例如 alb)进行搜索,然后点击 ALB 状态 名称进入监控面板。需要时可以将该监控面板设置为主面板。

  6. 通过监控面板查看各项监控指标。

    • 选择监控的命名空间:点击页面顶部的 命名空间,选择要监控的命名空间,默认全部,表示监控所有命名空间。

    • 选择监控的 ALB:点击页面顶部的 名称,选择要监控的 ALB,默认全部,表示监控所有 ALB。

监控指标

展示所选 ALB 在 最近 5 分钟 内的总流量、资源使用情况、Ingress(入站规则)、HTTPRoute(HTTPRoute 类型的路由规则)和 Rule(既非 Ingress 也非 HTTPRoute 的规则)的监控指标。

注意:所有数据均为 最近 5 分钟 内采集的监控数据。

ALB 流量监控

监控指标描述
活动连接数所选 ALB 上的活动连接数。
每秒请求数所选 ALB 每秒接收的请求总数。
错误率所选 ALB 每秒发生的 4XX(如 404)和 5XX 错误请求的比例。
延迟所选 ALB 上请求的平均延迟。

ALB 资源使用情况

监控指标描述
CPU 使用率所选 ALB 的 CPU 使用率。
内存使用率所选 ALB 的内存使用率。
网络接收/发送所选 ALB 的网络 I/O 吞吐量。
磁盘读写速率所选 ALB 的磁盘 I/O 吞吐量。

Ingress、HTTPRoute、Rule 流量监控

监控指标描述
QPS(每秒查询数)所选 ALB 上 Ingress/HTTPRoute/Rule 每秒接收的请求数,默认单位为 req/s。
请求 BPS(每秒字节数)所选 ALB 上 Ingress/HTTPRoute/Rule 每秒接收的请求总大小。
响应 BPS(每秒字节数)所选 ALB 上 Ingress/HTTPRoute/Rule 发送的响应总大小。
错误率所选 ALB 上 Ingress/HTTPRoute/Rule 处理请求时发生错误的百分比。
P50、P90、P99所选 ALB 上请求的响应时间,具体为中位响应时间。表示 50%、90% 和 99% 的请求响应时间小于或等于该值。

注意:P50、P90 和 P99 的原理是将采集的数据从小到大排序,取位于 50%、90% 和 99% 位置的数据值;因此,采集的 50%、90% 和 99% 的数据均低于该值。百分位数有助于分析数据分布并识别各种极端情况。
上游 P50、上游 P90、上游 P99上游服务的请求响应时间。表示发送到上游服务的请求中,50%、90% 和 99% 的响应时间小于或等于该值。