查询追踪

特性概述

分布式追踪查询功能通过收集服务之间调用的元数据信息,为微服务架构提供全链路追踪能力,帮助用户快速定位跨服务调用问题。此功能主要解决以下问题:

  • 请求链追踪:恢复复杂分布式系统中的完整请求路径。
  • 性能瓶颈分析:识别链路中时间消耗异常的调用节点。
  • 故障根因定位:通过错误标记快速定位问题发生点。

适用场景包括:

  • 快速定位生产环境故障排查中的异常服务。
  • 在性能调优过程中识别高延迟调用链路。
  • 在新版本发布后验证服务间调用关系。

核心价值:

  • 增强分布式系统的可观测性。
  • 降低平均恢复时间(MTTR)。
  • 优化服务间调用性能。

主要特性

  • 多维查询:支持 9 种查询条件组合,如 TraceID、服务名称、标签等。
  • 可视化分析:通过时间序列瀑布图直观展示调用层级和时间分布。
  • 精确定位:支持按错误 Span 过滤和标签进行二次搜索。

特性优势

  • 快速问题识别:通过多维查询条件缩小检查范围,加速问题定位。
  • 可视化展示:使用时间序列瀑布图直观展示调用关系,降低复杂性,提高故障分析效率。
  • 灵活多样:支持简单查询和复杂组合,适应各种运维和开发场景。

追踪查询

第一步:组合查询条件

提示:查询条件可以组合使用。您可以通过添加多个查询条件来细化查询。

查询条件描述
TraceID完整链路的唯一标识符,可用于查询指定的追踪。
服务发起/接收调用请求的服务或入口网关(必需输入)。格式为 <service/gateway name>.<namespace name>,例如 bookinfo-gw.bookinfo-ns
客户端发起调用请求的客户端服务或入口网关(必需输入)。格式为 <service/gateway name>.<namespace name>
服务器响应调用请求的服务器服务或入口网关(必需输入)。格式为 <service/gateway name>.<namespace name>
APIServices > API 中为服务添加的 API。
标签您可以通过输入标签(Tag)来过滤查询结果。支持的标签包括在 Span 详情中找到的标签。
Span 时长 >时长大于或等于 输入值(毫秒)的 Spans。
仅错误追踪错误 Spans 是指其标签值 errortrue 的 Spans。
Span 种类根 Span:搜索由配置的 服务 发起的根 Spans。当配置的服务是整个调用请求的发起者时使用此搜索模式。
服务入口 Span:搜索当配置的 服务 被调用作为服务器时生成的第一个 Span。
最大查询计数可查询的最大 Span 数量,默认为 200
提示:出于性能考虑,平台一次最多可显示 1000 个 Spans。如果符合查询条件的 Spans 数量超过 最大查询计数,可以细化查询条件或缩小时间范围进行分阶段查询。

第二步:执行查询

  • 选择查询条件并输入相应值后,点击 添加到查询 按钮,当前条件将在 查询 结果区域显示,触发查询。
  • 您还可以展开 常用搜索条件,快速添加最近使用的搜索条件。

查询结果分析

输入查询条件并搜索后,页面上将生成查询结果区域。

Span 列表

查询结果区域左侧显示符合条件的 Span 列表及其基本信息,包括:服务名称、被调用接口或请求处理方法、时长和开始时间。

时间序列瀑布图

查询结果区域右侧的时间序列瀑布图清晰地显示了单个追踪中 Spans 之间的调用关系。使用时间序列瀑布图进行追踪分析的主要特点如下:

  1. 自上而下的扩展:在时间序列瀑布图中,各种调用事件 (Spans) 通常从图表顶部向下扩展,每个水平条形代表一个服务调用或过程。其位置通常反映操作的逻辑调用顺序。
  2. 时间轴对齐:时间序列瀑布图的横轴表示时间。每个条形的长度表示该调用的持续时间,可以直观比较不同调用之间的时间关系。
  3. 缩进描述:缩进表示调用的层次关系,缩进越深表示在该链路中的调用深度越大。
  4. 交互性和详细数据展示:点击时间序列瀑布图中的条形可显示该调用的更详细信息。

Span 详情

通过点击时间序列瀑布图中 Span 的行,可以展开并查看关于该 Span 的详细信息,包括:

  • 服务:Span 中的服务。
  • Span 时长(毫秒):Span 的持续时间。
  • URL:服务访问的 URL,对应 Span 标签中的 http.url
  • 标签:由键值对组成的 Span 标签信息,可用于高级搜索标签查询条件。点击标签旁边的按钮,可以将当前标签条件添加到查询条件中,以获得更精确的查询结果。
  • JSON:Span 的原始 JSON 结构,允许进一步检查其内部信息。