search
链路追踪 链路分析

链路分析

简介

链路数据采集到 DataFlux 后,可以通过 DataFlux Studio 控制台查看链路对应的服务关键性能指标,同时也可以对链路进行追踪和分析。

服务列表和关键性能指标

登录控制台后,点击 「链路追踪」,即可查看时间范围内的所有服务列表及其对应的关键性能指标,你可以通过右上角的时间筛选组件筛选时间范围,默认情况下,页面数据会自动进行更新。链路追踪服务列表的对应的关键性能指标包括“平均每秒请求数”、“平均响应时间”、“P75响应时间”、“P95响应时间”和“错误数”。

Apdex 设置

Apdex(应用程序性能指数)是由 Apdex 联盟开放的用于评估应用性能的工业标准。通过测量Web应用程序和服务的响应时间,提供了一个统一的测量和报告用户体验的方法,将其量化为范围为 0-1 的满意度评价,把最终用户的体验和应用性能作为一个完整的指标进行统一度量。

Apdex 指数计算公式:Apdext = (Satisfied Count + Tolerating Count / 2) / Total Samples

其中用户可自定义服务 Apdex 的 忍受时间(Tolerating Time),点击服务右侧的「设置」按钮,输入时间即可。需要注意的是,Tolerating Time 仅可设置为整数,最小为 1 s,最大为 10 s。

服务拓扑图

在「服务」中支持切换至拓扑图模式,可清晰查看各个服务间的调用关系。鼠标悬浮在服务节点处,可查看该服务的“请求数”、“平均响应时间”、“P99响应时间”和“错误数”。

所有服务都可“下钻”查看该指标相关的所有服务调用;同时支持基于服务查看「相关链路」「相关日志」「相关指标」「相关对象」和「相关事件」

链路查询和分析

在链路追踪服务列表,点击服务名后会自动跳转至服务「链路」页面,并过滤出对应服务的所有相关链路数据。

链路统计

链路页面的左侧为筛选区域,用户可通过标签和指标对链路进行筛选,右侧实时显示筛选结果。系统自动统计所选时间范围内链路的“请求数”、“错误请求数”、“响应时间”并展示所有的 span 列表。

1)请求数/错误请求数

根据所选时间范围划分为 60 个时间点,用柱状图统计展示链路的“请求数”以及“错误请求数”。

2)响应时间

根据所选时间范围划分为 60 个时间点,用折线图统计展示四个响应指标,分别为“每秒平均响应时间”、“P75响应时间”、“P90响应时间”以及“P99响应时间”

3)span 列表

span 表示给定时间段内分布式系统中的逻辑工作单元,多个 span 会构成一条链路轨迹。

列表中展示 span 的“发生时间”、“操作名”、“服务名”、“状态”以及“持续时间”,可用户自定义。

链路详情

点击 span 列表可查看所属的链路详情,包含链路所有相关的「标签」、「火焰统计图」和「span 列表」

火焰图

火焰图可清晰展示整条链路中每个 span 的流转和执行时间。右侧会显示对应的服务列表及响应时间。

说明:如上图所示是一条用户登陆的链路,用户点击「登陆」后首先启动 front 服务并调用 login span,大约1ms后 mysql 服务开始运行check span 进行数据库验证,2ms后veritycode服务运行true span 进行验证码验证,然后在 3ms 时backend服务运行auth开始权限认证,最后database服务启动insert完成数据库插入。

span 列表

展示该条链路中所有的 span 列表,包括“服务名”、“ span 名” 、“span 个数”、“执行时间”、“执行时间占比”以及 Json 下的 spanid。

链路设置

  • 全局设置

在服务「链路」页面,用户可以根据需要,对“左侧的筛选栏”和“统计图表”进行隐藏。

  • 列表设置

对于链路列表,可以添加、编辑、删除显示列。