链路分析
简介
链路数据采集到 DataFlux 后,可以通过 DataFlux Studio 控制台查看链路对应的服务关键性能指标,同时也可以对链路进行追踪和分析。
服务列表和关键性能指标
登录控制台后,点击 「链路追踪」,即可查看时间范围内的所有服务列表及其对应的关键性能指标,你可以通过右上角的时间筛选组件筛选时间范围,默认情况下,页面数据会自动进行更新。链路追踪服务列表的对应的关键性能指标包括“平均每秒请求数”、“平均响应时间”、“P75响应时间”、“P95响应时间”和“错误数”。
Apdex 设置
Apdex(应用程序性能指数)是由 Apdex 联盟开放的用于评估应用性能的工业标准。通过测量Web应用程序和服务的响应时间,提供了一个统一的测量和报告用户体验的方法,将其量化为范围为 0-1 的满意度评价,把最终用户的体验和应用性能作为一个完整的指标进行统一度量。
Apdex 指数计算公式:Apdext = (Satisfied Count + Tolerating Count / 2) / Total Samples
其中用户可自定义服务 Apdex 的 忍受时间(Tolerating Time),点击服务右侧的「设置」按钮,输入时间即可。需要注意的是,Tolerating Time 仅可设置为整数,最小为 1 s,最大为 10 s。
服务拓扑图
在「服务」中支持切换至拓扑图模式,可清晰查看各个服务间的调用关系。鼠标悬浮在服务节点处,可查看该服务的“请求数”、“平均响应时间”、“P99响应时间”和“错误数”。
所有服务都可“下钻”查看该指标相关的所有服务调用;同时支持基于服务查看「相关链路」「相关日志」「相关指标」「相关对象」和「相关事件」
链路查询和分析
在链路追踪服务列表,点击服务名后会自动跳转至服务「链路」页面,并过滤出对应服务的所有相关链路数据。
链路统计
链路页面的左侧为筛选区域,用户可通过标签和指标对链路进行筛选,右侧实时显示筛选结果。系统自动统计所选时间范围内链路的“请求数”、“错误请求数”、“响应时间”并展示所有的 span 列表。
1)请求数/错误请求数
根据所选时间范围划分为 60 个时间点,用柱状图统计展示链路的“请求数”以及“错误请求数”。
2)响应时间
根据所选时间范围划分为 60 个时间点,用折线图统计展示四个响应指标,分别为“每秒平均响应时间”、“P75响应时间”、“P90响应时间”以及“P99响应时间”
3)span 列表
span 表示给定时间段内分布式系统中的逻辑工作单元,多个 span 会构成一条链路轨迹。
列表中展示 span 的“发生时间”、“操作名”、“服务名”、“状态”以及“持续时间”,可用户自定义。
链路详情
点击 span 列表可查看所属的链路详情,包含链路所有相关的「标签」、「火焰统计图」和「span 列表」
火焰图
火焰图可清晰展示整条链路中每个 span 的流转和执行时间。右侧会显示对应的服务列表及响应时间。
说明:如上图所示是一条用户登陆的链路,用户点击「登陆」后首先启动 front
服务并调用 login
span,大约1ms后 mysql
服务开始运行check
span 进行数据库验证,2ms后veritycode
服务运行true
span 进行验证码验证,然后在 3ms 时backend
服务运行auth
开始权限认证,最后database
服务启动insert
完成数据库插入。
span 列表
展示该条链路中所有的 span 列表,包括“服务名”、“ span 名” 、“span 个数”、“执行时间”、“执行时间占比”以及 Json 下的 spanid。
链路设置
- 全局设置
在服务「链路」页面,用户可以根据需要,对“左侧的筛选栏”和“统计图表”进行隐藏。
- 列表设置
对于链路列表,可以添加、编辑、删除显示列。