Tracing 全链路追踪为什么需要链路追踪？随着互联网业务快速扩展，软件架构也日益变得复杂，为了适应海量用户高并发请

随着互联网业务快速扩展，软件架构也日益变得复杂，为了适应海量用户高并发请求，系统中越来越多的组件开始走向分布式化，如单体架构拆分为微服务、服务内缓存变为分布式缓存、服务组件通信变为分布式消息，这些组件共同构成了复杂的分布式网络。

就目前我们国际化的项目来说，目前就三个系统分为订单系统、商户系统、支付系统。如果用户通过浏览器进行下单，结果系统给用户提示：系统内部错误，估计用户是很崩溃的。然后运营人员又将问题抛给开发人员，开发人员只知道有异常，但异常由哪个服务引起的就需要开发人员借助业务日志逐个进行排查，效率不是很高。

那有没有更好的解决方案呢？那就是全链路追踪。

链路追踪其实简单来说，就是发起一次请求执行的全过程。链路追踪就是将一次分布式请求还原成调用链路，将一次分布式请求的调用情况集中展示，比如各个服务节点上的耗时、请求具体到达哪台机器上、每个服务节点的请求状态等等。

链路跟踪主要功能：
- 故障快速定位：可以通过调用链结合业务日志快速定位错误信息。
- 链路性能可视化：各个阶段链路耗时、服务依赖关系可以通过可视化界面展现出来。
- 链路分析：通过分析链路耗时、服务依赖关系可以得到用户的行为路径，汇总分析应用在很多业务场景。

链路追踪系统最早是由Goggle公开发布的一篇论文《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》被大家广泛熟悉，主要讲述了Dapper链路追踪系统的基本原理和关键技术点。在链路追踪中有几个比较重要的概念。
1. Trace
Trace: 就是链路。对应的就是一个完整的链路。本身就是一个树形结构。
图中一条完整的链路是：用户 -> 服务A -> 服务B -> 服务C -> 服务D -> 服务C -> 服务A -> 用户。服务间经过的局部链路构成了一条完整的链路，其中每一条局部链路都用一个全局唯一的traceid来标识。
1. Span
在上图中可以看出来请求经过了服务A，同时服务A又调用了服务B和服务C，但是先调的服务B还是服务C呢？
为了表达这种父子关系引入了Span的概念。
同一层级parent id相同，span id不同，span id从小到大表示请求的顺序，从下图中可以很明显看出服务A是先调了服务B然后再调用了C。
上下层级代表调用关系，如下图服务C的span id为2，服务D的parent id为2，这就表示服务C和服务D形成了父子关系，很明显是服务C调用了服务D。

下面对比一下几个开源组件，方便日后大家做技术选型。

Tracing 全链路追踪