按照【KaiwuDB Tracing（一）】介绍的使用 opentracing 要求，本文着重介绍 KaiwuDB Tracing 模块中是如何实现 Span，SpanContexts 和 Tracer 的。

Part 1 - Tracing 模块调用关系

1.1 Traincg 模块包含的文件列表

Tracer.go ：定义了opentracing 中的trace相关接口的实现。

Tracer_span.go ：定义了opentracing中的span 相关操作的实现。

Tags.go ：定义了 opentracing中关于tags的相关接口。

Shadow.go ：不是opentracing中的概念，这里主要实现与zipkin的通信，用于tracing 信息推送到外部的zipkin中。

1.2 各个文件之间的调用关系

在 cluster_settings.go 中会创建 tracer，供全局使用，其他模块中使用这个 Tracer 实现 span 的创建和其他操作，例如设定 span 名称、设定 tag 、增加 log 等操作。

Part 2 - Opentracing

在 KaiwuDB 中的实现

以下是只是列出了部分接口实现，并非全部。

2.1 Span 接口实现：

GetContext 实现：API 用于获取 Span 中的 SpanContext，主要功能是先创建一个 map[string]string 类型的 baggageCopy, 将 span 中的 mu.Baggage 读出写入 baggageCopy，创建新的 spanContext，并且返回。

Finished 实现：API 用于结束一个 Span 的记录和追踪。

SetTag 实现：用于向指定的 Span 添加 Tag 信息。

Log 实现：用于向指定的 Span 添加 Log 信息。

SetBaggageItem 实现：用于向指定的 Span 增加 Baggage 信息，主要是用于跨进程追踪使用。

BaggageItem 实现：用于获取指定的 Baggage 信息。

SetOperationName 实现：用于设定 Span 的名称。

Tracer 实现：用于获取 Span 属于哪个 Tracer。

2.2 SpanContext 接口实现：

ForeachBaggageItem 实现：用于遍历 spanContext 中的 baggage 信息。

2.3 Tracer 接口实现：

Inject 实现：用于向 carrier 中注入 SpanContext 信息

Extract 实现：用于从 carrier 中抽取出 SpanContext 信息。

   // We only support the HTTPHeaders/TextMap format.
   if format != opentracing.*HTTPHeaders* && format != opentracing.*TextMap* {
      return noopSpanContext{}, opentracing.ErrUnsupportedFormat
   }

   mapReader, ok := carrier.(opentracing.TextMapReader)
   if !ok {
      return noopSpanContext{}, opentracing.ErrInvalidCarrier
   }

   var sc spanContext
 ……

   err := mapReader.ForeachKey(func(k, v string) error {
      switch k = strings.ToLower(k); k {
      case *fieldNameTraceID*:
         var err error
         sc.TraceID, err = strconv.ParseUint(v, 16, 64)
         if err != nil {
            return opentracing.ErrSpanContextCorrupted
         }
      case *fieldNameSpanID*:
         var err error
         sc.SpanID, err = strconv.ParseUint(v, 16, 64)
         if err != nil {
            return opentracing.ErrSpanContextCorrupted
         }
      case *fieldNameShadowType*:
         shadowType = v
      default:
         if strings.HasPrefix(k, *prefixBaggage*) {
            if sc.Baggage == nil {
               sc.Baggage = make(map[string]string)
            }
            sc.Baggage[strings.TrimPrefix(k, *prefixBaggage*)] = v
         } else if strings.HasPrefix(k, *prefixShadow*) {
            if shadowCarrier == nil {
               shadowCarrier = make(opentracing.TextMapCarrier)
            }
            // We build a shadow textmap with the original shadow keys.
            shadowCarrier.Set(strings.TrimPrefix(k, *prefixShadow*), v)
         }
      }
      return nil
   })
   if err != nil {
      return noopSpanContext{}, err
   }
   if sc.TraceID == 0 && sc.SpanID == 0 {
      return noopSpanContext{}, nil
   }

   ……
   return &sc, nil
}

StartSpan 接口实现：用于创建一个新的 Span，可根据传入不同 opts 来实现不同 Span 的初始化。

2.4 noop span 实现：

noop span 实现：使监控代码不依赖 Tracer 和 Span 的返回值，防止程序异常退出。

Part3 - KaiwuDB 中

Opentracing 简单使用示例

3.1 开启 Tracer Recording 测试

KaiwuDB 中开始创建的 span 均是 no operator span, 需要手动调用 StartRecording, 将 span 转换为可 record 状态，才能正常对 span 进行操作。

3.2 创建 childSpan 测试

测试 StartChildSpan，根据已有 span 创建出一个新的 span，为已有 span 的子 span。

func TestStartChildSpan(t *testing.T) {

 tr := NewTracer()

 sp1 := tr.StartSpan("parent", Recordable)

 StartRecording(sp1, SingleNodeRecording)

 sp2 := StartChildSpan("child", sp1, nil /* logTags */, false /*separateRecording*/)

 sp2.Finish()

 sp1.Finish()

 if err := TestingCheckRecordedSpans(GetRecording(sp1), `

  span parent:

   span child:

 `); err != nil {

  t.Fatal(err)

 }



 sp1 = tr.StartSpan("parent", Recordable)

 StartRecording(sp1, SingleNodeRecording)

 sp2 = StartChildSpan("child", sp1, nil /* logTags */, true /*separateRecording*/)

 sp2.Finish()

 sp1.Finish()

 if err := TestingCheckRecordedSpans(GetRecording(sp1), `

  span parent:

 `); err != nil {

  t.Fatal(err)

 }

 if err := TestingCheckRecordedSpans(GetRecording(sp2), `

  span child:

 `); err != nil {

  t.Fatal(err)

 }



 sp1 = tr.StartSpan("parent", Recordable)

 StartRecording(sp1, SingleNodeRecording)

 sp2 = StartChildSpan(

  "child", sp1, logtags.SingleTagBuffer("key", "val"), false, /*separateRecording*/

 )

 sp2.Finish()

 sp1.Finish()

 if err := TestingCheckRecordedSpans(GetRecording(sp1), `

  span parent:

   span child:

    tags: key=val

 `); err != nil {

  t.Fatal(err)

 }

}

3.3 跨进程追踪测试

测试跨进程追踪功能，主要是测试 inject 接口和 extract 接口，Inject 用于向 carrier 中注入 SpanContext 信息，Extract 用于从 carrier 中抽取出 SpanContext 信息。

func TestTracerInjectExtract(t *testing.T) {

 tr := NewTracer()

 tr2 := NewTracer()


 // Verify that noop spans become noop spans on the remote side.


 noop1 := tr.StartSpan("noop")

 if _, noop := noop1.(*noopSpan); !noop {

  t.Fatalf("expected noop span: %+v", noop1)

 }

 carrier := make(opentracing.HTTPHeadersCarrier)

 if err := tr.Inject(noop1.Context(), opentracing.HTTPHeaders, carrier); err != nil {

  t.Fatal(err)

 }

 if len(carrier) != 0 {

  t.Errorf("noop span has carrier: %+v", carrier)

 }


 wireContext, err := tr2.Extract(opentracing.HTTPHeaders, carrier)

 if err != nil {

  t.Fatal(err)

 }

 if _, noopCtx := wireContext.(noopSpanContext); !noopCtx {

  t.Errorf("expected noop context: %v", wireContext)

 }

 noop2 := tr2.StartSpan("remote op", opentracing.FollowsFrom(wireContext))

 if _, noop := noop2.(*noopSpan); !noop {

  t.Fatalf("expected noop span: %+v", noop2)

 }

 noop1.Finish()

 noop2.Finish()


 // Verify that snowball tracing is propagated and triggers recording on the

 // remote side.


 s1 := tr.StartSpan("a", Recordable)

 StartRecording(s1, SnowballRecording)


 carrier = make(opentracing.HTTPHeadersCarrier)

 if err := tr.Inject(s1.Context(), opentracing.HTTPHeaders, carrier); err != nil {

  t.Fatal(err)

 }


 wireContext, err = tr2.Extract(opentracing.HTTPHeaders, carrier)

 if err != nil {

  t.Fatal(err)

 }

 s2 := tr2.StartSpan("remote op", opentracing.FollowsFrom(wireContext))


 // Compare TraceIDs

 trace1 := s1.Context().(*spanContext).TraceID

 trace2 := s2.Context().(*spanContext).TraceID

 if trace1 != trace2 {

  t.Errorf("TraceID doesn't match: parent %d child %d", trace1, trace2)

 }

 s2.LogKV("x", 1)

 s2.Finish()


 // Verify that recording was started automatically.

 rec := GetRecording(s2)

 if err := TestingCheckRecordedSpans(rec, `

  span remote op:

   tags: sb=1

   x: 1

 `); err != nil {

  t.Fatal(err)

 }


 if err := TestingCheckRecordedSpans(GetRecording(s1), `

  span a:

   tags: sb=1 unfinished=

 `); err != nil {

  t.Fatal(err)

 }


 if err := ImportRemoteSpans(s1, rec); err != nil {

  t.Fatal(err)

 }

 s1.Finish()


 if err := TestingCheckRecordedSpans(GetRecording(s1), `

  span a:

   tags: sb=1

  span remote op:

   tags: sb=1

   x: 1

 `); err != nil {

  t.Fatal(err)

 }

}

KaiwuDB 分布式数据库 Tracing（二）—— 源码解析