KaiwuDB 分布式数据库 Tracing(二)—— 源码解析

252 阅读4分钟

按照【KaiwuDB Tracing(一)】介绍的使用 opentracing 要求,本文着重介绍 KaiwuDB Tracing 模块中是如何实现 Span,SpanContexts 和 Tracer 的。

Part 1 - Tracing 模块调用关系

1.1  Traincg 模块包含的文件列表

Tracer.go :定义了opentracing 中的trace相关接口的实现。

Tracer_span.go :定义了opentracing中的span 相关操作的实现。

Tags.go :定义了 opentracing中关于tags的相关接口。

Shadow.go :不是opentracing中的概念,这里主要实现与zipkin的通信,用于tracing 信息推送到外部的zipkin中。

1.2   各个文件之间的调用关系

在 cluster_settings.go 中会创建 tracer,供全局使用,其他模块中使用这个 Tracer 实现 span 的创建和其他操作,例如设定 span 名称、设定 tag 、增加 log 等操作。

 

Part 2 - Opentracing

在 KaiwuDB 中的实现

以下是只是列出了部分接口实现,并非全部。

2.1   Span 接口实现:

GetContext 实现:API 用于获取 Span 中的 SpanContext,主要功能是先创建一个 map[string]string 类型的 baggageCopy, 将 span 中的 mu.Baggage 读出写入 baggageCopy,创建新的 spanContext,并且返回。

1657607445669.png

Finished 实现:API 用于结束一个 Span 的记录和追踪。​​​​​​

1657607473281.png

SetTag 实现:用于向指定的 Span 添加 Tag 信息。

1657607502454.png

Log 实现:用于向指定的 Span 添加 Log 信息。

1657607524204.png

SetBaggageItem 实现:用于向指定的 Span 增加 Baggage 信息,主要是用于跨进程追踪使用。

1657607544525.png

BaggageItem 实现:用于获取指定的 Baggage 信息。

1657607564821.png

SetOperationName 实现:用于设定 Span 的名称。

1657607590635.png

Tracer 实现:用于获取 Span 属于哪个 Tracer。

1657607612518.png

2.2   SpanContext 接口实现:

ForeachBaggageItem 实现:用于遍历 spanContext 中的 baggage 信息。

1657607631534.png

2.3   Tracer 接口实现:

Inject 实现:用于向 carrier 中注入 SpanContext 信息

1657607658568.png

Extract 实现:用于从 carrier 中抽取出 SpanContext 信息。

   // We only support the HTTPHeaders/TextMap format.
   if format != opentracing.*HTTPHeaders* && format != opentracing.*TextMap* {
      return noopSpanContext{}, opentracing.ErrUnsupportedFormat
   }

   mapReader, ok := carrier.(opentracing.TextMapReader)
   if !ok {
      return noopSpanContext{}, opentracing.ErrInvalidCarrier
   }

   var sc spanContext
 ……

   err := mapReader.ForeachKey(func(k, v string) error {
      switch k = strings.ToLower(k); k {
      case *fieldNameTraceID*:
         var err error
         sc.TraceID, err = strconv.ParseUint(v, 16, 64)
         if err != nil {
            return opentracing.ErrSpanContextCorrupted
         }
      case *fieldNameSpanID*:
         var err error
         sc.SpanID, err = strconv.ParseUint(v, 16, 64)
         if err != nil {
            return opentracing.ErrSpanContextCorrupted
         }
      case *fieldNameShadowType*:
         shadowType = v
      default:
         if strings.HasPrefix(k, *prefixBaggage*) {
            if sc.Baggage == nil {
               sc.Baggage = make(map[string]string)
            }
            sc.Baggage[strings.TrimPrefix(k, *prefixBaggage*)] = v
         } else if strings.HasPrefix(k, *prefixShadow*) {
            if shadowCarrier == nil {
               shadowCarrier = make(opentracing.TextMapCarrier)
            }
            // We build a shadow textmap with the original shadow keys.
            shadowCarrier.Set(strings.TrimPrefix(k, *prefixShadow*), v)
         }
      }
      return nil
   })
   if err != nil {
      return noopSpanContext{}, err
   }
   if sc.TraceID == 0 && sc.SpanID == 0 {
      return noopSpanContext{}, nil
   }

   ……
   return &sc, nil
}

StartSpan 接口实现:用于创建一个新的 Span,可根据传入不同 opts 来实现不同 Span 的初始化。

1657607697658.png

2.4   noop span 实现:

noop span 实现:使监控代码不依赖 Tracer 和 Span 的返回值,防止程序异常退出。

1657607719324.png

 

Part3 - KaiwuDB 中

Opentracing 简单使用示例

3.1     开启 Tracer Recording 测试

KaiwuDB 中 开始创建的 span 均是 no operator span, 需要手动调用 StartRecording, 将 span 转换为可 record 状态,才能正常对 span 进行操作。

3.2     创建 childSpan 测试

测试 StartChildSpan,根据已有 span 创建出一个新的 span,为已有 span 的子 span。

func TestStartChildSpan(t *testing.T) {

 tr := NewTracer()

 sp1 := tr.StartSpan("parent", Recordable)

 StartRecording(sp1, SingleNodeRecording)

 sp2 := StartChildSpan("child", sp1, nil /* logTags */, false /*separateRecording*/)

 sp2.Finish()

 sp1.Finish()

 if err := TestingCheckRecordedSpans(GetRecording(sp1), `

  span parent:

   span child:

 `); err != nil {

  t.Fatal(err)

 }



 sp1 = tr.StartSpan("parent", Recordable)

 StartRecording(sp1, SingleNodeRecording)

 sp2 = StartChildSpan("child", sp1, nil /* logTags */, true /*separateRecording*/)

 sp2.Finish()

 sp1.Finish()

 if err := TestingCheckRecordedSpans(GetRecording(sp1), `

  span parent:

 `); err != nil {

  t.Fatal(err)

 }

 if err := TestingCheckRecordedSpans(GetRecording(sp2), `

  span child:

 `); err != nil {

  t.Fatal(err)

 }



 sp1 = tr.StartSpan("parent", Recordable)

 StartRecording(sp1, SingleNodeRecording)

 sp2 = StartChildSpan(

  "child", sp1, logtags.SingleTagBuffer("key", "val"), false, /*separateRecording*/

 )

 sp2.Finish()

 sp1.Finish()

 if err := TestingCheckRecordedSpans(GetRecording(sp1), `

  span parent:

   span child:

    tags: key=val

 `); err != nil {

  t.Fatal(err)

 }

}

3.3     跨进程追踪测试

测试跨进程追踪功能,主要是测试 inject 接口和 extract 接口,Inject 用于向 carrier 中注入 SpanContext 信息,Extract 用于从 carrier 中抽取出 SpanContext 信息。

func TestTracerInjectExtract(t *testing.T) {

 tr := NewTracer()

 tr2 := NewTracer()


 // Verify that noop spans become noop spans on the remote side.


 noop1 := tr.StartSpan("noop")

 if _, noop := noop1.(*noopSpan); !noop {

  t.Fatalf("expected noop span: %+v", noop1)

 }

 carrier := make(opentracing.HTTPHeadersCarrier)

 if err := tr.Inject(noop1.Context(), opentracing.HTTPHeaders, carrier); err != nil {

  t.Fatal(err)

 }

 if len(carrier) != 0 {

  t.Errorf("noop span has carrier: %+v", carrier)

 }


 wireContext, err := tr2.Extract(opentracing.HTTPHeaders, carrier)

 if err != nil {

  t.Fatal(err)

 }

 if _, noopCtx := wireContext.(noopSpanContext); !noopCtx {

  t.Errorf("expected noop context: %v", wireContext)

 }

 noop2 := tr2.StartSpan("remote op", opentracing.FollowsFrom(wireContext))

 if _, noop := noop2.(*noopSpan); !noop {

  t.Fatalf("expected noop span: %+v", noop2)

 }

 noop1.Finish()

 noop2.Finish()


 // Verify that snowball tracing is propagated and triggers recording on the

 // remote side.


 s1 := tr.StartSpan("a", Recordable)

 StartRecording(s1, SnowballRecording)


 carrier = make(opentracing.HTTPHeadersCarrier)

 if err := tr.Inject(s1.Context(), opentracing.HTTPHeaders, carrier); err != nil {

  t.Fatal(err)

 }


 wireContext, err = tr2.Extract(opentracing.HTTPHeaders, carrier)

 if err != nil {

  t.Fatal(err)

 }

 s2 := tr2.StartSpan("remote op", opentracing.FollowsFrom(wireContext))


 // Compare TraceIDs

 trace1 := s1.Context().(*spanContext).TraceID

 trace2 := s2.Context().(*spanContext).TraceID

 if trace1 != trace2 {

  t.Errorf("TraceID doesn't match: parent %d child %d", trace1, trace2)

 }

 s2.LogKV("x", 1)

 s2.Finish()


 // Verify that recording was started automatically.

 rec := GetRecording(s2)

 if err := TestingCheckRecordedSpans(rec, `

  span remote op:

   tags: sb=1

   x: 1

 `); err != nil {

  t.Fatal(err)

 }


 if err := TestingCheckRecordedSpans(GetRecording(s1), `

  span a:

   tags: sb=1 unfinished=

 `); err != nil {

  t.Fatal(err)

 }


 if err := ImportRemoteSpans(s1, rec); err != nil {

  t.Fatal(err)

 }

 s1.Finish()


 if err := TestingCheckRecordedSpans(GetRecording(s1), `

  span a:

   tags: sb=1

  span remote op:

   tags: sb=1

   x: 1

 `); err != nil {

  t.Fatal(err)

 }

}