成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

從 Dapper 到 OpenTelemetry:分布式追蹤的演進之旅

開發(fā) 前端
從基本概念到如何部署 demo 實戰(zhàn)了解 OpenTelemetry,從那個 demo 中也可以得知整個 OpenTelemetry 體系的復(fù)雜性,包含了太多的組件和概念。

從基本概念到如何部署 demo 實戰(zhàn)了解 OpenTelemetry,從那個 demo 中也可以得知整個 OpenTelemetry 體系的復(fù)雜性,包含了太多的組件和概念。

為了能更清晰的了解每個關(guān)鍵組件的作用以及原理,我打算分為幾期來講解 OpenTelemetry 的三個核心組件:

  • Trace
  • Metrics
  • Logs

首先以 Trace 講起。

Trace

開始之前還是先復(fù)習(xí)一下 Trace 的歷史背景。

如今現(xiàn)代的分布式追蹤的起源源自于 Google 在 2010 年發(fā)布的一篇論文:

  • Dapper, a Large-Scale Distributed Systems Tracing Infrastructure

在這篇論文中提出了分布式追蹤的幾個核心概念:

  • Trace
  • Span
  • Span 的一些基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)
  • 可視化追蹤以及展示

之后 Twitter 受到了 Dapper 的啟發(fā)開源了現(xiàn)在我們熟知的 Zipkin,包含了存儲和可視化 UI 展示我們的追蹤鏈路。

Uber 也在 2015 年開源了 Jaeger 項目,它的功能和 Zipkin 類似,但目前我們用的較多的還是 Jaeger;現(xiàn)在已經(jīng)成為 CNCF 的托管項目。

之后陸續(xù)出現(xiàn)過 OpenTracing 和 OpenCensus 項目,他們都企圖統(tǒng)一分布式追蹤這一領(lǐng)域。

直到 OpenTelemetry 的出現(xiàn)整合了以上兩個項目,并且逐漸成為可觀測領(lǐng)域的標(biāo)準(zhǔn)。

更多歷史背景可以參考之前的文章:OpenTelemetry 實踐指南:歷史、架構(gòu)與基本概念

這里我們結(jié)合 Dapper 論文中的資料進行分析,在這個調(diào)用中用戶發(fā)起了一次請求,內(nèi)部系統(tǒng)經(jīng)歷了 4 次 RPC 調(diào)用。

從第二張圖會看到一些關(guān)鍵信息:

  • spanName
  • parentId
  • spanId

parentId 很好理解,主要是定義調(diào)用的主次關(guān)系;要注意的是并行調(diào)用時 parentId 是同一個。

spanId 在可以理解為每一個獨立的操作,在這里就是一次 RPC 調(diào)用;同理一次數(shù)據(jù)庫操作、消息的收發(fā)都是一個 span。

span 的更多內(nèi)容在后文繼續(xù)講解。

Span

當(dāng)我們把某一個具體的 span 放大會看到更加詳細(xì)的信息,其中最關(guān)鍵的如下:

  • traceId
  • spanName
  • spanId
  • parentId
  • 開始時間
  • 結(jié)束時間

由于一個完整的 trace 鏈路由 N 個 span 組成,所以這個鏈路必須得有一個唯一的 traceId 將這些 span 串聯(lián)起來。這樣才可以在可視化的時候更好的展示鏈路信息。

以上的這些字段很容易理解,都是一些必須的信息。

在 Dapper 論文中使用 Annotations 來存放 span 的屬性,也就是剛才那些字段,當(dāng)然也可以自定義存放一些數(shù)據(jù),比如圖中的 "foo"

OpenTelemetry 中的 Span

OpenTelemetry 的 trace 自然也是基于 Dapper 的,只是額外做了一些優(yōu)化,比如在剛才那些字段的基礎(chǔ)上新增了一些概念:

{
  "name": "/v1/sys/health",
  "context": {
    "trace_id": "7bba9f33312b3dbb8b2c2c62bb7abe2d",
    "span_id": "086e83747d0e381e"
  },
  "parent_id": "",
  "start_time": "2021-10-22 16:04:01.209458162 +0000 UTC",
  "end_time": "2021-10-22 16:04:01.209514132 +0000 UTC",
  "status_code": "STATUS_CODE_OK",
  "status_message": "",
  "attributes": {
    "net.transport": "IP.TCP",
    "net.peer.ip": "172.17.0.1",
    "net.peer.port": "51820",
    "net.host.ip": "10.177.2.152",
    "net.host.port": "26040",
    "http.method": "GET",
    "http.target": "/v1/sys/health",
    "http.server_name": "mortar-gateway",
    "http.route": "/v1/sys/health",
    "http.user_agent": "Consul Health Check",
    "http.scheme": "http",
    "http.host": "10.177.2.152:26040",
    "http.flavor": "1.1"
  },
  "events": [
    {
      "name": "",
      "message": "OK",
      "timestamp": "2021-10-22 16:04:01.209512872 +0000 UTC"
    }
  ]
}

以這個 JSON 為例,新增了:

  • [ ] Span Context
  • Span 的上下文,存放的都是不可變的數(shù)據(jù),因為每個 Span 之間是存在關(guān)聯(lián)關(guān)系的,這些關(guān)聯(lián)關(guān)系都是存放在 context 中,主要就是 trace_id, span_id.
  • Attributes: 可以理解為 Dapper 中的 Annotations,存放的是我們自定義的鍵值對,通常是由我們常用第三方開源 Instrumentation 內(nèi)置的一些屬性。
  • Span Events: Span 的一些關(guān)鍵事件。

比如我們常用的 Redis 客戶端 lettuce,它就會自己記錄一些 Attributes。

如果有多個 span 存在依賴關(guān)系:

[Span A]  ←←←(the root span)
            |
     +------+------+
     |             |
 [Span B]      [Span C] ←←←(Span C is a `child` of Span A)
     |             |
 [Span D]      +---+-------+
               |           |
           [Span E]    [Span F]

大部分的可視化工具都是以時間線的方式進行展示:

––|–––––––|–––––––|–––––––|–––––––|–––––––|–––––––|–––––––|–> time

 [Span A···················································]
   [Span B··········································]
      [Span D······································]
    [Span C····················································]
         [Span E·······]        [Span F··]

這些和 Dapper 中描述的概念沒有本質(zhì)區(qū)別。

Span Status

Span 還內(nèi)置了一些 Status:

  • Unset
  • Error
  • Ok

默認(rèn)情況下是 Unset,出現(xiàn)錯誤時則是 Error,一切正常時則是 Ok。

通過可視化頁面很容易得知某個 trace 中 span 的異常情況,點進去后可以看到具體的異常 span 以及它的錯誤日志。

Span Kind

最后是 Span 的類型:

  • Client
  • Server
  • Internal
  • Producer
  • Consumer

Client 和 Server 非常好理解,比如我們有一個 gRPC 接口,調(diào)用方的 Span 是 client,而服務(wù)端的 Span 自然就是 Server。

Internal 則是內(nèi)部組件調(diào)用產(chǎn)生的 Span,這類 Span 相對會少一些。

Producer 和 Consumer 一般指的是發(fā)起異步調(diào)用時的 Span,我們常見的就是往消息隊列里生產(chǎn)和消費消息。

通過這幾種類型的 Span 也可以了解到什么情況下會創(chuàng)建 Span,通常是以下幾種場景:

  • RPC 調(diào)用
  • 數(shù)據(jù)庫(Redis、MySQL、Mongo 等等)操作
  • 生產(chǎn)和消費消息
  • 有意義的內(nèi)部調(diào)用

通常在一個函數(shù)內(nèi)部再調(diào)用其他的本地函數(shù)是不用創(chuàng)建 span 的,不然這個鏈路會非常的長。

Annotations

當(dāng)然也有一些特殊情況,比如我的某個內(nèi)部函數(shù)非常重要,需要單獨關(guān)心它的調(diào)用時長。

此時我們就可以使用 Annotations 來單獨創(chuàng)建自己的 Span。

這個 Annotations 和 Dapper 中的不是同一個,只是 Java 中的注解。

@Override  
public void sayHello(HelloRequest request, StreamObserver<HelloReply> responseObserver) {  
    Executors.newFixedThreadPool(1).execute(() -> {  
        myMethod(request.getName());  
    });    
    
    HelloReply reply = HelloReply.newBuilder()  
            .setMessage("Hello ==> " + request.getName())  
            .build();  
    responseObserver.onNext(reply);  
    responseObserver.onCompleted();  
}  
  
@SneakyThrows  
@WithSpan  
public void myMethod(@SpanAttribute("request.name") String name) {  
    TimeUnit.SECONDS.sleep(1);  
    log.info("myMethod:{}", name);  
}

以這段代碼為例,這是一個 gRPC 的服務(wù)端接口,在這個接口中調(diào)用了一個函數(shù) myMethod,默認(rèn)情況下并不會為它單獨創(chuàng)建一個 Span。

但如果我們想單獨記錄它,就可以使用 @WithSpan 這個注解,同時也可以使用  @SpanAttribute 來自定義 attribute。

最終的效果如下:

此時就會單獨為這個函數(shù)創(chuàng)建一個 Span。

需要單獨引入一個依賴:

<dependencies>
  <dependency>
    <groupId>io.opentelemetry.instrumentation</groupId>
    <artifactId>opentelemetry-instrumentation-annotations</artifactId>
    <version>2.3.0</version>
  </dependency>
</dependencies>

Context Propagation

上下文傳播也是 Trace 中非常重要的概念,剛才提到了每個 Span 都有自己不可變的上下文,那么后續(xù)的 Span 如何和上游的 Span 進行關(guān)聯(lián)呢?

這里有兩種情況:

  • 同一進程
  • 垮進程

同一進程

同一個進程也分為兩種情況:

  • 單線程
  • 多線程

單線程的比較好處理,我們只需要把數(shù)據(jù)寫入 ThreadLocal 中就可以做到線程隔離。

private static final ThreadLocal<Context> THREAD_LOCAL_STORAGE = new ThreadLocal<>();

@Override  
@Nullable  
public Context current() {  
  return THREAD_LOCAL_STORAGE.get();  
}

這點我們可以通過源碼 io.opentelemetry.context.ThreadLocalContextStorage看到具體的實現(xiàn)過程。

而如果是多線程時:

Executors.newFixedThreadPool(1).execute(() -> {  
    myMethod(request.getName());  
});

則需要對使用的線程池進行單獨處理,將父線程中 threadlocal 中的數(shù)據(jù)拷貝出來進行傳遞,比如有阿里提供的 TransmittableThreadLocal,可以提供對線程池的支持。

跨進程

而如果是垮進程的場景,就需要將 context 的信息進行序列化傳遞。

如果是 gRPC 調(diào)用會將信息存放到 metadata 中。

HTTP 調(diào)用則是存放在 header 中。

消息隊列,比如 Pulsar 也可以將數(shù)據(jù)存放在消息中的 header 中進行傳遞。

數(shù)據(jù)一旦跨進程傳輸成功后,就和單進程一樣的處理方式了。

Baggage

有時候我們需要通過垮 Span 傳遞信息,比如如上圖所示:我們需要在 serverB 中拿到 serverA 中收到的一個請求參數(shù):http://127.0.0.1:8181/request\?name\=1232。

這個數(shù)據(jù)默認(rèn)會作為 span 的 attribute ,但只會存在于第一個 span。

如果我們想要在后續(xù)的 span 中也能拿到這個數(shù)據(jù),甚至是垮進程也能獲取到。

那就需要使用 Baggage 這個對象了。

它的使用也很簡單:

@RequestMapping("/request")  
public String request(@RequestParam String name) {  
 // 寫入
    Baggage.current().toBuilder().  
          put("request.name", name).build()  
          .storeInContext(Context.current()).makeCurrent();
}         

// 獲取
String value = Baggage.current().getEntryValue("request.name");  
log.info("request.name: {}", value);

只要是屬于同一個 trace 的調(diào)用就可以直接獲取到數(shù)據(jù)。

traceId 也是垮 Span 傳遞的。

而它的原理也是通過往 context 中寫入數(shù)據(jù)實現(xiàn)的:

@Immutable  
class BaggageContextKey {  
  static final ContextKey<Baggage> KEY = ContextKey.named("opentelemetry-baggage-key");  
  
  private BaggageContextKey() {}  
}

而這個 context 是通過一個 entries 數(shù)據(jù)存儲數(shù)據(jù)的,不管是在內(nèi)部還是外部的跨進程調(diào)用,OpenTelemetry 都會將 context 通過 Context Propagation 傳遞出去。

總結(jié)

Trace 這部分的內(nèi)容我覺得比 Metrics 和 Logs 更加復(fù)雜一些,畢竟多了一些數(shù)據(jù)結(jié)構(gòu);現(xiàn)在的內(nèi)容也只是冰山一角,現(xiàn)在也在做 trace 的一些定制化開發(fā),后續(xù)有新的進展會接著更新。

參考鏈接:

  • https://static.googleusercontent.com/media/research.google.com/zh-CN//archive/papers/dapper-2010-1.pdf。
  • https://opentelemetry.io/docs/languages/java/automatic/annotations/。
  • https://opentelemetry.io/docs/specs/otel/overview/#tracing-signal。
  • https://opentelemetry.io/docs/concepts/context-propagation/。
  • https://opentelemetry.io/docs/concepts/observability-primer/#distributed-traces。
  • https://tech.meituan.com/2023/04/20/traceid-google-dapper-mtrace.html。
責(zé)任編輯:姜華 來源: crossoverJie
相關(guān)推薦

2024-08-21 08:09:17

2013-06-07 13:46:29

分布式存儲自動化運維

2021-04-29 19:07:33

Redis演進微服務(wù)

2024-06-14 08:19:45

2024-04-22 08:10:29

2022-06-14 15:28:37

數(shù)據(jù)庫存儲系統(tǒng)變革趨勢

2024-05-16 07:51:55

分布式系統(tǒng)架構(gòu)

2021-11-26 06:43:19

Java分布式

2018-04-03 09:27:42

分布式架構(gòu)系統(tǒng)

2017-09-01 05:35:58

分布式計算存儲

2022-12-04 22:41:15

IPC分布式機制

2022-03-25 08:40:32

分布式架構(gòu)

2020-12-16 09:24:18

Skywalking分布式鏈路追蹤

2024-06-07 13:04:31

2020-03-09 08:24:06

TengineWeb代理服務(wù)器

2023-08-18 09:00:00

Kubernetes數(shù)據(jù)庫SQL

2021-11-29 08:18:22

架構(gòu)互聯(lián)網(wǎng)分布式

2018-10-18 08:15:27

開源分布式追蹤工具

2020-10-20 09:38:15

分布式存儲Ceph

2022-09-25 22:19:24

Dapr分布式追蹤
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产九九精品 | 91在线色视频 | 欧美videosex性极品hd | 99精品热视频 | 91精品久久久久久久久久入口 | 国产99精品 | 91视频在线观看 | 国产精品久久久久久久久久久久冷 | 精品一区二区三区中文字幕 | 男人的天堂在线视频 | 91电影院 | 欧美成视频 | 伊人网在线看 | av影音资源| 激情欧美一区二区三区 | 欧美极品在线播放 | 毛片网在线观看 | 欧美日韩精品一区二区三区视频 | 久久午夜精品福利一区二区 | 欧美一区二区三区在线观看视频 | 黄色精品| 国产一区91精品张津瑜 | 欧美黄色一级毛片 | 在线观看精品视频网站 | 成人av免费看 | 国产欧美一区二区三区在线看蜜臀 | 日韩第1页 | 99热精品在线观看 | 国产成人91视频 | 欧美日韩一二三区 | 天天躁日日躁性色aⅴ电影 免费在线观看成年人视频 国产欧美精品 | 欧美日韩精品中文字幕 | 久久久精品一区二区三区 | 亚洲精品成人免费 | 国产视频一二三区 | 久久av网| 成人在线免费观看视频 | 亚洲精品一区二区在线观看 | 免费超碰| 国产一区二区在线播放 | 日韩欧美成人一区二区三区 |