成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Sentry 監(jiān)控 - Distributed Tracing 分布式跟蹤

安全 應用安全 分布式
分布式跟蹤(Distributed tracing)通過捕獲軟件系統之間的交互來提供相關錯誤和事務的連接視圖。通過跟蹤,Sentry 可以跟蹤您的軟件性能并顯示跨多個系統的錯誤影響。

[[427023]]

本文轉載自微信公眾號「黑客下午茶」,作者為少。轉載本文請聯系黑客下午茶公眾號。

目錄

  • 什么是跟蹤?
    • 為什么要跟蹤?
    • 跟蹤(Traces)、事務(Transactions和跨度(Spans)
    • 示例:調查緩慢的頁面加載
    • 更多示例
    • 跟蹤數據模型
    • 更多信息
  • 數據采樣
    • 跟蹤中的一致性

分布式跟蹤(Distributed tracing)通過捕獲軟件系統之間的交互來提供相關錯誤和事務的連接視圖。通過跟蹤,Sentry 可以跟蹤您的軟件性能并顯示跨多個系統的錯誤影響。通過服務追溯問題將您的前端連接到您的后端。

  • https://docs.sentry.io/product/sentry-basics/tracing/distributed-tracing/

啟用性能監(jiān)控以擴充您現有的錯誤數據,跟蹤從前端到后端的交互。通過跟蹤,Sentry 可以跟蹤您的軟件性能,測量吞吐量和延遲等指標,并顯示跨多個系統的錯誤影響。跟蹤使 Sentry 成為更完整的監(jiān)控解決方案,幫助您更快地診斷問題并衡量應用程序的整體健康狀況。Sentry 中的跟蹤提供了以下見解:

  • 特定錯誤事件或 issue 發(fā)生了什么
  • 導致應用程序出現瓶頸或延遲 issue 的條件
  • 消耗時間最多的端點或操作

什么是跟蹤?

首先,請注意跟蹤不是什么:跟蹤不是分析。盡管分析和跟蹤的目標有相當多的重疊,雖然它們都可用于診斷應用程序中的問題,但它們在測量內容和數據記錄方式方面有所不同。

profiler 可以測量應用程序操作的多個方面:執(zhí)行的指令數、各種進程使用的內存量、給定函數調用所花費的時間量等等。生成的 profile 是這些測量值的統計匯總。

  • https://en.wikipedia.org/wiki/Profiling_(computer_programming)

另一方面,tracing tool 關注發(fā)生了什么(以及何時),而不是發(fā)生了多少次或花費了多長時間。結果跟蹤(resulting trace)是在程序執(zhí)行期間發(fā)生的事件日志,通常跨多個系統。盡管跟蹤最常見 - 或者,就 Sentry 的跟蹤而言,總是 - 包括時間戳(timestamps),允許計算持續(xù)時間,但測量性能并不是它們的唯一目的。它們還可以顯示互連系統交互的方式,以及一個系統中的問題可能導致另一個系統出現問題的方式。

  • https://en.wikipedia.org/wiki/Tracing_(software)

為什么要跟蹤?

應用程序通常由互連的組件組成,這些組件也稱為服務。作為一個例子,讓我們看一個現代 Web 應用程序,它由以下組件組成,由網絡邊界分隔:

  • Frontend (Single-Page Application) 前端
  • Backend (REST API) 后端
  • Task Queue 任務隊列
  • Database Server 數據庫服務器
  • Cron Job Scheduler 定時任務調度器

這些組件中的每一個都可以在不同的平臺上用不同的語言編寫。每個都可以使用 Sentry SDK 單獨檢測以捕獲錯誤數據或崩潰報告,但該檢測不能提供完整的圖片,因為每個部分都是單獨考慮的。跟蹤允許您將所有數據聯系在一起。

在我們的示例 Web 應用程序中,跟蹤意味著能夠跟蹤從前端到后端和后端的請求,從請求創(chuàng)建的任何后臺任務(background tasks)或通知作業(yè)(notification jobs)中提取數據。這不僅可以讓您關聯 Sentry 錯誤報告,查看一個服務中的錯誤如何傳播到另一個服務,而且還可以讓您更深入地了解哪些服務可能對應用程序的整體性能產生負面影響。

在學習如何在您的應用程序中啟用跟蹤之前,了解一些關鍵術語以及它們之間的關系會有所幫助。

跟蹤(Traces)、事務(Transactions和跨度(Spans)

trace 表示您要測量或跟蹤的整個操作的記錄 - 例如頁面加載、用戶在應用程序中完成某些操作的實例或后端的 cron job。當跟蹤包括多個服務中的工作時,例如上面列出的服務,它被稱為分布式跟蹤,因為跟蹤分布在這些服務中。

每個 trace 由一個或多個稱為 transactions 的樹狀結構組成,其節(jié)點稱為 spans。在大多數情況下,每個 transaction 代表被調用服務的單個實例,并且該 transaction 中的每個 span 代表該服務執(zhí)行單個工作單元,無論是調用該服務中的函數還是調用不同的服務。這是一個示例跟蹤,分解為事務(transactions)和跨度(spans):

由于事務(transaction)具有樹結構,因此頂級跨度(top-level spans)本身可以分解為更小的跨度(smaller spans),這反映了一個函數可能調用許多其他更小的函數的方式;這是使用父子隱喻來表達的,因此每個跨度都可能是多個其他子跨度的父跨度。此外,由于所有樹都必須有一個根,因此每個事務中的一個跨度始終代表事務本身,而事務中的所有其他跨度都從該根跨度下降。這是上圖中事務之一的放大視圖:

為了使所有這些更具體,讓我們再次考慮我們的示例 Web 應用程序。

示例:調查緩慢的頁面加載

假設您的 Web 應用程序加載緩慢,您想知道原因。要使您的應用程序首先進入可用狀態(tài),必須發(fā)生很多事情:對后端的多個請求,可能是一些工作 - 包括對數據庫或外部 API 的調用 - 在返回響應之前完成,并由瀏覽器處理以呈現所有 將返回的數據轉化為對用戶有意義的內容。那么這個過程的哪一部分會減慢速度?

假設在這個簡化的示例中,當用戶在瀏覽器中加載應用程序時,每個服務中都會發(fā)生以下情況:

  • Browser(瀏覽器)
    • HTML、CSS 和 JavaScript 各 1 個請求
    • 1 次渲染任務,觸發(fā) 2 次 JSON 數據請求 ^
  • Backend(后端)
    • 3 個提供靜態(tài)文件(HTML、CSS 和 JS)的請求
    • 2 個 JSON 數據請求 - 1 個需要調用數據庫 - 1 個需要調用外部 API 并在將結果返回到前端之前處理結果^
  • Database Server(數據庫服務器)
    • 1 查詢以檢查身份驗證
    • 1 查詢獲取數據
    • 1 個請求需要 2 次查詢

注意:外部 API 并未準確列出,因為它是外部的,因此您看不到它的內部。

在此示例中,整個頁面加載過程(包括上述所有過程)由單個 trace 表示。該跟蹤將由以下事務(transactions)組成:

  • 1 個瀏覽器事務(用于頁面加載)
  • 5 個后端事務(每個請求一個)
  • 1 個數據庫服務器事務(用于單個 DB 請求)

每個事務將被分解為跨度(spans)如下:

  • 瀏覽器頁面加載事務:7 個 span
    • 2 個子 span,每個 JSON 請求一個
    • 1 個根 span 代表整個頁面加載
    • HTML、CSS 和 JS 請求各 1 個(共 3 個)
    • 渲染任務的 1 個 span,它本身包含

讓我們在這里暫停一下以說明一個重點:此處列出的瀏覽器事務中的一些(盡管不是全部)跨度與前面列出的后端事務有直接對應關系。具體來說,瀏覽器事務中的每個請求跨度對應于后端中的一個單獨的請求事務。在這種情況下,當一個服務中的跨度引起后續(xù)服務中的事務時,我們將原始跨度稱為事務及其根跨度的父跨度。在下圖中,波浪線代表這種父子關系。

在我們的示例中,除了初始瀏覽器頁面加載事務之外的每個事務都是另一個服務中一個跨度的子項,這意味著除了瀏覽器事務根之外的每個根跨度都有一個父跨度(盡管在不同的服務中)。

在 fully-instrumented 的系統(其中每個服務都啟用了跟蹤的系統)中,這種模式將始終適用。唯一的無父 span 將是初始 transaction 的根;每隔一個 span 都會有一個父級。此外,parents 和 children 將始終生活在同一個服務中,除非在子 span 是子 transaction 的根的情況下,在這種情況下,父 span 將在調用服務中,而子 transaction/child 根 span 將在被調用服務中。

換句話說,一個 fully-instrumented 的系統創(chuàng)建一個跟蹤,它本身就是一個連接的樹——每個事務都是一個子樹——在這棵樹中,子樹/事務之間的邊界正是服務之間的邊界。上圖顯示了我們示例的完整跟蹤樹的一個分支。

現在,為了完整起見,回到我們的 spans:

  • 后端 HTML/CSS/JS 請求事務:每個 1 個 span
    • 代表整個請求的 1 個根跨度(瀏覽器跨度的子項)^
  • 帶有數據庫調用事務的后端請求:2 個 span
    • 1 個表示整個請求的根跨度(瀏覽器跨度的子項)
    • 1 個跨度用于查詢數據庫(數據庫服務器事務的父級)^
  • 帶有 API 調用事務的后端請求:3 個 span
    • 1 個表示整個請求的根跨度(瀏覽器跨度的子項)
    • API 請求的 1 個跨度(與數據庫調用不同,不是父跨度,因為 API 是外部的)
    • 1 個跨度用于處理 API 數據^
  • 數據庫服務器請求事務:3 個 span
    • 1 個代表整個請求的根跨度(上面后端跨度的子項)
    • 1 跨度用于身份驗證查詢
    • 1 個跨度用于查詢檢索數據的

總結一下這個例子:在檢測了所有服務之后,您可能會發(fā)現——出于某種原因——是數據庫服務器中的身份驗證查詢(auth query)導致了速度變慢,占了完成整個頁面加載過程所需時間的一半以上。跟蹤無法告訴你為什么會發(fā)生這種情況,但至少現在你知道該去哪里找了!

更多示例

本節(jié)包含更多跟蹤示例,分為事務(transaction)和跨度(span)。

衡量特定的用戶動作

如果您的應用程序涉及電子商務,您可能希望測量從用戶單擊“提交訂單(Submit Order)”到訂單確認出現之間的時間,包括跟蹤向支付處理器提交費用和發(fā)送訂單確認電子郵件。整個過程是一個跟蹤,通常您會有事務 (T) 和跨度 (S) 用于:

  • 瀏覽器全過程(T 和根跨度 S)
    • 對后端的 XHR 請求* (S)
    • 渲染確認 screen(S)^
  • 您的后端對該請求的處理(T 和根跨度 S)
    • 計算總數的函數(Function)調用 (S)
    • 存儲訂單數據庫(DB)調用* (S)
    • 對支付處理器的 API 調用 (S)
    • 電子郵件確認排隊* (S) ^
  • 您的數據庫更新客戶訂單歷史的工作(T 和根跨度 S)
    • 單個 SQL 查詢 (S) ^
  • 發(fā)送電子郵件的排隊任務(T 和根跨度 S)
    • 用于填充電子郵件模板的函數調用 (S)
    • 對電子郵件發(fā)送服務的 API 調用 (S)

注意:帶星號的跨度表示作為后續(xù)事務(及其根跨度)的父跨度。

監(jiān)控后臺進程

如果您的后端定期輪詢外部服務的數據,對其進行處理、緩存,然后將其轉發(fā)給內部服務,則發(fā)生這種情況的每個實例都是一個跟蹤,您通常會有以下事務 (T) 和跨度 (S):

  • 完成整個過程的 cron job(T 和根跨度 S)
    • API 調用外部服務 (S)
    • Processing 函數 (S)
    • 調用緩存服務* (S)
    • API 調用內部服務* (S) ^
  • 在您的緩存服務中完成的工作(T 和根跨度 S)
    • 檢查現有數據的緩存 (S)
    • 在緩存中存儲新數據 (S) ^
  • 您的內部服務對請求的處理(T 和根跨度 S)
    • 服務可能為處理請求而做的任何事情 (S)

注意:帶星號的跨度表示作為后續(xù)事務(及其根跨度)的父跨度。

跟蹤數據模型

“給我看你的流程圖而隱藏你的表,我仍然莫名其妙。如果給我看你的表,那么我將不再需要你的流程圖,因為它們太明顯了。”

Fred Brooks, 《The Mythical Man-Month》(人月神話)

雖然這個理論很有趣,但最終任何數據結構都是由它包含的數據類型定義的,數據結構之間的關系由它們之間的鏈接如何記錄來定義。跟蹤、事務和跨度也不例外。

Traces(跟蹤)

Traces 本身并不是一個實體。相反,跟蹤被定義為共享一個 trace_id 值的所有事務的集合。

Transactions(事務)

Transactions 與其根跨度共享其大部分屬性(開始和結束時間、標簽等),因此下面描述的跨度的相同選項在事務中可用,并且在任一位置設置它們是等效的。

Transactions 還有一個不包含在跨度中的附加屬性,稱為 transaction_name,它在 UI 中用于標識 transaction。transaction_name 值的常見示例包括后端請求事務的端點路徑(如 /store/checkout/ 或 api/v2/users//)、cron job 事務的任務名稱(如 data.cleanup.delete_inactive_users)和 URL( 像 https://docs.sentry.io/performance-monitoring/distributed-tracing/) 用于頁面加載事務。

Spans(跨度)

transaction 中的大部分數據駐留在事務包含的單個 span 中。span 數據包括:

  • parent_span_id: 將 span 與其父 span 聯系起來
  • op: 標識跨度正在測量的操作類型或類別的短字符串
  • start_timestamp: span 打開時
  • end_timestamp: span 關閉時
  • description: span 操作的較長描述,唯一標識 span,但跨 span 實例保持一致(可選)
  • status: 指示操作狀態(tài)的短 code(可選)
  • tags: key-value 對保存有關跨度的附加數據(可選)
  • data: 關于 span 的任意結構的附加數據(可選)

op 和 description 屬性一起使用的示例是 op: sql.query 和 description: SELECT * FROM users WHERE last_active < %s。 status 屬性通常用于指示 span 操作的成功或失敗,或者在 HTTP 請求的情況下用于 response code。最后,tags 和 data 允許您將更多上下文信息附加到 span,例如 function: middleware.auth.is_authenticated 用于函數調用或 request: {url: ..., headers: ... , body: ...} 用于 HTTP 請求。

更多信息

關于跟蹤、事務和跨度以及它們相互關聯的方式的一些更重要的點:

Trace Duration(跟蹤持續(xù)時間)

因為 trace 只是 transaction 的集合,所以 trace 沒有自己的開始和結束時間。相反,trace 在其最早的 transaction 開始時開始,并在其最新的 transaction 結束時結束。因此,您無法直接明確地開始或結束 trace。相反,您通過在該 trace 中創(chuàng)建第一個 transaction 來創(chuàng)建 trace,并通過完成它包含的所有 transaction 來完成 trace。

Async Transactions(異步事務)

由于異步進程的可能性,子事務(child transaction)可能比包含其父跨度(parent span)的事務的壽命長很多數量級。例如,如果后端 API 調用啟動了一個長時間運行的處理任務,然后立即返回響應,則后端事務將在異步任務事務完成之前很久完成(并且其數據將被發(fā)送到 Sentry)。異步性還意味著 transaction 發(fā)送到(和接收)Sentry 的順序與創(chuàng)建它們的順序沒有任何關系。(相比之下,同一 trace 中 transaction 的接收順序與完成順序相關,但由于傳輸時間的可變性等因素,相關性遠非完美。)

Orphan Transactions(孤兒事務)

理論上,在一個 fully instrumented 的系統中,每個 trace 應該只包含一個 transaction 和一個 span(transaction的根),沒有父項,即原始服務中的 transaction。但是,在實踐中,您可能不會在每一項服務中都啟用 trace,或者檢測的服務可能由于網絡中斷或其他不可預見的情況而無法報告 transaction。發(fā)生這種情況時,您可能會在跟蹤層次結構中看到間隙。具體來說,您可能會在 span 的中途看到其父 span 尚未記錄為任何已知 transaction 的一部分的 transaction。這種非發(fā)起、無父 transaction 被稱為孤兒事務。

Nested Spans(嵌套跨度)

盡管我們上面的示例在其層次結構中有四個級別(跟蹤trace、事務transaction、跨度span、子跨度child span),但跨度嵌套的深度沒有設置限制。但是,存在實際限制:發(fā)送到 Sentry 的事務有效負載具有最大允許大小,并且與任何類型的日志記錄一樣,需要在數據的粒度與其可用性之間取得平衡。

Zero-duration Spans(零持續(xù)時間跨度)

跨度可能具有相同的開始時間和結束時間,因此被記錄為不占用時間。這可能是因為 span 被用作標記(例如在瀏覽器的 Performance API 中完成的),或者因為操作花費的時間少于測量分辨率(這將因服務而異)。

https://developer.mozilla.org/en-US/docs/Web/API/Performance/mark

Clock Skew(時鐘偏移)

如果您從多臺機器收集 transaction,您可能會遇到 clock skew,其中一個 transaction 中的時間戳與另一個 transaction 中的時間戳不一致。例如,如果您的后端進行數據庫調用,則后端事務在邏輯上應該在數據庫事務之前開始。但是,如果每臺機器(分別托管后端和數據庫的機器)上的系統時間未同步到通用標準,則情況可能并非如此。排序也有可能是正確的,但是兩個記錄的時間范圍沒有以準確反映實際發(fā)生的方式排列。為了減少這種可能性,我們建議使用網絡時間協議 (NTP) 或您的云提供商的時鐘同步服務。

如何發(fā)送數據

單個 span 不會發(fā)送到 Sentry;相反,整個 transaction 作為一個單位發(fā)送。這意味著 Sentry 的服務器不會記錄任何 span 數據,直到它們所屬的 transaction 被關閉和分派。然而,反過來就不是這樣了——盡管沒有 transaction 就不能發(fā)送 span,但 transaction 仍然有效,并且會被發(fā)送,即使它們包含的唯一 span 是它們的根 span。

數據采樣

當您在跟蹤設置中啟用采樣時,您可以選擇要發(fā)送到 Sentry 的已收集交易的百分比。例如,如果您有一個每分鐘接收 1000 個請求的端點,0.25 的采樣率將導致每分鐘大約 250 個事務 (25%) 被發(fā)送到 Sentry。(這個數字是近似的,因為每個請求要么被跟蹤,要么被獨立和偽隨機地跟蹤,概率為 25%。因此,以同樣的方式,100 個公平硬幣,在翻轉時會導致大約 50 個正面,SDK 將“決定” 在大約 250 個案例中收集跟蹤。)因為您知道采樣百分比,所以您可以推斷您的總流量。

在收集跟蹤時,我們建議對您的數據進行采樣,原因有兩個。首先,雖然捕獲單個跟蹤的開銷最小,但捕獲每個頁面加載或每個 API 請求的跟蹤可能會給您的系統增加不希望的負載量。其次,啟用采樣可以讓您更好地管理發(fā)送到 Sentry 的事件數量,以便您可以根據組織的需求對其進行定制。

選擇采樣率時,目標是不要收集太多數據(鑒于上述原因),而是收集足夠的數據,以便得出有意義的結論。如果您不確定要選擇什么速率,我們建議從一個較低的值開始,并隨著您對流量模式和流量的了解逐漸增加,直到找到一個速率,使您能夠平衡性能和流量與數據準確性之間的關系。

跟蹤中的一致性

對于涉及多個事務的跟蹤,Sentry 使用 “基于頭部(head-based)” 的方法:在原始服務中做出采樣決策,然后將該決策傳遞給所有后續(xù)服務。要了解這是如何工作的,讓我們回到上面的 webapp示例。考慮兩個用戶 A 和 B,他們都在各自的瀏覽器中加載應用程序。當 A 加載應用程序時,SDK 偽隨機“決定”收集跟蹤,而當 B 加載應用程序時,SDK “決定”不收集跟蹤。當每個瀏覽器向您的后端發(fā)出請求時,它會在這些請求的標題中包含“yes, please collect transactions)”或“no, don't collect transactions this time”的決定。

當您的后端處理來自 A 瀏覽器的請求時,它會看到 “yes” 的決定,收集事務和跨度數據,并將其發(fā)送給 Sentry。此外,它在向后續(xù)服務(如您的數據庫服務器)發(fā)出的任何請求中都包含“yes”決定,這些服務同樣會收集數據,將數據發(fā)送給 Sentry,并將決定傳遞給它們調用的任何服務。通過這個過程,A的跟蹤中的所有相關事務都被收集并發(fā)送到 Sentry。

另一方面,當您的后端處理來自 B 瀏覽器的請求時,它會看到 “no” 決定,因此它不會收集和發(fā)送事務和跨度數據到 Sentry。然而,它在將決策傳播到后續(xù)服務方面做與在 A 的情況下所做的相同的事情,告訴他們也不要收集或發(fā)送數據。然后他們又告訴他們調用的任何服務不要發(fā)送數據,這樣就不會收集到來自 B 跟蹤的事務。

 

簡而言之:這種 head-based 的方法的結果是,決策在原始服務中作出一次,并傳遞給所有后續(xù)服務,要么收集給定跟蹤的所有事務,要么不收集任何事務,因此不應存在任何不完整的跟蹤。

 

責任編輯:武曉燕 來源: 黑客下午茶
相關推薦

2021-10-06 05:04:47

監(jiān)控

2017-01-16 14:51:26

京東分布式服務CallGraph

2021-03-23 22:43:09

Grafana Tem分布式跟蹤開源

2018-03-13 16:42:26

分布式服務跟蹤

2011-04-01 14:54:23

zabbix漢化分布式監(jiān)控

2021-06-09 09:00:00

微服務架構技術

2019-10-10 09:16:34

Zookeeper架構分布式

2019-06-19 15:40:06

分布式鎖RedisJava

2023-05-29 14:07:00

Zuul網關系統

2017-09-01 05:35:58

分布式計算存儲

2011-04-01 10:18:12

zabbix

2018-09-29 08:44:24

開源分布式系統

2021-06-17 14:29:39

Linkerd 分布式跟蹤Linkerd 2.1

2018-03-02 16:11:29

Spring Clou分布式服務跟蹤

2017-10-27 08:40:44

分布式存儲剪枝系統

2020-11-24 09:36:19

分布式監(jiān)控系統

2023-10-26 18:10:43

分布式并行技術系統

2018-01-12 16:51:48

華為

2022-10-21 16:16:42

分布式系統優(yōu)化

2018-07-17 08:14:22

分布式分布式鎖方位
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 免费看日韩视频 | 91在线视频观看 | 亚洲国产精品人人爽夜夜爽 | 中文字幕亚洲一区 | 欧美炮房 | 狠狠操狠狠操 | 国产精品久久久久久久久久软件 | 久久精品免费观看 | 久在线 | 一区网站 | 欧美日韩中文字幕在线 | 免费一级片 | 久久男人 | 日韩 欧美 综合 | 久草欧美 | 农村妇女毛片精品久久久 | 91色视频在线 | 精品福利一区 | 国产精品一区二区视频 | 日韩一区二区不卡 | 亚洲免费影院 | 国产高清在线精品一区二区三区 | 青青久草 | 91在线免费视频 | 成人黄色av网站 | 久久综合九九 | 91国在线观看 | 亚洲看片 | 亚洲视频三| 亚洲视频在线看 | 日韩成人影院 | 欧美一区在线视频 | 久久一区二区三区四区 | 国产亚洲一区二区在线观看 | a在线视频| 日韩欧美专区 | 日韩av一区二区在线观看 | 人人干人人干人人干 | 超碰免费在线观看 | 毛片久久久| 九九热这里 |