成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Prometheus時序數據庫-數據的查詢

運維 數據庫運維
Promql是非常強大的,可以滿足我們的各種需求。其運行原理自然也激起了筆者的好奇心,本篇文章雖然只分析了一條簡單的Promql,但萬變不離其宗,任何Promql都是類似的運行邏輯。希望本文對讀者能有所幫助。

[[387578]]

前言

在之前的博客里,筆者詳細闡述了Prometheus數據的插入過程。但我們最常見的打交道的是數據的查詢。Prometheus提供了強大的Promql來滿足我們千變萬化的查詢需求。在這篇文章里面,筆者就以一個簡單的Promql為例,講述下Prometheus查詢的過程。

Promql

一個Promql表達式可以計算為下面四種類型:

  1. 瞬時向量(Instant Vector) - 一組同樣時間戳的時間序列(取自不同的時間序列,例如不同機器同一時間的CPU idle) 
  2. 區間向量(Range vector) - 一組在一段時間范圍內的時間序列 
  3. 標量(Scalar) - 一個浮點型的數據值 
  4. 字符串(String) - 一個簡單的字符串 

我們還可以在Promql中使用svm/avg等集合表達式,不過只能用在瞬時向量(Instant Vector)上面。為了闡述Prometheus的聚合計算以及篇幅原因,筆者在本篇文章只詳細分析瞬時向量(Instant Vector)的執行過程。

瞬時向量(Instant Vector)

前面說到,瞬時向量是一組擁有同樣時間戳的時間序列。但是實際過程中,我們對不同Endpoint采樣的時間是不可能精確一致的。所以,Prometheus采取了距離指定時間戳之前最近的數據(Sample)。如下圖所示:

 

當然,如果是距離當前時間戳1個小時的數據直觀看來肯定不能納入到我們的返回結果里面。

所以Prometheus通過一個指定的時間窗口來過濾數據(通過啟動參數—query.lookback-delta指定,默認5min)。

對一條簡單的Promql進行分析

好了,解釋完Instant Vector概念之后,我們可以著手進行分析了。直接上一條帶有聚合函數的Promql吧。

  1. SUM BY (group) (http_requests{job="api-server",group="production"}) 

首先,對于這種有語法結構的語句肯定是將其Parse一把,構造成AST樹了。調用

  1. promql.ParseExpr 

由于Promql較為簡單,所以Prometheus直接采用了LL語法分析。在這里直接給出上述Promql的AST樹結構。

 

Prometheus對于語法樹的遍歷過程都是通過vistor模式,具體到代碼為:

  1. ast.go vistor設計模式 
  2. func Walk(v Visitor, node Node, path []Node) error { 
  3.     var err error 
  4.     if v, err = v.Visit(node, path); v == nil || err != nil { 
  5.         return err 
  6.     } 
  7.     path = append(path, node) 
  8.  
  9.     for _, e := range Children(node) { 
  10.         if err := Walk(v, e, path); err != nil { 
  11.             return err 
  12.         } 
  13.     } 
  14.  
  15.     _, err = v.Visit(nil, nil) 
  16.     return err 
  17. func (f inspector) Visit(node Node, path []Node) (Visitor, error) { 
  18.     if err := f(node, path); err != nil { 
  19.         return nil, err 
  20.     } 
  21.  
  22.     return f, nil 

通過golang里非常方便的函數式功能,直接傳遞求值函數inspector進行不同情況下的求值。

  1. type inspector func(Node, []Node) error 

求值過程

具體的求值過程核心函數為:

  1. func (ng *Engine) execEvalStmt(ctx context.Context, query *query, s *EvalStmt) (Value, storage.Warnings, error) { 
  2.     ...... 
  3.     querier, warnings, err := ng.populateSeries(ctxPrepare, query.queryable, s)     // 這邊拿到對應序列的數據 
  4.     ...... 
  5.     val, err := evaluator.Eval(s.Expr) // here 聚合計算 
  6.     ...... 
  7.  

populateSeries

首先通過populateSeries的計算出VectorSelector Node所對應的series(時間序列)。這里直接給出求值函數

  1. func(node Node, path []Node) error { 
  2.     ...... 
  3.     querier, err := q.Querier(ctx, timestamp.FromTime(mint), timestamp.FromTime(s.End)) 
  4.     ...... 
  5.     case *VectorSelector: 
  6.         ....... 
  7.         set, wrn, err = querier.Select(params, n.LabelMatchers...) 
  8.         ...... 
  9.         n.unexpandedSeriesSet = set 
  10.     ...... 
  11.     case *MatrixSelector: 
  12.         ...... 
  13. return nil 

可以看到這個求值函數,只對VectorSelector/MatrixSelector進行操作,針對我們的Promql也就是只對葉子節點VectorSelector有效。

 

select

獲取對應數據的核心函數就在querier.Select。我們先來看下qurier是如何得到的.

  1. querier, err := q.Querier(ctx, timestamp.FromTime(mint), timestamp.FromTime(s.End)) 

根據時間戳范圍去生成querier,里面最重要的就是計算出哪些block在這個時間范圍內,并將他們附著到querier里面。具體見函數

  1. func (db *DB) Querier(mint, maxt int64) (Querier, error) { 
  2.     for _, b := range db.blocks { 
  3.         ...... 
  4.         // 遍歷blocks挑選block 
  5.     } 
  6.     // 如果maxt>head.mint(即內存中的block),那么也加入到里面querier里面。 
  7.     if maxt >= db.head.MinTime() { 
  8.         blocks = append(blocks, &rangeHead{ 
  9.             head: db.head, 
  10.             mint: mint, 
  11.             maxt: maxt, 
  12.         }) 
  13.     } 
  14.     ...... 

 

知道數據在哪些block里面,我們就可以著手進行計算VectorSelector的數據了。

  1. // labelMatchers {job:api-server} {__name__:http_requests} {group:production} 
  2.  querier.Select(params, n.LabelMatchers...) 

有了matchers我們很容易的就能夠通過倒排索引取到對應的series。為了篇幅起見,我們假設數據都在headBlock(也就是內存里面)。那么我們對于倒排的計算就如下圖所示:

 

這樣,我們的VectorSelector節點就已經有了最終的數據存儲地址信息了,例如圖中的memSeries refId=3和4。


 

如果想了解在磁盤中的數據尋址,可以詳見筆者之前的博客

  1. <<Prometheus時序數據庫-磁盤中的存儲結構>> 

通過populateSeries找到對應的數據,那么我們就可以通過evaluator.Eval獲取最終的結果了。計算采用后序遍歷,等下層節點返回數據后才開始上層節點的計算。那么很自然的,我們先計算VectorSelector。

  1. func (ev *evaluator) eval(expr Expr) Value { 
  2.     ...... 
  3.     case *VectorSelector: 
  4.     // 通過refId拿到對應的Series 
  5.     checkForSeriesSetExpansion(ev.ctx, e) 
  6.     // 遍歷所有的series 
  7.     for i, s := range e.series { 
  8.         // 由于我們這邊考慮的是instant query,所以只循環一次 
  9.         for ts := ev.startTimestamp; ts <= ev.endTimestamp; ts += ev.interval { 
  10.             // 獲取距離ts最近且小于ts的最近的sample 
  11.             _, v, ok := ev.vectorSelectorSingle(it, e, ts) 
  12.             if ok { 
  13.                     if ev.currentSamples < ev.maxSamples { 
  14.                         // 注意,這邊的v對應的原始t被替換成了ts,也就是instant query timeStamp 
  15.                         ss.Points = append(ss.Points, Point{V: v, T: ts}) 
  16.                         ev.currentSamples++ 
  17.                     } else { 
  18.                         ev.error(ErrTooManySamples(env)) 
  19.                     } 
  20.                 } 
  21.             ...... 
  22.         } 
  23.     } 

如代碼注釋中看到,當我們找到一個距離ts最近切小于ts的sample時候,只用這個sample的value,其時間戳則用ts(Instant Query指定的時間戳)代替。

其中vectorSelectorSingle值得我們觀察一下:

  1. func (ev *evaluator) vectorSelectorSingle(it *storage.BufferedSeriesIterator, node *VectorSelector, ts int64) (int64, float64, bool){ 
  2.     ...... 
  3.     // 這一步是獲取>=refTime的數據,也就是我們instant query傳入的 
  4.     ok := it.Seek(refTime) 
  5.     ...... 
  6.         if !ok || t > refTime {  
  7.         // 由于我們需要的是<=refTime的數據,所以這邊回退一格,由于同一memSeries同一時間的數據只有一條,所以回退的數據肯定是<=refTime的 
  8.         t, v, ok = it.PeekBack(1) 
  9.         if !ok || t < refTime-durationMilliseconds(LookbackDelta) { 
  10.             return 0, 0, false 
  11.         } 
  12.     } 

就這樣,我們找到了series 3和4距離Instant Query時間最近且小于這個時間的兩條記錄,并保留了記錄的標簽。這樣,我們就可以在上層進行聚合。

 

SUM by聚合

葉子節點VectorSelector得到了對應的數據后,我們就可以對上層節點AggregateExpr進行聚合計算了。代碼棧為:

  1. evaluator.rangeEval 
  2.     |->evaluate.eval.func2 
  3.         |->evelator.aggregation grouping keygroup 

具體的函數如下圖所示:

  1. func (ev *evaluator) aggregation(op ItemType, grouping []string, without bool, param interface{}, vec Vector, enh *EvalNodeHelper) Vector { 
  2.     ...... 
  3.     // 對所有的sample 
  4.     for _, s := range vec { 
  5.         metric := s.Metric 
  6.         ...... 
  7.         group, ok := result[groupingKey]  
  8.         // 如果此group不存在,則新加一個group 
  9.         if !ok { 
  10.             ...... 
  11.             result[groupingKey] = &groupedAggregation{ 
  12.                 labels:     m, // 在這里我們的m=[group:production] 
  13.                 value:      s.V, 
  14.                 mean:       s.V, 
  15.                 groupCount: 1, 
  16.             } 
  17.             ...... 
  18.         } 
  19.         switch op { 
  20.         // 這邊就是對SUM的最終處理 
  21.         case SUM
  22.             group.value += s.V 
  23.         ..... 
  24.         } 
  25.     } 
  26.     ..... 
  27.     for _, aggr := range result { 
  28.         enh.out = append(enh.out, Sample{ 
  29.         Metric: aggr.labels, 
  30.         Point:  Point{V: aggr.value}, 
  31.         }) 
  32.     } 
  33.     ...... 
  34.     return enh.out 

好了,有了上面的處理,我們聚合的結果就變為:

 

這個和我們的預期結果一致,一次查詢的過程就到此結束了。

總結

 

Promql是非常強大的,可以滿足我們的各種需求。其運行原理自然也激起了筆者的好奇心,本篇文章雖然只分析了一條簡單的Promql,但萬變不離其宗,任何Promql都是類似的運行邏輯。希望本文對讀者能有所幫助。

 

責任編輯:武曉燕 來源: 解Bug之路
相關推薦

2021-03-08 10:18:55

數據庫數據Prometheus

2021-02-22 10:37:47

存儲Prometheus

2021-03-01 10:20:52

存儲

2022-07-06 15:41:55

數據庫

2022-09-23 07:44:48

時序數據庫物聯網

2017-11-20 11:37:19

時序數據數據存儲HBase

2021-09-26 10:08:33

TSDB時序數據庫壓縮解壓

2022-07-11 10:45:12

數據庫分析

2020-03-11 09:50:21

時序數據庫快速檢索

2022-07-11 11:12:32

數據分析

2022-12-18 19:38:31

時序數據庫數據庫

2021-08-31 14:01:59

時序數據庫數據庫數據

2022-07-07 12:23:29

數據庫

2022-06-10 17:37:37

數據庫

2022-07-07 12:37:27

數據

2018-06-26 09:37:07

時序數據庫FacebookNoSQL

2017-09-05 14:45:14

時序數據數據庫大數據

2021-08-04 05:49:40

數據庫數時序數據庫技術

2019-05-30 08:31:39

數據庫QTSDB分布式

2018-04-16 08:44:51

InfluxDB TS時序數據庫存儲
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本成人在线免费视频 | 久久免费大片 | 免费一级毛片 | 国产精品久久久久久久久久久久 | 黄网站免费观看 | 国产亚洲一区在线 | 成人在线精品 | 久久久精| 中文字幕在线观看日韩 | 欧美视频三区 | 天堂在线一区 | 午夜精品久久久久久久久久久久久 | 95国产精品| 国产精品一区在线 | 国产成人综合网 | 亚洲欧美视频一区 | 成人国产毛片 | 中文字幕视频在线看5 | www亚洲精品 | 欧美中文字幕在线观看 | 伊人天堂网 | 毛片a级毛片免费播放100 | 一区二区三区欧美大片 | av一区二区三区四区 | 一区二区三区视频在线观看 | 国产一区欧美 | 欧美老妇交乱视频 | 国产 91 视频| 国产欧美精品一区二区色综合朱莉 | 久久久久国产一区二区三区四区 | 欧美a在线 | 九九av| 性视频一区 | 日韩精品一区二区三区免费观看 | 欧美成年人 | 蜜桃av鲁一鲁一鲁一鲁 | 伊人免费视频二 | 亚洲小视频 | 免费的av网站 | 亚洲91视频 | 日韩一区二区在线视频 |