請求量太大下游扛不住怎么辦？進來學一招

作者：小樓MrRoshi 2022-12-26 09:16:56

如果只是改邏輯合并一下請求，吭哧吭哧改代碼就完了，也不值得寫這篇文章了，如何改最少的代碼來實現合并請求才是最難的。

背景

這個問題簡單說一下背景，如果不明白可以看上篇文章，不想看也沒關系，這是個通用的解法，后面我會總結抽象下。

在上篇文章的最后提到對每個摘除的地址做決策時，需要順序執行，且每一個要摘除的地址都要實時獲取該集群的地址信息，以便做出是否需要兜底的決策。

當被摘除的機器非常多時，獲取地址信息的請求量就會非常大，對注冊中心造成了不小的壓力。

請求數據源的接口如下所示（其中 cuuid 是集群的 id）

type Read interface {
 ListClusterEndpoints(ctx context.Context, cuuid string) ([]ptypes.Endpoint, error)
}

相信大家也能理解這個非常簡單的背景并且能想到一些解法。每次決策需要按 cuuid 獲取集群，也就是單個單個地獲取實時集群地址信息，由于是實時信息，緩存首先排除，其次自然而然地能想到如果能將請求合并一下，是不是就能解決請求量大的問題？

難點

如果只是改邏輯合并一下請求，吭哧吭哧改代碼就完了，也不值得寫這篇文章了，如何改最少的代碼來實現合并請求才是最難的。

解法

那天遇到這個問題，晚上輾轉反側想到了這個解法，其實主要也是參考 Go http client 的實現，都說看源碼沒用，這不就是用處么？

Read? 數據源接口定義保持不變，也就是上層的業務代碼完全不用改，只需要把 ListClusterEndpoints 的實現換掉。

我們可以用一個隊列把每個請求入隊，入隊列以后，調用方阻塞，然后起一些協程去隊列里取一批請求參數，發起批量請求，響應之后喚醒阻塞的調用方。

為此，我們實現一個可以阻塞并被其他協程喚醒的工具：

type token struct {
 value interface{}
 err   error
}

type Token chan token

func NewToken() Token {
 return make(Token, 1)
}

func (t Token) Done(value interface{}, err error) {
 t <- token{value: value, err: err}
}

func (t Token) Wait(timeout time.Duration) (value interface{}, err error) {
 if timeout <= 0 {
  tk := <-t
  return tk.value, tk.err
 }

 select {
 case tk := <-t:
  return tk.value, tk.err
 case <-time.After(timeout):
  return nil, ErrTokenTimeout
 }
}

其次，定義隊列和其他參數：

type DataSource struct {
 paramCh chan param
 readTimeout time.Duration
 concurrency int
 step int
}

type param struct {
 cuuid string
 token Token
}

替換掉原來 ListClusterEndpoints 的實現：

func (p *DataSource) ListClusterEndpoints(ctx context.Context, cuuid string) ([]ptypes.Endpoint, error) {
 req := param{
  cuuid: cuuid,
  token: NewToken(),
 }

 select {
 case p.paramCh <- req:
 default:
  return nil, fmt.Errorf("list cluster endpoints write channel failed")
 }

 value, err := req.token.Wait(p.readTimeout)
 if err != nil {
  return nil, err
 }
 eps, ok := value.([]ptypes.Endpoint)
 if !ok {
  return nil, fmt.Errorf("value is not endpoints")
 }
 return endpoints, nil
}

再起幾個協程來處理任務：

func (p *DataSource) startListClusterEndpointsLoop() {
 for i := 0; i < p.concurrency; i++ {
  go func() {
   for {
    reqs := p.getListClusterEndpointsReqFromChan()
    p.doBatchListClusterEndpoints(reqs)
   }
  }()
 }
}

最關鍵的是 getListClusterEndpointsReqFromChan 的實現，既不能讓協程空跑，這樣太消耗cpu，又要能及時地取到一批參數，我們采取的方法是先阻塞地獲取一個參數，如果沒數據則阻塞，如果有數據，繼續取，直到數量達到上限或者取不到數據為止，此時這一批數據就可以批量地進行調用了。

func (p *DataSource) getListClusterEndpointsReqFromChan() []param {
 reqs := make([]param, 0)
 select {
 case req := <-p.paramCh:
  reqs = append(reqs, req)
  for i := 1; i < p.step; i++ {
   select {
   case reqNext := <-p.paramCh:
    reqs = append(reqs, reqNext)
   default:
    break
   }
  }
 }
 return reqs
}

最后

這個方法很簡單，但是有一些要注意的地方，得做好監控，比如調用方單個請求的QPS、RT，實際批量請求的QPS、RT，這樣才好計算出處理協程開多少個合適，還有隊列寫入失敗、隊列長度等等監控，當容量不足時及時做出調整。

責任編輯：武曉燕來源：捉蟲大師

請求量代碼 QPS

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

請求量太大下游扛不住怎么辦？進來學一招

背景

難點

解法

最后