成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<s id="eogkw"><tbody id="eogkw"></tbody></s><del id="eogkw"></del>

<pre id="eogkw"></pre>

<table id="eogkw"><source id="eogkw"></source></table>

<center id="eogkw"><table id="eogkw"></table></center><button id="eogkw"></button>

<abbr id="eogkw"></abbr>

<s id="eogkw"></s>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

Thrift 序列化協議淺析

作者：字節跳動技術團隊 2022-07-27 22:36:16

Thrift 是 Facebook 開源的一個高性能，輕量級 RPC 服務框架，是一套全棧式的 RPC 解決方案，包含序列化與服務通信能力，并支持跨平臺/跨語言。

作者｜楊晨曦

背景

Thrift 是 Facebook 開源的一個高性能，輕量級 RPC 服務框架，是一套全棧式的 RPC 解決方案，包含序列化與服務通信能力，并支持跨平臺/跨語言。整體架構如圖所示：

Thrift 軟件棧定義清晰，各層的組件松耦合、可插拔，能夠根據業務場景靈活組合，如圖所示：

Thrift 本身是一個比較大的話題，這篇文章不會涉及到全部內容，只會涉及到其中的序列化協議。

協議原理

Binary 協議

消息格式

這里通過一個示例對 Binary 消息格式進行直觀的展示，IDL 定義如下：

// 接口
service SupService {
    SearchDepartmentByKeywordResponse SearchDepartmentByKeyword(
        1: SearchDepartmentByKeywordRequest request)
}

// 請求
struct SearchDepartmentByKeywordRequest {
    1: optional string Keyword
    2: optional i32 Limit      
    3: optional i32 Offset 
}

// 假設request的payload如下：
{
    Keyword: "lark",
    Limit: 50,
    Offset: nil,        
}

編碼簡圖

編碼具體內容

抓包拿到編碼后的字節流（轉成了十進制，方便大家看）

/* 接口名長度 */         0   0   0    25
/* 接口名 */            83  101  97  114  99  104  68  101  112  97  114  116
                       109  101  110  116  66  121  75  101  121  119  111
                       114  100
/* 消息類型 */           1
/* 消息序號 */           0   0   0   1
/* keyword 字段類型 */   11
/* keyword 字段ID*/     0   1
/* keyword len */      0   0   0   4
/* keyword value */    108   97   114   107
/* limit 字段類型 */     8
/* limit 字段ID*/       0   2
/* limit value */      0   0   0   50
/* 字段終止符 */         0

編碼含義

消息頭

msg_type：消息類型，包含四種類型

Call：客戶端消息。調用遠程方法，并且期待對方發送響應。
OneWay：客戶端消息。調用遠程方法，不期待響應。
Reply：服務端消息。正常響應。
Exception：服務端消息。異常響應。

msg_seq_id：消息序號?？蛻舳耸褂孟⑿蛱杹硖幚眄憫氖虻竭_，實現請求和響應的匹配。服務端不需要檢查該序列號，也不能對序列號有任何的邏輯依賴，只需要響應的時候將其原樣返回即可。

消息體

消息體分為兩種編碼模式：

定長類型 -> T-V 模式，即：字段類型 + 序號 + 字段值
變長類型 -> T-L-V 模式，即：字段類型 + 序號 + 字段長度 + 字段值

field_type：字段類型，包括 String、I64、Struct、Stop 等。字段類型有兩個作用：

Stop 類型用于停止嵌套解析
非 Stop 類型用于 Skip（Skip 操作是跳過當前字段，會在「常見問題 - 兼容性」進行講解）

fied_id：字段序號，解碼時通過序號確定字段
len：字段長度，用于變長類型，如 String
value：字段值

數據格式

1. 定長數據類型

數據類型	類型標識(8 位)	類型尺寸（單位：字節）
bool	2	1
byte	3	1
double	4	8
i16	6	2
i32	8	4
i64	10	8

2. 變長數據類型

數據類型	類型標識（8 位）	類型尺寸（長度 + 值）
string	11	4 + N
struct	12	嵌套數據 + 一個字節停止符（0）
map	13	1 + 1 + 4 + N*(X+Y) 【key 類型 + val 類型 + 長度 + 值】
set	14	1 + 4 + N 【val 類型 + 長度 + 值】
list	15	1 + 4 + N 【val 類型 + 長度 + 值】

其他協議

Compact 協議

Compact 協議是二進制壓縮協議，在大部分字段的編碼方式上與 Binary 協議保持一致。區別在于整數類型（包括變長類型的長度）采用了【先 zigzag 編碼，再 varint 壓縮編碼】實現，最大化節省空間開銷。

那么問題來了，varint 和 zigzag 是什么？

varint 編碼

解決的問題：定長存儲的整數類型絕對值較小時空間浪費大

據統計，RPC 通信時大部分時候傳遞的整數值都很小，如果使用定長存儲會很浪費。

舉個 ??，對 i32 類型的 7 進行編碼，可以說前面 3 個字節都浪費了：

00000000 00000000 00000000 00000111

解決思路：將整數類型由定長存儲轉為變長存儲（能用 1 個字節存下就堅決不用 2 個字節）

原理并不復雜，就是將整數按 7bit 分段，每個字節的最高位作為標識位，標識后一個字節是否屬于該數據。1 代表后面的字節還是屬于當前數據，0 代表這是當前數據的最后一個字節。

以 i32 類型，數值 955 為例，可以看出，由原來的 4 字節壓縮到了 2 字節：

binary編碼：       00000000  00000000  00000011  10111011
切分：        0000  0000000   0000000   0000111   0111011
compact編碼：                          00000111  10111011

當然，varint 編碼同樣存在缺陷，那就是存儲大數的時候，反而會比 binary 的空間開銷更大：本來 4 個字節存下的數可能需要 5 個字節，8 個字節存下的數可能需要 10 個字節。

zigzag 編碼

解決的問題：絕對值較小的負數經過 varint 編碼后空間開銷較大舉個 ??，i32 類型的負數（-11）

原碼：         10000000  00000000  00000000  00001011
反碼：         11111111  11111111  11111111  11110100
補碼：         11111111  11111111  11111111  11110101
varint編碼：   00001111  11111111  11111111  11111111  11110101

顯然，對于絕對值較小的負數，用 varint 編碼以后前導 1 過多，難以壓縮，空間開銷比 binary 編碼還大。

解決思路：負數轉正數，從而把前導 1 轉成前導 0，便于 varint 壓縮

算法公式 & 步驟 & 示范：

// 算法公式
32位： (n << 1) ^ (n >> 31)
64位： (n << 1) ^ (n >> 63)


/*
 * 算法步驟：
 * 1. 不分正負：符號位后置，數值位前移
 * 2. 對于負數：符號位不變，數值位取反
 */


// 示例
負數(-11）
  補碼：                     11111111  11111111  11111111  11110101
  符號位后置，數值位前移：      11111111  11111111  11111111  11101011
  符號位不變，數值位取反(21)：  00000000  00000000  00000000  00010101

正數(11）
  補碼：                     00000000  00000000  00000000  00010101
  符號位后置，數值位前移(22)：  00000000  00000000  00000000  00101010

【奇怪的知識】為什么取名叫 zigzag？

因為這個算法將負數編碼成正奇數，正數編碼成偶數。最后效果是正負數穿插向前，就像這樣：

編碼前       編碼后
  0           0
  -1          1
  1           2
  -2          3
  2           4

Json 協議

Thrift 不僅支持二進制序列化協議，也支持 Json 這種文本協議

數據格式

/* bool、i8、i16、i32、i64、double、string */
"編號": {
  "類型": "值"
}
// 示例
"1": {
  "str": "keyword"
}


/* struct */
"編號": {
  "rec": {
    "成員編號": {
      "成員類型": "成員值"
    },
    ...
  }
}
// 示例
"1": {
  "rec": {
    "1": {
      "i32": 50
    }
  }
}


/* map */
"編號": {
  "map": [
    "鍵類型",
    "值類型",
    元素個數,
      "鍵1",
      "值1",
      ...
      "鍵n",
      "值n"
   ]
}
// 示例
"6": {
  "map": [
    "i64",
    "str",
    1,
    666,
    "mapValue"
  ]
}


/* List */
"編號": {
  "set/lst": [
    "值類型",
    元素個數,
    "ele1",
    "ele2",
    "elen"
  ]
}
// 示例
"2": {
  "lst": [
    "str",
    2,
    "lark","keyword"]
}

case 分析

修改字段類型導致 RPC 超時

現象：A 服務訪問 B 服務，業務邏輯短時間處理完，但整個請求 15s 超時，必現。

直接原因：IDL 類型被修改；并且只升級了服務端（B 服務），沒升級客戶端（A 服務）

本質原因：string 是變長編碼，i64 是定長編碼。由于客戶端沒有升級，所以反序列化的時候，會把 signTime 當做 string 類型來解析。而變長編碼是 T-L-V 模式，所以解析的時候會把 signTime 的低位 4 字節翻譯成 string 的 length。

signTime 是時間戳，大整數，比如：1624206147902，轉成二進制為：

00000000 00000000 00000001 01111010 00101010 00111011 00000001 00111110

低位 4 字節轉成十進制為：378

也就是要再讀 378 個字節作為 SignTime 的值，這已經超過了整個 payload 的大小，最終導致 Socket 讀超時。

【注】修改類型不一定就會導致超時，如果 value 的值比較小，解析到的 length 也比較小，能夠保證讀完。但是錯誤的解析可能會導致各種預期之外的情況，包括：
亂碼
空值
報錯：unknown data type xxx （skip 異常）

常見問題

兼容性

增加字段

通過 skip 來跳過增加的字段，從而保證兼容性

刪除字段

編譯生成的解析代碼是基于 field_id 的 switch-case 結構，語法結構上直接具備兼容性。

修改字段名

不破壞兼容性，因為 binary 協議不會對 name 進行編碼

Exception

Thrift 有兩種 Exception，一種是框架內置的異常，一種是 IDL 自定義的異常。

框架內置的異常包括：「方法名錯誤」、「消息序列號錯誤」、「協議錯誤」，這些異常由框架捕獲并封裝成 Exception 消息，反序列化時會轉成 error 并拋給上層，邏輯如下：

另一種異常是由用戶在 IDL 中自定義的，關鍵字是 exception，用法上跟 struct 沒有太大區別。

optional、require 實現原理

optional 表示字段可填，require 表示必填

字段被標識為 optional 之后：

基本類型會被編譯為指針類型
序列化代碼會做空值判斷，如果字段為空，則不會被編碼

字段被標識為 require 之后：

基本類型會被編譯為非指針類型（復合類型 optional 和 require 沒區別）
序列化不會做空值判斷，字段一定會被編碼。如果沒有顯式賦值，就編碼默認值（默認空值，或者 IDL 顯式指定的默認值）?

責任編輯：未麗燕來源：字節跳動技術團隊

Thrift RPC 開源

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：日韩二三区 | av在线播放网址 | 日本精品久久 | 亚洲欧美日韩中文字幕一区二区三区 | 99久久精品国产麻豆演员表 | 欧美黄片免费观看 | 一区二区三区高清在线观看 | 四虎成人免费电影 | 亚洲超碰在线观看 | 黄色在线免费观看 | 久久精品一区二区三区四区 | 中文精品视频 | 毛片久久久 | 久久久视频在线 | 欧美日韩在线国产 | 精品国产青草久久久久96 | 日本久久久久久 | 国产精品久久a | 国产人成在线观看 | 国产精品久久久久久中文字 | 亚洲成人精品一区 | 久久国产婷婷国产香蕉 | 欧美精品91 | 日韩激情在线 | 亚洲精品一区二区网址 | 黄色成人在线网站 | 成人一区精品 | 在线免费观看黄a | 亚洲视频在线看 | 成人国产在线观看 | 国产一伦一伦一伦 | 一级片av | 欧美日韩中文在线观看 | 亚洲精品成人在线 | 爱综合 | 日韩精品免费在线观看 | aaa综合国产| 日韩在线国产精品 | 精品欧美一区二区在线观看 | 久久国产视频网站 | 成人国产精品一级毛片视频毛片 |

<dl id="iaok8"></dl>

<abbr id="iaok8"></abbr>

<abbr id="iaok8"></abbr>