你了解計算機中大端小端之分嗎?
- 字節序
- 大端字節序
- 小端字節序
- 判斷當前設備大端or小端?
- 尾語
哈嘍,大家好,我是呼嚕嚕,前段時間感冒了,好久沒更新文章了,今天我們來聊聊計算機儲存方式大端小端字節序之分
在計算機中,無論上層是什么開發語言,到了最底層都是以二進制的形式存儲運算的;二進制,與我們更熟悉的十進制(由0-9這九個數字組成,逢十進一)不同的是,只有0和1兩個數字,逢二進一
如今的主流計算機,是以以儲存器為中心,存儲器是用來存放數據和程序,下面是架構圖:
圖片
存儲器 包含主存和輔存,其中主存是能直接與CPU交換信息,就是我們熟悉的內存。
字節序
計算機以二進制的形式將數據存到內存中,內存的基本單位是字節Byte, 內存以字節為單位來進行讀寫 。1Byte = 8bit(bit叫位,也叫比特,是用以描述計算機數據量的最小單位)。字節是內存8位為一組,每組比特都會被標記一個數字,這個數字也叫地址,尋址粒度也是字節
一個字節由于8位,如果它只考慮無符號數,它的表示范圍0~255;如果考慮符號,并通過補碼解決0值的問題,只能表示-128~127這個范圍;那么如果超出這個范圍,只能將多個字節連在一起來表示數值。比如C語言中char類型是1個字節的,int類型占用4個字節,double類型會占用8個字節等等
那么多個字節依次存到內存中,就會有順序,這個叫字節序Endianness,也被稱為端序,就是 大于一個字節類型的數據在內存中的存放順序
字節序可以被分為兩類:Big-Endian大端和Little-Endian小端(這也意味著單個字節沒有大小端之分的),我們下文詳細聊聊
大端字節序
大端字節序Big-Endian:數值的高位字節存放在內存的低地址端,低位字節存放在內存的高地址端
本文這里以32位的數0x12345678,來舉個例子
圖片
該數值,在內存中的存儲順序是:0x12345678。大端字節序有符號數的最高位占據內存最低地址,符號位的判定固定在第1個字節處,符號直接可以取出來,容易判斷正負;另外大端字節序更貼近從左到右的書寫方式,所以更符合我們人類的習慣
大端常常用于網絡協議,被稱為網絡端序,大端用于網絡協議,并不意味它比小端多好,而是網絡的核心是通信,所以大家必須要有共同的標準,即網絡通信的標準化
所以在TCP/IP協議中,RFC1700規定使用大端字節序為網絡字節序,如果使用小端的計算機,接發數據時需要自行將主機字節序轉換為網絡字節序
小端字節序
小端字節序Little-Endian:數值的低位字節存放在內存的低地址端,高位字節存放在內存的高地址端本文這里還是以32位的數0x12345678,來舉個例子
圖片
該數值,在內存中的存儲順序是:0x78563412。小端字節序最大的優點就是
小端字節序序最大的好處是強制轉換數據類型效率較高,比如小數強制轉大數只需要在高位添0;如果大數強制轉小數,直接將高位數據丟棄即可,不需要額外再調整宇節
圖片
而大端字節序則需要調整字節內容,移動數據
圖片
在現代計算機中,大多采用小端字節序,比如x86、DEC VAX、PDP-11等等 當然也有采用大端字節序的,比如:IBM、Sun、PowerPC等處理器 另外ARM系列處理器,大小端字節序都支持,可配置
判斷當前設備大端or小端?
可以寫個小代碼來快速判斷,我們這里以C/C++語言為例:
BOOL IsBigEndian()
{
union NUM
{
int a;
char b;
}num;
num.a = 0x1234;
if( num.b == 0x12 )
{
return TRUE;
}
return FALSE;
}
這里利用聯合體union,所有成員共用同一塊內存的特性,可以輕松地判斷當前設備是否是大小端字節序
尾語
最后補充一個小故事,大端小端名詞來源于Jonathan Swift書寫的《格列佛游記》,書中描述了小人國,因為吃雞蛋是從大頭的一端剝開還是從小頭的一端這個問題,導致教派之間的沖突,連年征戰,死戰不休
這是不是也暗示大端小端爭論,并無較真的意義,怎么好用怎么來,通信交流做好轉換的必要措施即可
到如今,從技術上來說,大小端的并無誰有明顯的優勢,更多的是計算機發展歷史的影響。最初設計時,對字節序的選擇往往是任意的,但后續技術的發展,需要背上兼容性的包裹。比如ARM明明大小端都支持,為啥大部分是小端,主要是移植x86程序方便;
還有RISC-V手冊描述他們選擇了小端序的原因:因為小端字節序,目前在商業上占主導地位(所有x86系統、iOS、Android和Windows for ARM)。想拓寬視野地可以去看看The RISC-V Instruction Set Manual Volume I: Base User-Level ISA
當然也有商業競爭的原因,Intel的x86選擇小端(可能是為了躲避專利糾紛),最終擊敗了IBM,導致如今主機領域小端是主流
參考資料:
《深入理解計算機系統》
https://inst.eecs.berkeley.edu/~cs250/fa11/handouts/riscv-spec.pdf
https://www.spiceworks.com/tech/tech-general/articles/big-endian-vs-little-endian