面試官:請說一下如何優化結構體性能?
?前言
之前分享過2篇結構體文章:10秒改struct性能直接提升15%,產品姐姐都夸我好棒? 和 ??Go語言空結構體這3種妙用,你知道嗎??? 得到了大家的好評。
這篇繼續分享進階內容:
結構體的定義,大家都很熟悉,想要定義出更節省內存空間的結構體,可不是一件簡單的事。
我們必須掌握Go的結構體內存對齊機制,才能做出相應的優化:節省內存并提高性能。
先來看個例子
下面定義兩個結構體,字段都一樣,只是部分字段稍微調整了一下順序。
但輸出的結果卻完全不同:一個順序調整就節省了8個字節,太神奇了。
為什么bad占用24字節,而good卻只占用16字節呢?
想要解開這個問題,我們得先來學習一下內存對齊機制,然后再來進一步分析。
原理講解
基本概念
為了能讓CPU可以更快的存儲、讀取到各個字段,Go編譯器會幫我們把結構體做數據的對齊。
所謂的數據對齊,是指內存地址的大小是所存儲數據大小的整數倍(按字節為單位),以便CPU可以一次將該數據從內存中讀取出來,減少了讀取次數。
編譯器通過在結構體的各個字段之間填充一些空白,來達到對齊的目的。
CPU訪問內存
CPU 訪問內存時,并不是逐個字節訪問,而是以機器字(word)為單位進行訪問。
比如 64位CPU的字長(word size)為8bytes,那么CPU訪問內存的單位也是8字節,每次加載的內存數據也是固定的若干字長,如8words(64bytes)、16words(128bytes)等
對齊系數
不同硬件平臺占用的大小和對齊值都可能是不一樣的,每個特定平臺上的編譯器都有自己的默認"對齊系數",32位系統對齊系數是4,64位系統對齊系數是8
不同類型的對齊系數也可能不一樣,使用Go?語言中的unsafe.Alignof?函數可以返回相應類型的對齊系數,對齊系數都符合2^n這個規律,最大也不會超過8
對齊原則
- 結構體變量中成員的偏移量必須是成員大小的整數倍
- 整個結構體的內存大小必須是最大字節的整數倍(結構體的內存占用是1/4/8/16byte…)
案例分析
BadSt結構體,占用24個字節
分析過程:
- 字段A 4字節:先計算偏移量,最開頭下標為0,0%4=0,正好整除,先占用4個字節;
- 字段B 8字節:下標4-7,對8都不能整除,則填充空白,下標8可以整除,所以下標8-15 8個字節為字段B的存儲使用;
- 字段C 1字節:下標16,對1可以整除,所以下標16則用作字段C的存儲;
- 最后,該結構體字段最大字節為8且目前已占用17字節,要保證是整數倍,所以最后面需要填充7個字節,占滿24字節,才能滿足條件(對齊原則2)。
GoodSt結構體,占用16個字節
分析過程:
- 字段A 4字節:先計算偏移量,最開頭下標為0,0%4=0,正好整除,先占用4個字節;
- 字段C 1字節:下標4,對1可以整除,所以下標4則用作字段C的存儲;
- 字段B 8字節:下標5-7,對8都不能整除,則填充空白,下標8可以整除,所以下標8-15 8個字節為字段B的存儲使用;
- 最后,該結構體字段最大字節為8且目前已占用16字節,正好是整數倍,所以后面不再需要填充空白了。
總結
通過上文的原理講解和案例分析,我們發現內存對齊機制并不復雜。
可以簡單理解為:將對齊系數小的字段,盡可能放在一起,盡量減少空白填充。
掌握了內存對齊機制后,結構體Struct的優化,調整下字段順序,效果立竿見影。內存對齊其實就是典型的空間換時間的方式,來達到優化的目的。牢記對齊原則,對實際場景進行分析,減少空白填充。
本文轉載自微信公眾號「 程序員升級打怪之旅」,作者「王中陽Go」,可以通過以下二維碼關注。
轉載本文請聯系「 程序員升級打怪之旅」公眾號。