成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

通過禁止比較讓Go二進制文件變小

開發 后端
本文中我會深入講解在 Go 程序的上下文中“相等”的意義,以及為什么像這樣的修改會對 Go 程序的大小有重大的影響。

[[327277]]

大家常規的認知是,Go 程序中聲明的類型越多,生成的二進制文件就越大。這個符合直覺,畢竟如果你寫的代碼不去操作定義的類型,那么定義一堆類型就沒有意義了。然而,鏈接器的部分工作就是檢測沒有被程序引用的函數(比如說它們是一個庫的一部分,其中只有一個子集的功能被使用),然后把它們從最后的編譯產出中刪除。常言道,“類型越多,二進制文件越大”,對于多數 Go 程序還是正確的。

本文中我會深入講解在 Go 程序的上下文中“相等”的意義,以及為什么像這樣的修改會對 Go 程序的大小有重大的影響。

定義兩個值相等

Go 的語法定義了“賦值”和“相等”的概念。賦值是把一個值賦給一個標識符的行為。并不是所有聲明的標識符都可以被賦值,如常量和函數就不可以。相等是通過檢查標識符的內容是否相等來比較兩個標識符的行為。

作為強類型語言,“相同”的概念從根源上被植入標識符的類型中。兩個標識符只有是相同類型的前提下,才有可能相同。除此之外,值的類型定義了如何比較該類型的兩個值。

例如,整型是用算數方法進行比較的。對于指針類型,是否相等是指它們指向的地址是否相同。映射和通道等引用類型,跟指針類似,如果它們指向相同的地址,那么就認為它們是相同的。

上面都是按位比較相等的例子,即值占用的內存的位模式是相同的,那么這些值就相等。這就是所謂的 memcmp,即內存比較,相等是通過比較兩個內存區域的內容來定義的。

記住這個思路,我過會兒再來談。

結構體相等

除了整型、浮點型和指針等標量類型,還有復合類型:結構體。所有的結構體以程序中的順序被排列在內存中。因此下面這個聲明:

  1. type S struct {
  2. a, b, c, d int64
  3. }

會占用 32 字節的內存空間;a 占用 8 個字節,b 占用 8 個字節,以此類推。Go 的規則說如果結構體所有的字段都是可以比較的,那么結構體的值就是可以比較的。因此如果兩個結構體所有的字段都相等,那么它們就相等。

  1. a := S{1, 2, 3, 4}
  2. b := S{1, 2, 3, 4}
  3. fmt.Println(a == b) // 輸出 true

編譯器在底層使用 memcmp 來比較 a 的 32 個字節和 b 的 32 個字節。

填充和對齊

然而,在下面的場景下過分簡單化的按位比較的策略會返回錯誤的結果:

  1. type S struct {
  2. a byte
  3. b uint64
  4. c int16
  5. d uint32
  6. }
  7.  
  8. func main()
  9. a := S{1, 2, 3, 4}
  10. b := S{1, 2, 3, 4}
  11. fmt.Println(a == b) // 輸出 true
  12. }

編譯代碼后,這個比較表達式的結果還是 true,但是編譯器在底層并不能僅依賴比較 ab 的位模式,因為結構體有填充

Go 要求結構體的所有字段都對齊。2 字節的值必須從偶數地址開始,4 字節的值必須從 4 的倍數地址開始,以此類推 1。編譯器根據字段的類型和底層平臺加入了填充來確保字段都對齊。在填充之后,編譯器實際上看到的是 2

  1. type S struct {
  2. a byte
  3. _ [7]byte // 填充
  4. b uint64
  5. c int16
  6. _ [2]int16 // 填充
  7. d uint32
  8. }

填充的存在保證了字段正確對齊,而填充確實占用了內存空間,但是填充字節的內容是未知的。你可能會認為在 Go 中 填充字節都是 0,但實際上并不是 — 填充字節的內容是未定義的。由于它們并不是被定義為某個確定的值,因此按位比較會因為分布在 s 的 24 字節中的 9 個填充字節不一樣而返回錯誤結果。

Go 通過生成所謂的相等函數來解決這個問題。在這個例子中,s 的相等函數只比較函數中的字段略過填充部分,這樣就能正確比較類型 s 的兩個值。

類型算法

呵,這是個很大的設置,說明了為什么,對于 Go 程序中定義的每種類型,編譯器都會生成幾個支持函數,編譯器內部把它們稱作類型的算法。如果類型是一個映射的鍵,那么除相等函數外,編譯器還會生成一個哈希函數。為了維持穩定,哈希函數在計算結果時也會像相等函數一樣考慮諸如填充等因素。

憑直覺判斷編譯器什么時候生成這些函數實際上很難,有時并不明顯,(因為)這超出了你的預期,而且鏈接器也很難消除沒有被使用的函數,因為反射往往導致鏈接器在裁剪類型時變得更保守。

通過禁止比較來減小二進制文件的大小

現在,我們來解釋一下 Brad 的修改。向類型添加一個不可比較的字段 3,結構體也隨之變成不可比較的,從而強制編譯器不再生成相等函數和哈希函數,規避了鏈接器對那些類型的消除,在實際應用中減小了生成的二進制文件的大小。作為這項技術的一個例子,下面的程序:

  1. package main
  2.  
  3. import "fmt"
  4.  
  5. func main() {
  6. type t struct {
  7. // _ [0][]byte // 取消注釋以阻止比較
  8. a byte
  9. b uint16
  10. c int32
  11. d uint64
  12. }
  13. var a t
  14. fmt.Println(a)
  15. }

用 Go 1.14.2(darwin/amd64)編譯,大小從 2174088 降到了 2174056,節省了 32 字節。單獨看節省的這 32 字節似乎微不足道,但是考慮到你的程序中每個類型及其傳遞閉包都會生成相等和哈希函數,還有它們的依賴,這些函數的大小隨類型大小和復雜度的不同而不同,禁止它們會大大減小最終的二進制文件的大小,效果比之前使用 -ldflags="-s -w" 還要好。

最后總結一下,如果你不想把類型定義為可比較的,可以在源碼層級強制實現像這樣的奇技淫巧,會使生成的二進制文件變小。

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2024-10-30 09:50:51

WebGo語言

2009-08-12 18:06:53

C#讀取二進制文件

2009-12-16 10:49:42

Ruby操作二進制文件

2020-10-19 11:35:47

Ghidra逆向分析G

2009-12-10 09:24:50

PHP函數fwrite

2023-09-18 23:50:25

二進制文件裁剪Layout

2020-10-21 09:49:31

Ghidra逆向分析

2013-04-28 15:37:35

JBoss

2024-02-01 09:04:12

2009-11-02 11:27:42

VB.NET二進制文件

2009-02-27 09:37:33

Google二進制代碼

2018-10-22 14:37:16

二進制數據存儲

2022-10-31 08:02:42

二進制計算乘法

2023-12-26 15:10:00

處理二進制文件

2022-01-26 00:02:01

Go二進制元信息

2010-06-09 13:02:29

MySQL啟用二進制日

2010-10-13 15:45:23

MySQL二進制日志

2017-04-11 10:48:53

JS二進制

2022-07-26 13:00:01

安全符號源代碼

2021-04-21 18:57:16

二進制存儲空間
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一级视频在线观看 | 日韩福利| 国产成人综合在线 | 国产成人精品久久二区二区91 | 欧美激情五月 | 国产精品久久久久久久久久久久久久 | 精品自拍视频在线观看 | 一区二区三区欧美 | www.日本三级 | 国产日韩欧美二区 | 精品国产乱码久久久久久图片 | 最新国产精品视频 | 一区二区播放 | 91在线观看免费视频 | 91免费在线 | 精品视频在线免费观看 | 国产精品99视频 | 日本一区二区不卡 | 国产视频中文字幕 | 精品国产黄a∨片高清在线 www.一级片 国产欧美日韩综合精品一区二区 | 久久久久久91香蕉国产 | 亚洲精品中文字幕 | 欧美日韩一区二区在线 | 波多野结衣一区二区三区在线观看 | 日本精品久久久久久久 | 日本午夜视频 | 欧美激情精品久久久久久 | 狠狠爱免费视频 | 日韩在线观看网站 | 久久精选| 色婷婷综合网 | 91av视频| 国产精品一二三区 | 日韩免费在线观看视频 | 婷婷色在线播放 | 国产午夜精品一区二区三区嫩草 | 羞羞视频在线观看免费观看 | 欧美a级网站 | 97国产在线视频 | 五月综合激情在线 | 亚洲人成网亚洲欧洲无码 |