詳解 Go 團隊不建議用的 Unsafe.Pointer
本文轉載自微信公眾號「腦子進煎魚了」,作者陳煎魚。轉載本文請聯系腦子進煎魚了公眾號。
大家好,我是煎魚。
大家在學習 Go 的時候,肯定都學過 “Go 的指針是不支持指針運算和轉換” 這個知識點。為什么呢?
首先,Go 是一門靜態語言,所有的變量都必須為標量類型。不同的類型不能夠進行賦值、計算等跨類型的操作。
那么指針也對應著相對的類型,也在 Compile 的靜態類型檢查的范圍內。同時靜態語言,也稱為強類型。也就是一旦定義了,就不能再改變它。
錯誤的示例
- func main(){
- num := 5
- numPointer := &num
- flnum := (*float32)(numPointer)
- fmt.Println(flnum)
- }
輸出結果:
- # command-line-arguments
- ...: cannot convert numPointer (type *int) to type *float32
在示例中,我們創建了一個 num 變量,值為 5,類型為 int,準備干一番大事。
接下來我們取了其對于的指針地址后,試圖強制轉換為 *float32,結果失敗...
萬能的破壁 unsafe
針對剛剛的 “錯誤示例”,我們可以采用今天的男主角 unsafe 標準庫來解決。它是一個神奇的包,在官方的詮釋中,有如下概述:
- 圍繞 Go 程序內存安全及類型的操作。
- 很可能會是不可移植的。
- 不受 Go 1 兼容性指南的保護。
簡單來講就是,不怎么推薦你使用,因為它是 unsafe(不安全的)。
但是在特殊的場景下,使用了它,可以打破 Go 的類型和內存安全機制,讓你獲得眼前一亮的驚喜效果。
unsafe.Pointer
為了解決這個問題,需要用到 unsafe.Pointer。它表示任意類型且可尋址的指針值,可以在不同的指針類型之間進行轉換(類似 C 語言的 void * 的用途)。
其包含四種核心操作:
- 任何類型的指針值都可以轉換為 Pointer。
- Pointer 可以轉換為任何類型的指針值。
- uintptr 可以轉換為 Pointer。
- Pointer 可以轉換為 uintptr。
在這一部分,重點看第一點、第二點。你再想想怎么修改 “錯誤的例子” 讓它運行起來?
修改如下:
- func main(){
- num := 5
- numPointer := &num
- flnum := (*float32)(unsafe.Pointer(numPointer))
- fmt.Println(flnum)
- }
輸出結果:
- 0xc4200140b0
在上述代碼中,我們小加改動。通過 unsafe.Pointer 的特性對該指針變量進行了修改,就可以完成任意類型(*T)的指針轉換。
需要注意的是,這時還無法對變量進行操作或訪問,因為不知道該指針地址指向的東西具體是什么類型。不知道是什么類型,又如何進行解析呢?
無法解析也就自然無法對其變更了。
unsafe.Offsetof
在上小節中,我們對普通的指針變量進行了修改。那么它是否能做更復雜一點的事呢?
- type Num struct{
- i string
- j int64
- }
- func main(){
- n := Num{i: "EDDYCJY", j: 1}
- nPointer := unsafe.Pointer(&n)
- niPointer := (*string)(unsafe.Pointer(nPointer))
- *niPointer = "煎魚"
- njPointer := (*int64)(unsafe.Pointer(uintptr(nPointer) + unsafe.Offsetof(n.j)))
- *njPointer = 2
- fmt.Printf("n.i: %s, n.j: %d", n.i, n.j)
- }
輸出結果:
- n.i: 煎魚, n.j: 2
在剖析這段代碼做了什么事之前,我們需要了解結構體的一些基本概念:
- 結構體的成員變量在內存存儲上是一段連續的內存。
- 結構體的初始地址就是第一個成員變量的內存地址。
- 基于結構體的成員地址去計算偏移量。就能夠得出其他成員變量的內存地址。
再回來看看上述代碼,得出執行流程:
- 修改 n.i 值:i 為第一個成員變量。因此不需要進行偏移量計算,直接取出指針后轉換為 Pointer,再強制轉換為字符串類型的指針值即可。
- 修改 n.j 值:j 為第二個成員變量。需要進行偏移量計算,才可以對其內存地址進行修改。在進行了偏移運算后,當前地址已經指向第二個成員變量。接著重復轉換賦值即可。
細節分析
需要注意的是,這里使用了如下方法(來完成偏移計算的目標):
1、uintptr:uintptr 是 Go 的內置類型。返回無符號整數,可存儲一個完整的地址。后續常用于指針運算
- type uintptr uintptr
2、unsafe.Offsetof:返回成員變量 x 在結構體當中的偏移量。更具體的講,就是返回結構體初始位置到 x 之間的字節數。需要注意的是入參 ArbitraryType 表示任意類型,并非定義的 int。它實際作用是一個占位符
- func Offsetof(x ArbitraryType) uintptr
在這一部分,其實就是巧用了 Pointer 的第三、第四點特性。這時候就已經可以對變量進行操作了。
糟糕的例子
- func main(){
- n := Num{i: "EDDYCJY", j: 1}
- nPointer := unsafe.Pointer(&n)
- ...
- ptr := uintptr(nPointer)
- njPointer := (*int64)(unsafe.Pointer(ptr + unsafe.Offsetof(n.j)))
- ...
- }
這里存在一個問題,uintptr 類型是不能存儲在臨時變量中的。因為從 GC 的角度來看,uintptr 類型的臨時變量只是一個無符號整數,并不知道它是一個指針地址。
因此當滿足一定條件后,ptr 這個臨時變量是可能被垃圾回收掉的,那么接下來的內存操作,豈不成迷?
總結
簡潔回顧兩個知識點,如下:
- 第一是 unsafe.Pointer 可以讓你的變量在不同的指針類型轉來轉去,也就是表示為任意可尋址的指針類型。
- 第二是 uintptr 常用于與 unsafe.Pointer 打配合,用于做指針運算,巧妙地很。
最后還是那句,沒有特殊必要的話。是不建議使用 unsafe 標準庫,它并不安全。雖然它常常能讓你眼前一亮。