反射是如何獲取結(jié)構(gòu)體成員信息的?
本文轉(zhuǎn)載自微信公眾號「Golang夢工廠」,作者AsongGo。轉(zhuǎn)載本文請聯(lián)系Golang夢工廠公眾號。
前言
哈嘍,大家好,我是asong,今天這篇文章的目的主要是解答一位讀者的疑問,涉及知識點是反射和結(jié)構(gòu)體內(nèi)存布局。我們先看一下讀者的問題:
我們通過兩個問題來解決他的疑惑:
- 結(jié)構(gòu)體在內(nèi)存中是如何存儲的
- 反射獲取結(jié)構(gòu)體成員信息的過程
結(jié)構(gòu)體是如何存儲的
結(jié)構(gòu)體是占用一塊連續(xù)的內(nèi)存,一個結(jié)構(gòu)體變量的大小是由結(jié)構(gòu)體中的字段決定的,結(jié)構(gòu)體變量的地址等于結(jié)構(gòu)體第一個字段的首地址。示例:
- type User struct {
- Name string
- Age uint64
- Gender bool // true:男 false: 女
- }
- func main(){
- u := User{
- Name: "asong",
- Age: 18,
- Gender: false,
- }
- fmt.Printf("%p\n",&u)
- fmt.Printf("%p\n",&u.Name)
- }
- // 運行結(jié)果
- 0xc00000c060
- 0xc00000c060
從運行結(jié)果我們可以驗證了結(jié)構(gòu)體變量u的存放地址就是字段Name的首地址。
結(jié)構(gòu)體的內(nèi)存布局其實就是分配一段連續(xù)的內(nèi)存,具體是在棧上分配還是堆上分配取決于編譯器的逃逸分析,結(jié)構(gòu)體在內(nèi)存分配時還要考慮到內(nèi)存對齊。
對齊的作用和原因:CPU訪問內(nèi)存時,并不是逐個字節(jié)訪問,而是以字長(word size)單位訪問。比如32位的CPU,字長為4字節(jié),那么CPU訪問內(nèi)存的單位也是4字節(jié)。這樣設(shè)計可以減少CPU訪問內(nèi)存的次數(shù),加大CPU訪問內(nèi)存的吞吐量。假設(shè)我們需要讀取8個字節(jié)的數(shù)據(jù),一次讀取4個字節(jié)那么就只需讀取2次就可以。內(nèi)存對齊對實現(xiàn)變量的原子性操作也是有好處的,每次內(nèi)存訪問都是原子的,如果變量的大小不超過字長,那么內(nèi)存對齊后,對該變量的訪問就是原子的,這個特性在并發(fā)場景下至關(guān)重要。
C語言的內(nèi)存對齊規(guī)則與Go語言一樣,所以C語言的對齊規(guī)則對Go同樣適用:
- 對于結(jié)構(gòu)的各個成員,第一個成員位于偏移為0的位置,結(jié)構(gòu)體第一個成員的偏移量(offset)為0,以后每個成員相對于結(jié)構(gòu)體首地址的 offset 都是該成員大小與有效對齊值中較小那個的整數(shù)倍,如有需要編譯器會在成員之間加上填充字節(jié)。
- 除了結(jié)構(gòu)成員需要對齊,結(jié)構(gòu)本身也需要對齊,結(jié)構(gòu)的長度必須是編譯器默認(rèn)的對齊長度和成員中最長類型中最小的數(shù)據(jù)大小的倍數(shù)對齊。
根據(jù)這個規(guī)則我們來分析一下上面示例的結(jié)構(gòu)體User,這里我使用的mac,所以是64位CPU,編譯器默認(rèn)對齊參數(shù)是8,String、uint64、bool的對齊值分別是8、8、1,根據(jù)第一條規(guī)則分析:
- 第一個字段類型是string,對齊值是8,大小為16,所以放在內(nèi)存布局中的第一位。
- 第二個字段類型是uin64,對齊值是8,大小為8,所以他的內(nèi)存偏移值必須是8的倍數(shù),因為第一個字段Name占有16位,所以直接從16開始不要補位。
- 第三個字段類型是bool,對齊值是1,大小為1,所以他的內(nèi)存偏移值必須是1的倍數(shù),因為User的前兩個字段已經(jīng)排到了24位,所以下一個偏移量正好是24。
接下來我們在分析第二個規(guī)則:
- 根據(jù)第一條內(nèi)存對齊規(guī)則分析后,內(nèi)存長度已經(jīng)為25字節(jié)了,我們開始使用第2條規(guī)則進行對齊,默認(rèn)對齊值是8,字段中最大類型的長度是16,所以可以得出該結(jié)構(gòu)體的對齊值是8,我們目前的內(nèi)存長度是25,不是8的倍數(shù),所以需要補全,所以最終的結(jié)果是32,補了7位,由編譯器進行填充,一般為0值,也稱之為空洞。
注意:這里對內(nèi)存對齊沒有說的很細(xì),想要更深了解內(nèi)存對齊可以看我之前的一篇文章:Go看源碼必會知識之unsafe包
Go語言反射獲取結(jié)構(gòu)體成員信息
Go語言提供了一種機制在運行時更新和檢查變量的值、調(diào)用變量的方法和變量的內(nèi)在操作,但是在編譯時并不知道這些變量的具體類型,這種機制被稱為反射。Go語言提供了 reflect 包來訪問程序的反射信息。
我們可以通過調(diào)用reflect.TypeOf()獲得反射對象信息,如果他的類型是結(jié)構(gòu)體,接著可以通過反射值對象reflect.Type的NumField和Field方法獲取結(jié)構(gòu)體成員的詳細(xì)信息,先看一個例子:
- type User struct {
- Name string
- Age uint64
- Gender bool // true:男 false: 女
- }
- func main() {
- u := User{
- Name: "asong",
- Age: 18,
- Gender: false,
- }
- getType := reflect.TypeOf(u)
- for i:=0; i < getType.NumField(); i++{
- fieldType := getType.Field(i)
- // 輸出成員名
- fmt.Printf("name: %v \n", fieldType.Name)
- }
- }
- // 運行結(jié)果
- name: Name
- name: Age
- name: Gender
接下來我們就一起來看一看Go語言是如何通過反射來獲取結(jié)構(gòu)體成員信息的。
首先我們來看一看reflect.TypeOf()方法是如何獲取到類型的:
- func TypeOf(i interface{}) Type {
- eface := *(*emptyInterface)(unsafe.Pointer(&i))
- return toType(eface.typ)
- }
我們知道在Go語言中任何類型都可以轉(zhuǎn)成interface{}類型,當(dāng)向接口變量賦于一個實體類型的時候,接口會存儲實體的類型信息,反射就是通過接口的類型信息實現(xiàn)的。
一個空接口結(jié)構(gòu)如下:
- type eface struct {
- _type *_type
- data unsafe.Pointer
- }
_type 字段,表示空接口所承載的具體的實體類型。data 描述了具體的值,Go 語言里所有的類型都 實現(xiàn)了 空接口。
所以在TypeOf方法中,我們就是通過讀取_type字段獲取到類型。
現(xiàn)在我們已經(jīng)知道他是怎么獲取到具體的類型了,接下來我們就來看一看NumField()方法是怎么獲取到字段的。
- func (t *rtype) Kind() Kind { return Kind(t.kind & kindMask) }
- func (t *rtype) NumField() int {
- if t.Kind() != Struct {
- panic("reflect: NumField of non-struct type " + t.String())
- }
- tt := (*structType)(unsafe.Pointer(t))
- return len(tt.fields)
- }
因為只有struct類型才可以調(diào)用,所以在NumFiled()方法中做了類型檢查,如果不是struct類型則直接發(fā)生panic,然后會rtype類型強制轉(zhuǎn)換成structType,最后返回結(jié)構(gòu)體成員字段的數(shù)量。
- // structType represents a struct type.
- type structType struct {
- rtype
- pkgPath name
- fields []structField // sorted by offset
- }
- // Struct field
- type structField struct {
- name name // name is always non-empty
- typ *rtype // type of field
- offsetEmbed uintptr // byte offset of field<<1 | isEmbedded
- }
調(diào)用Field()方法會根據(jù)索引返回對應(yīng)的結(jié)構(gòu)體字段的信息,當(dāng)值不是結(jié)構(gòu)體或索引超界時發(fā)生panic。
- func (t *rtype) Field(i int) StructField {
- // 類型檢查
- if t.Kind() != Struct {
- panic("reflect: Field of non-struct type " + t.String())
- }
- // 強制轉(zhuǎn)換成structType 類型
- tt := (*structType)(unsafe.Pointer(t))
- return tt.Field(i)
- }
- // Field returns the i'th struct field.
- func (t *structType) Field(i int) (f StructField) {
- // 溢出檢查
- if i < 0 || i >= len(t.fields) {
- panic("reflect: Field index out of bounds")
- }
- // 獲取之前structType中fields字段的值
- p := &t.fields[i]
- // 轉(zhuǎn)換成StructFiled結(jié)構(gòu)體
- f.Type = toType(p.typ)
- f.Name = p.name.name()
- // 判斷是否是匿名結(jié)構(gòu)體
- f.Anonymous = p.embedded()
- if !p.name.isExported() {
- f.PkgPath = t.pkgPath.name()
- }
- if tag := p.name.tag(); tag != "" {
- f.Tag = StructTag(tag)
- }
- // 獲取字段的偏移量
- f.Offset = p.offset()
- // 獲取索引值
- f.Index = []int{i}
- return
- }
返回StructField結(jié)構(gòu)如下:
- // A StructField describes a single field in a struct.
- type StructField struct {
- Name string // 字段名
- PkgPath string // 字段路徑
- Type Type // 字段反射類型對象
- Tag StructTag // 字段的結(jié)構(gòu)體標(biāo)簽
- Offset uintptr // 字段在結(jié)構(gòu)體中的相對偏移
- Index []int // Type.FieldByIndex中的返回的索引值
- Anonymous bool // 是否為匿名字段
- }
到這里整個反射獲取結(jié)構(gòu)體成員信息的過程應(yīng)該很明朗了吧~。
**小結(jié):**因為Go 語言里所有的類型都 實現(xiàn)了 空接口,所以可以根據(jù)這個特性獲取到數(shù)據(jù)類型以及存放數(shù)據(jù)的地址,對于結(jié)構(gòu)體類型,將其轉(zhuǎn)換為structType類型,最后轉(zhuǎn)換成StructField結(jié)構(gòu)獲取所有結(jié)構(gòu)體信息。
總結(jié)
本文沒想詳細(xì)展開講解Go語言反射的原理和過程,只是簡單介紹了一下反射獲取到結(jié)構(gòu)體成員信息的過程,更多關(guān)于反射知識的講解會在后面持續(xù)更新,敬請期待~。