成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

搞 Go 要了解的 2 個 Header,你知道嗎?

開發 后端
在這篇文章中,我們介紹了字符串(string)和切片(slice)的兩個運行時表現,分別是 StringHeader 和 SliceHeader。

[[402665]]

本文轉載自微信公眾號「腦子進煎魚了」,作者陳煎魚。轉載本文請聯系腦子進煎魚了公眾號。

大家好,我是煎魚。

在 Go 語言中總是有一些看上去奇奇怪怪的東西,咋一眼一看感覺很熟悉,但又不理解其在 Go 代碼中的實際意義,面試官卻愛問...

今天要給大家介紹的是 SliceHeader 和 StringHeader 結構體,了解清楚他到底是什么,又有什么用,并且會在最后給大家介紹 0 拷貝轉換的內容。

一起愉快地開始吸魚之路。

SliceHeader

SliceHeader 如其名,Slice + Header,看上去很直觀,實際上是 Go Slice(切片)的運行時表現。

  1. type SliceHeader struct { 
  2.  Data uintptr 
  3.  Len  int 
  4.  Cap  int 
  • Data:指向具體的底層數組。
  • Len:代表切片的長度。
  • Cap:代表切片的容量。

既然知道了切片的運行時表現,那是不是就意味著我們可以自己造一個?

在日常程序中,可以利用標準庫 reflect 提供的 SliceHeader 結構體造一個:

  1. func main() { 
  2.   // 初始化底層數組 
  3.  s := [4]string{"腦子""進""煎魚""了"
  4.  s1 := s[0:1] 
  5.  s2 := s[:] 
  6.  
  7.   // 構造 SliceHeader 
  8.  sh1 := (*reflect.SliceHeader)(unsafe.Pointer(&s1)) 
  9.  sh2 := (*reflect.SliceHeader)(unsafe.Pointer(&s2)) 
  10.  fmt.Println(sh1.Len, sh1.Cap, sh1.Data) 
  11.  fmt.Println(sh2.Len, sh2.Cap, sh2.Data) 

你認為輸出結果是什么,這兩個新切片會指向同一個底層數組的內存地址嗎?

輸出結果:

  1. 1 4 824634330936 
  2.  
  3. 4 4 824634330936 

兩個切片的 Data 屬性所指向的底層數組是一致的,Len 屬性的值不一樣,sh1 和 sh2 分別是兩個切片。

疑問

為什么兩個新切片所指向的 Data 是同一個地址的呢?

這其實是 Go 語言本身為了減少內存占用,提高整體的性能才這么設計的。

將切片復制到任意函數的時候,對底層數組大小都不會影響。復制時只會復制切片本身(值傳遞),不會涉及底層數組。

也就是在函數間傳遞切片,其只拷貝 24 個字節(指針字段 8 個字節,長度和容量分別需要 8 個字節),效率很高。

這種設計也引出了新的問題,在平時通過 s[i:j] 所生成的新切片,兩個切片底層指向的是同一個底層數組。

假設在沒有超過容量(cap)的情況下,對第二個切片操作會影響第一個切片。

這是很多 Go 開發常會碰到的一個大 “坑”,不清楚的排查了很久的都不得而終。

StringHeader

除了 SliceHeader 外,Go 語言中還有一個典型代表,那就是字符串(string)的運行時表現。

  1. type StringHeader struct { 
  2.    Data uintptr 
  3.    Len  int 
  • Data:存放指針,其指向具體的存儲數據的內存區域。
  • Len:字符串的長度。

可得知 “Hello” 字符串的底層數據如下:

  1. var data = [...]byte{ 
  2.     'h''e''l''l''o'

底層的存儲示意圖如下:

真實演示例子如下:

  1. func main() { 
  2.  s := "腦子進煎魚了" 
  3.  s1 := "腦子進煎魚了" 
  4.  s2 := "腦子進煎魚了"[7:] 
  5.  
  6.  fmt.Printf("%d \n", (*reflect.StringHeader)(unsafe.Pointer(&s)).Data) 
  7.  fmt.Printf("%d \n", (*reflect.StringHeader)(unsafe.Pointer(&s1)).Data) 
  8.  fmt.Printf("%d \n", (*reflect.StringHeader)(unsafe.Pointer(&s2)).Data) 

你認為輸出結果是什么,變量 s 和 s1、s2 會指向同一個底層內存空間嗎?

輸出結果:

  1. 17608227  
  2. 17608227  
  3. 17608234  

從輸出結果來看,變量 s 和 s1 指向同一個內存地址。變量 s2 雖稍有偏差,但本質上也是指向同一塊。

因為其是字符串的切片操作,是從第 7 位索引開始,因此正好的 17608234-17608227 = 7。也就是三個變量都是指向同一塊內存空間,這是為什么呢?

這是因為在 Go 語言中,字符串都是只讀的,為了節省內存,相同字面量的字符串通常對應于同一字符串常量,因此指向同一個底層數組。

0 拷貝轉換

為什么會有人關注到 SliceHeader、StringHeader 這類運行時細節呢,一大部分原因是業內會有開發者,希望利用其實現零拷貝的 string 到 bytes 的轉換。

常見轉換代碼如下:

  1. func string2bytes(s string) []byte { 
  2.  stringHeader := (*reflect.StringHeader)(unsafe.Pointer(&s)) 
  3.  
  4.  bh := reflect.SliceHeader{ 
  5.   Data: stringHeader.Data, 
  6.   Len:  stringHeader.Len, 
  7.   Cap:  stringHeader.Len, 
  8.  } 
  9.  
  10.  return *(*[]byte)(unsafe.Pointer(&bh)) 

但這其實是錯誤的,官方明確表示:

the Data field is not sufficient to guarantee the data it references will not be garbage collected, so programs must keep a separate, correctly typed pointer to the underlying data.

SliceHeader、StringHeader 的 Data 字段是一個 uintptr 類型。由于 Go 語言只有值傳遞。

因此在上述代碼中會出現將 Data 作為值拷貝的情況,這就會導致無法保證它所引用的數據不會被垃圾回收(GC)。

應該使用如下轉換方式:

  1. func main() { 
  2.  s := "腦子進煎魚了" 
  3.  v := string2bytes1(s) 
  4.  fmt.Println(v) 
  5.  
  6. func string2bytes1(s string) []byte { 
  7.  stringHeader := (*reflect.StringHeader)(unsafe.Pointer(&s)) 
  8.  
  9.  var b []byte 
  10.  pbytes := (*reflect.SliceHeader)(unsafe.Pointer(&b)) 
  11.  pbytes.Data = stringHeader.Data 
  12.  pbytes.Len = stringHeader.Len 
  13.  pbytes.Cap = stringHeader.Len 
  14.  
  15.  return b 

在程序必須保留一個單獨的、正確類型的指向底層數據的指針。

在性能方面,若只是期望單純的轉換,對容量(cap)等字段值不敏感,也可以使用以下方式:

  1. func string2bytes2(s string) []byte { 
  2.  return *(*[]byte)(unsafe.Pointer(&s)) 

性能對比:

  1. string2bytes1-1000-4   3.746 ns/op  0 allocs/op 
  2. string2bytes1-1000-4   3.713 ns/op  0 allocs/op 
  3. string2bytes1-1000-4   3.969 ns/op  0 allocs/op 
  4.  
  5. string2bytes2-1000-4   2.445 ns/op  0 allocs/op 
  6. string2bytes2-1000-4   2.451 ns/op  0 allocs/op 
  7. string2bytes2-1000-4   2.455 ns/op  0 allocs/op 

會相當標準的轉換性能會稍快一些,這種強轉也會導致一個小問題。

代碼如下:

  1. func main() { 
  2.  s := "腦子進煎魚了" 
  3.  v := string2bytes2(s) 
  4.  println(len(v), cap(v)) 
  5. func string2bytes2(s string) []byte { 
  6.  return *(*[]byte)(unsafe.Pointer(&s)) 

輸出結果:

  1. 18 824633927632 

這種強轉其會導致 byte 的切片容量非常大,需要特別注意。一般還是推薦使用標準的 SliceHeader、StringHeader 方式就好了,也便于后來的維護者理解。

總結

在這篇文章中,我們介紹了字符串(string)和切片(slice)的兩個運行時表現,分別是 StringHeader 和 SliceHeader。

同時了解到其運行時表現后,我們還針對其兩者的地址指向,常見坑進行了說明。

最后我們進一步深入,面向 0 拷貝轉換的場景進行了介紹和性能分析。

你平時有沒有遇到過這塊的疑惑或問題呢,歡迎大家一起討論!

參考

Go語言slice的本質-SliceHeader

數組、字符串和切片

零拷貝實現string 和bytes的轉換疑問

 

責任編輯:武曉燕 來源: 腦子進煎魚了
相關推薦

2021-11-10 15:37:49

Go源碼指令

2022-01-05 11:40:36

Go特性語言

2025-06-27 09:32:47

GoRedis單線程

2020-11-10 10:26:16

串口打印工具

2022-08-02 10:01:34

Import語句ES模塊

2024-09-02 00:30:41

Go語言場景

2024-10-09 08:54:31

2023-12-12 08:41:01

2024-09-18 07:00:00

消息隊列中間件消息隊列

2022-09-29 15:32:58

云計算計算模式

2021-10-14 06:52:47

算法校驗碼結構

2024-04-15 00:04:00

APP開發

2022-05-09 10:47:08

登錄SpringSecurity

2015-10-23 09:34:16

2022-03-18 12:46:56

Go 語言編程語言

2024-05-28 09:12:10

2024-04-07 00:00:00

ESlint命令變量

2021-11-17 11:03:14

Python代碼語法

2024-08-01 17:34:56

Promiseaxios請求

2019-12-12 09:23:29

Hello World操作系統函數庫
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.亚洲成人网 | 五月天婷婷丁香 | 亚洲一区导航 | 国产欧美精品区一区二区三区 | 亚洲国产欧美在线 | 99久久精品国产麻豆演员表 | 久久久久久久久久久久久9999 | 国产精品亚洲综合 | h在线免费观看 | 日韩中文在线视频 | 中文av网站 | 99精品视频一区二区三区 | 99久久免费精品 | 精品日韩 | 国产精品视频中文字幕 | 成人免费在线观看 | 夜色www国产精品资源站 | a级片在线观看 | 午夜色播 | 成人午夜在线 | 亚洲一区 中文字幕 | 国产精品亚洲片在线播放 | 日韩欧美在线视频观看 | 一区二区不卡 | 国产精品久久久亚洲 | 国产精品高潮呻吟久久 | 韩国成人在线视频 | 国产婷婷综合 | 老司机午夜性大片 | 99国产在线 | 亚洲永久| 亚洲一区成人 | 日本久久视频 | 日韩一级二级片 | 精品久久久久一区二区国产 | 特黄毛片 | japan21xxxxhd美女| 极情综合网 | 精品一区二区av | 色综合区| 日本精品视频在线观看 |