為什么說Go字符串不能修改
在接觸Go這么語言,可能你經常會聽到這樣一句話。對于字符串不能修改,可能你很納悶,日常開發中我們對字符串進行修改也是很正常的,為什么又說Go中的字符串不能進行修改呢?
本文就來通過實際案例給大家演示,為什么Go中的字符串不能進行修改。
在演示這個問題之前,我們先對字符串類型的基礎知識做個大致的演示,這樣便于大家對問題的進一步了解。
字符串定義
字符串是一種用來表示字符的數據類型。在使用時,使用" "將字符內容包含起來。例如下面的形式:
在Go中,字符串通常有三種定義方式:
字符串的定義,其實也可以通過字節的方式。這里羅列的方式是最為常見的方式。
字符串的組成
Go中的字符串符合Unicode[1]標準,并且采用UTF-8[2]編碼。字符串底層其實也是由byte組成(后面會仔細講解)。通過下面的示例,打印查看具體的字節內容:
上面代碼打印的內容,就是每一個字符所表示的字節碼。
字符串不能修改
通過上面的大致演示,我們對字符串有一個基本的了解。對于字符串不能修改,可能你很納悶,日常開發中我們對字符串進行重新賦值也是很正常的,為什么又說Go中的字符串不能進行修改呢?
其實這里要糾正這個說話,對于字符串修改并不等價于重新賦值。開發中常用的方式,其實是一種重新賦值的概念。
通常聽到的不能修改,其實就是指的上面代碼的第二種方式。并且通過這種方式修改會報錯::cannot assign to s[0] (value of type byte)
回歸正題,為什么Go中的字符串不能通過下標的方式來進行修改呢? 這是因為Go中的字符串的數據結構體是由一個指針和長度組成的結構體,該指針指向的一個切片才是真正的字符串值。Go中源碼有這樣一段定義:
正是因為底層是一個[]byte類型的切片,當我們使用下標的方式去修改值,這時候將一個字符內容賦值給byte類型,肯定是不允許的。但是我們可以通過下標的方式去訪問對應的byte值。
那我們要想通過下標的方式去修改值該怎么辦呢?這時候,就需要通過切片的方式來定義,然后在轉成字符串。
字符串的賦值
上面分析了為什么字符串不能使用下標去賦值,回過來解答一下日常開發中的賦值方式。
那為什么這種場景下又可以給字符串重新賦值呢? 這是因為,在Go的底層其實是新創建了一個[]byte{}類型的切片,將變量s中的指針指向了新的內存空間地址(也就是這里的Hello Go!?)。原有的Hello World!內存空間會隨著垃圾回收機制被回收掉。
為什么這么設計
可能大家都會考慮到,為什么一個普通的字符串要設計這么復雜,還需要使用指針。暫時沒找到官方文檔的說明,
- 1. 個人猜想,當遇到一個非常長的字符時,這樣做使得string變得非常輕量,可以很方便的進行傳遞而不用擔心內存拷貝。雖然在Go中,不管是引用類型還是值類型參數傳遞都是值傳遞。但指針明顯比值傳遞更節省內存。
引用鏈接
[1]? Unicode: https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/
[2]? UTF-8: https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/