為什么說Go字符串不能修改

作者：7small7 2023-01-03 08:07:33

本文就來通過實際案例給大家演示，為什么Go中的字符串不能進行修改。在演示這個問題之前，我們先對字符串類型的基礎知識做個大致的演示，這樣便于大家對問題的進一步了解。

在接觸Go這么語言，可能你經常會聽到這樣一句話。對于字符串不能修改，可能你很納悶，日常開發中我們對字符串進行修改也是很正常的，為什么又說Go中的字符串不能進行修改呢？

本文就來通過實際案例給大家演示，為什么Go中的字符串不能進行修改。

在演示這個問題之前，我們先對字符串類型的基礎知識做個大致的演示，這樣便于大家對問題的進一步了解。

字符串定義

字符串是一種用來表示字符的數據類型。在使用時，使用" "將字符內容包含起來。例如下面的形式：

package main

import "fmt"

func main() {
    var str string = "Hello World!"
}

在Go中，字符串通常有三種定義方式：

// 第一種(全量定義)
var 變量名稱 string = "字符串內容"
// 類型推導
var 變量名稱 = "字符串內容"
// 短標記(只適用于局部變量)
變量名稱 := "字符串內容"

字符串的定義，其實也可以通過字節的方式。這里羅列的方式是最為常見的方式。

字符串的組成

Go中的字符串符合Unicode^[1]標準，并且采用UTF-8^[2]編碼。字符串底層其實也是由byte組成(后面會仔細講解)。通過下面的示例，打印查看具體的字節內容：

s := "Hello World!"
for _, v := range s {
    fmt.Print(v)
    fmt.Print("\t")
}
// 72 101 108 108 111 32 87 111 114 108 100 33

上面代碼打印的內容，就是每一個字符所表示的字節碼。

字符串不能修改

通過上面的大致演示，我們對字符串有一個基本的了解。對于字符串不能修改，可能你很納悶，日常開發中我們對字符串進行重新賦值也是很正常的，為什么又說Go中的字符串不能進行修改呢？

其實這里要糾正這個說話，對于字符串修改并不等價于重新賦值。開發中常用的方式，其實是一種重新賦值的概念。

str := "Hello World!"
// 重新賦值
str = "Hello Go!"
// 字符串修改
str[0] = "I"

通常聽到的不能修改，其實就是指的上面代碼的第二種方式。并且通過這種方式修改會報錯：:cannot assign to s[0] (value of type byte)

回歸正題，為什么Go中的字符串不能通過下標的方式來進行修改呢？這是因為Go中的字符串的數據結構體是由一個指針和長度組成的結構體，該指針指向的一個切片才是真正的字符串值。Go中源碼有這樣一段定義：

type stringStruct struct {
    str unsafe.Pointer // 指向一個byte類型的切片指針
    len int // 字符串的長度
}

正是因為底層是一個[]byte類型的切片，當我們使用下標的方式去修改值，這時候將一個字符內容賦值給byte類型，肯定是不允許的。但是我們可以通過下標的方式去訪問對應的byte值。

fmt.Println(s[0]) // output:72

那我們要想通過下標的方式去修改值該怎么辦呢？這時候，就需要通過切片的方式來定義，然后在轉成字符串。

package main

import (  
    "fmt"
)

func main() {  
     s1 := []byte{72, 101, 108, 108, 111, 32, 87, 111, 114, 108, 100, 33}
    fmt.Println(string(s1))
    // 將"H"修改為l
    s1[0] = 108
    fmt.Println(string(s1))
}
// output:
Hello World!
lello World!

字符串的賦值

上面分析了為什么字符串不能使用下標去賦值，回過來解答一下日常開發中的賦值方式。

package main

import (  
    "fmt"
)

func main() {
    // 聲明一個字符串，并給與初始值
    s := "Hello World!"
    // 對變量 s 進行重新賦值
    s := "Hello Go!"
}

那為什么這種場景下又可以給字符串重新賦值呢？這是因為，在Go的底層其實是新創建了一個[]byte{}類型的切片，將變量s中的指針指向了新的內存空間地址(也就是這里的Hello Go!?)。原有的Hello World!內存空間會隨著垃圾回收機制被回收掉。

為什么這么設計

可能大家都會考慮到，為什么一個普通的字符串要設計這么復雜，還需要使用指針。暫時沒找到官方文檔的說明，

1. 個人猜想，當遇到一個非常長的字符時，這樣做使得string變得非常輕量，可以很方便的進行傳遞而不用擔心內存拷貝。雖然在Go中，不管是引用類型還是值類型參數傳遞都是值傳遞。但指針明顯比值傳遞更節省內存。

引用鏈接

[1]? Unicode: https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/

[2]? UTF-8: https://naveenr.net/unicode-character-set-and-utf-8-utf-16-utf-32-encoding/

責任編輯：武曉燕來源：菜鳥成長學習筆記

Go 字符串指針

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看