Go語言的奇特語法,你怎么看?
剛開始接觸Go語言的同學(xué)覺得Go語言的語法很特別,尤其是使用C/C++或者Java等語言的同學(xué)。比如在C等語言中定義變量的時候類型是在名稱前面,而Go語言偏偏要將類型放在變量名稱后面,覺得很奇怪等等。下面是原文,對這些奇怪的語法給出了相對官方和靠譜的解釋。
不是為了與眾不同。而是為了更加清晰易懂。
Rob Pike 曾經(jīng)在 Go 官方博客解釋過這個問題(原文地址:http://blog.golang.org/gos-declaration-syntax),簡略翻譯如下(水平有限翻譯的不對的地方見諒):
引言
Go語言新人常常會很疑惑為什么這門語言的聲明語法(declaration syntax)會和傳統(tǒng)的C家族語言不同。在這篇博文里,我們會進(jìn)行一個比較,并做出解答。
C 的語法
首先,先看看 C 的語法。C 采用了一種聰明而不同尋常的聲明語法。聲明變量時,只需寫出一個帶有目標(biāo)變量名的表達(dá)式,然后在表達(dá)式里指明該表達(dá)式本身的類型即可。比如:
- int x;
上面的代碼聲明了 x 變量,并且其類型為 int——即,表達(dá)式 x 為 int 類型。一般而言,為了指明新變量的類型,我們得寫出一個表達(dá)式,其中含有我們要聲明的變量,這個表達(dá)式運(yùn)算的結(jié)果值屬于某種基本類型,我們把這種基本類型寫到表達(dá)式的左邊。所以,下述聲明:
- int *p;
- int a[3];
指明了 p 是一個int類型的指針,因?yàn)?*p 的類型為 int。而 a 是一個 int 數(shù)組,因?yàn)?a[3] 的類型為 int(別管這里出現(xiàn)的索引值,它只是用于指明數(shù)組的長度)。
我們接下來看看函數(shù)聲明的情況。C 的函數(shù)聲明中關(guān)于參數(shù)的類型是寫在括號外的,像下面這樣:
- int main(argc, argv)
- int argc;
- char *argv[];
- { /* ... */ }
如前所述,我們可以看到 main 之所以是函數(shù),是因?yàn)楸磉_(dá)式 main(argc, argv) 返回 int。在現(xiàn)代記法中我們是這么寫的:
- int main(int argc, char *argv[]) { /* ... */ }
盡管看起來有些不同,但是基本的結(jié)構(gòu)是一樣的。
總的來看,當(dāng)類型比較簡單時,C的語法顯得很聰明。但是遺憾的是一旦類型開始復(fù)雜,C的這套語法很快就能讓人迷糊了。著名的例子如函數(shù)指針,我們得按下面這樣來寫:
- int (*fp)(int a, int b);
在這兒,fp 之所以是一個指針是因?yàn)槿绻銓懗?(*fp)(a, b) 這樣的表達(dá)式將會調(diào)用一個函數(shù),其返回 int 類型的值。如果當(dāng) fp 的某個參數(shù)本身又是一個函數(shù),情況會怎樣呢?
- int (*fp)(int (*ff)(int x, int y), int b)
這讀起來可就點(diǎn)難了。
當(dāng)然了,我們聲明函數(shù)時是可以不寫明參數(shù)的名稱的,因此 main 函數(shù)可以聲明為:
- int main(int, char *[])
回想一下,之前 argv 是下面這樣的
- char *argv[]
你有沒有發(fā)現(xiàn)你是從聲明的「中間」去掉變量名而后構(gòu)造出其變量類型的?盡管這不是很明顯,但你聲明某個 char *[] 類型的變量的時候,竟然需要把名字插入到變量類型的中間。
我們再來看看,如果我們不命名 fp 的參數(shù)會怎樣:
- int (*fp)(int (*)(int, int), int)
這東西難懂的地方可不僅僅是要記得參數(shù)名原本是放這中間的
- int (*)(int, int)
它更讓人混淆的地方還在于甚至可能都搞不清這竟然是個函數(shù)指針聲明。我們接著看看,如果返回值也是個函數(shù)指針類型又會怎么樣
- int (*(*fp)(int (*)(int, int), int))(int, int)
這已經(jīng)很難看出是關(guān)于 fp 的聲明了。
你自己還可以構(gòu)建出比這更復(fù)雜的例子,但這已經(jīng)足以解釋 C 的聲明語法引入的某些復(fù)雜性了。
還有一點(diǎn)需要指出,由于類型語法和聲明語法是一樣的,要解析中間帶有類型的表達(dá)式可能會有些難度。這也就是為什么,C 在做類型轉(zhuǎn)換的時候總是要把類型用括號括起來的原因,像這樣
- (int)M_PI
Go 的語法
非C家族的語言通常在聲明時使用一種不同的類型語法。一般是名字先出現(xiàn),然后常常跟著一個冒號。按照這樣來寫,我們上面所舉的例子就會變成下面這樣:
- x: int
- p: pointer to int
- a: array[3] of int
這樣的聲明即便有些冗長,當(dāng)至少是清晰的——你只需從左向右讀就行。Go 語言所采用的方案就是以此為基礎(chǔ)的,但為了追求簡潔性,Go 語言丟掉了冒號并去掉了部分關(guān)鍵詞,成了下面這樣:
- x int
- p *int
- a [3]int
在 [3]int 和表達(dá)式中 a 的用法沒有直接的對應(yīng)關(guān)系(我們在下一節(jié)會回過頭來探討指針的問題)。至此,你獲得了代碼清晰性方面的提升,但付出的代價是語法上需要區(qū)別對待。
下面我們來考慮函數(shù)的問題。雖然在 Go 語言里,main 函數(shù)實(shí)際上沒有參數(shù),但是我們先謄抄一下之前的 main 函數(shù)的聲明:
- func main(argc int, argv *[]byte) int
粗略一看和 C 沒什么不同,不過自左向右讀的話還不錯。
main 函數(shù)接受一個 int 和一個指針并返回一個 int。
如果此時把參數(shù)名去掉,它還是很清楚——因?yàn)閰?shù)名總在類型的前面,所以不會引起混淆。
- func main(int, *[]byte) int
這種自左向右風(fēng)格的聲明的一個價值在于,當(dāng)類型變得更復(fù)雜時,它依然相對簡單。下面是一個函數(shù)變量的聲明(相當(dāng)于 C 語言里的函數(shù)指針)
- f func(func(int,int) int, int) int
或者當(dāng)它返回一個函數(shù)時:
- f func(func(int,int) int, int) func(int, int) int
上面的聲明讀起來還是很清晰,自左向右,而且究竟哪一個變量名是當(dāng)前被聲明的也容易看懂——因?yàn)樽兞棵肋h(yuǎn)在首位。
類型語法和表達(dá)式語法帶來的差別使得在 Go 語言里調(diào)用閉包也變得更簡單:
- sum := func(a, b int) int { return a+b } (3, 4)
指針
指針有些例外。注意在數(shù)組 (array )和切片 (slice) 中,Go 的類型語法把方括號放在了類型的左邊,但是在表達(dá)式語法中卻又把方括號放到了右邊:
- var a []int
- x = a[1]
類似的,Go 的指針沿用了 C 的 * 記法,但是我們寫的時候也是聲明時 * 在變量名右邊,但在表達(dá)式中卻又得把 * 放到左左邊:
- var p *int
- x = *p
不能寫成下面這樣
- var p *int
- x = p*
因?yàn)楹缶Y的 * 可能會和乘法運(yùn)算混淆,也許我們可以改用 Pascal 的 ^ 標(biāo)記,像這樣
- var p ^int
- x = p^
我們也許還真的應(yīng)該把 * 像上面這樣改成 ^ (當(dāng)然這么一改 xor 運(yùn)算的符號也得改),因?yàn)樵陬愋秃捅磉_(dá)式中的 * 前綴確實(shí)把好些事兒都搞得有點(diǎn)復(fù)雜,舉個例子來說,雖然我們可以像下面這樣寫
- []int("hi")
但在轉(zhuǎn)換時,如果類型是以 * 開頭的,就得加上括號:
- (*int)(nil)
如果有一天我們愿意放棄用 * 作為指針語法的話,那么上面的括號就可以省略了。
可見,Go 的指針語法是和 C 相似的。但這種相似也意味著我們無法徹底避免在文法中有時為了避免類型和表達(dá)式的歧義需要補(bǔ)充括號的情況。
總而言之,盡管存在不足,但我們相信 Go 的類型語法要比 C 的容易懂。特別是當(dāng)類型比較復(fù)雜時。