醒醒!Python已經(jīng)支持中文變量名啦!
最近,我在翻閱兩本比較新的 Python 書(shū)籍時(shí),發(fā)現(xiàn)它們都犯了一個(gè)嚴(yán)重的低級(jí)錯(cuò)誤!
這兩本書(shū)分別是《Python編程:從入門(mén)到實(shí)踐》和《父與子的編程之旅》,它們都是暢銷(xiāo)書(shū),都在 2020 年 10 月出了新版本,都使用 Python3.7+ 版本的語(yǔ)法。
然而,在關(guān)于變量的命名規(guī)則部分,它們犯下了一樣的錯(cuò)誤,即還在使用 Python2 時(shí)代的那套說(shuō)辭,誤以為命名僅僅支持“字母、數(shù)字和下劃線(xiàn)”的組合。
事實(shí)上,Python3.x 已經(jīng)支持全面 Unicode 編碼,比如支持使用中文作為變量名。
- >>> 姓名 ="Python貓"
- >>> print(f"我是{姓名},歡迎關(guān)注!")
- 我是Python貓,歡迎關(guān)注!
由于我手頭上沒(méi)有其它樣本,所以,我不確定有多少新版的書(shū)籍還在使用老的規(guī)則。但是,翻譯類(lèi)的書(shū)籍大概率都會(huì)有這樣的問(wèn)題,另外,有些不嚴(yán)謹(jǐn)?shù)膰?guó)內(nèi)書(shū)籍,也可能因?yàn)榻梃b了過(guò)時(shí)的材料而犯錯(cuò)。
如此一來(lái),恐怕有些新接觸 Python 的同學(xué),就會(huì)形成錯(cuò)誤的認(rèn)識(shí)。雖然這可能不會(huì)造成嚴(yán)重的問(wèn)題,但是它終歸是一個(gè)應(yīng)該避免而且很容易就能避免的問(wèn)題。
因此,我覺(jué)得這個(gè)話(huà)題值得聊一聊。
在編程語(yǔ)言中有一個(gè)很常見(jiàn)的概念,即標(biāo)識(shí)符(identifier),通常又會(huì)稱(chēng)之為名字(name),用于標(biāo)識(shí)出變量、常量、函數(shù)、類(lèi)、符號(hào)等實(shí)體的名字。
在定義標(biāo)識(shí)符時(shí),有一些必須要考慮的基本規(guī)則:
- 它可以由哪些字符組成?
- 它是否區(qū)分大小寫(xiě)?(即大小寫(xiě)敏感)
- 它是否允許出現(xiàn)某些特殊的單詞?(即關(guān)鍵字/保留字)
對(duì)于第一個(gè)問(wèn)題,大多數(shù)的編程語(yǔ)言在早期版本都遵循這條規(guī)則:標(biāo)識(shí)符由字母、數(shù)字和下劃線(xiàn)組成,并且不能以數(shù)字為開(kāi)頭。 少數(shù)的編程語(yǔ)言有例外,還支持使用$、@、%等特殊符號(hào)(例如PHP、Ruby、Perl等等)。
Python 的早期版本,確切地說(shuō)是 3.0 之前的版本,就遵循以上的命名規(guī)則。下面是官方文檔中的描述:
- identifier ::= (letter|"_") (letter | digit | "_")*
- letter ::= lowercase | uppercase
- lowercase ::= "a"..."z"
- uppercase ::= "A"..."Z"
- digit ::= "0"..."9"
出處:https://docs.python.org/2.7/reference/lexical_analysis.html#identifiers
但是,這條規(guī)則從 3.0 版本起,就被打破了。最新的官方文檔已經(jīng)變成了這樣:
出處:https://docs.python.org/3/reference/lexical_analysis.html#identifiers
隨著互聯(lián)網(wǎng)的普及,各國(guó)語(yǔ)言進(jìn)入了國(guó)際化的語(yǔ)境中,編程語(yǔ)言也與時(shí)俱進(jìn)地增長(zhǎng)了對(duì)國(guó)際化的訴求。
Unicode(譯作統(tǒng)一碼、萬(wàn)國(guó)碼)編碼標(biāo)準(zhǔn)在 1994 年發(fā)布,隨后逐步被主流的編程語(yǔ)言所接納。到目前為止,至少有 73 種編程語(yǔ)言支持 Unicode 變量名(數(shù)據(jù)依據(jù):https://rosettacode.org/wiki/Unicode_variable_names)。
2007 年,當(dāng) Python 正在設(shè)計(jì)劃時(shí)代的 3.0 版本時(shí),官方也考慮了對(duì) Unicode 編碼的支持,于是,誕生了重要的《PEP 3131 -- Supporting Non-ASCII Identifiers》。
出處:https://www.python.org/dev/peps/pep-3131
事實(shí)上,除了我們最關(guān)心的中文,Unicode 字符集還包含非常非常多的內(nèi)容。
在對(duì)變量命名時(shí),下面這些用法都是可行的(謹(jǐn)慎使用,如若被打,本貓概不負(fù)責(zé)……):
- >>> ψ = 1
- >>> Δ = 1
- >>> ಠ_ಠ = "hello"
綜上所述,某些 Python 書(shū)籍中關(guān)于變量命名規(guī)則的內(nèi)容已經(jīng)過(guò)時(shí)了,不應(yīng)該被其所誤導(dǎo)!
Python 3 作為一門(mén)面向現(xiàn)代化/國(guó)際化的語(yǔ)言,對(duì)于 Unicode 編碼有很好的支持。至于該不該在項(xiàng)目中使用中文給標(biāo)識(shí)符命名,那就是另外的問(wèn)題啦……
本文轉(zhuǎn)載自微信公眾號(hào)「 Python貓」,可以通過(guò)以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系 Python貓公眾號(hào)。