為什么 Python 的 f-string 可以連接字符串與數(shù)字?
毫無疑問,Python 是一門強類型語言。強類型語言。強類型語言!
這就意味著,不同類型的對象通常需要先做顯式地類型轉(zhuǎn)化, 然后才能進行某些操作。
下面以字符串和數(shù)字為例,看看強行操作會產(chǎn)生什么結(jié)果:
- >>> "Python貓" + 666
- Traceback (most recent call last):
- File "<stdin>", line 1, in <module>
- TypeError: can only concatenate str (not "int") to str
它報類型錯誤了(TypeError),說字符串只能連接(concatenate)字符串,不能連接 int 類型。 這正是強類型語言的基本約束。
但是,如果我們先把數(shù)字“轉(zhuǎn)化”成字符串類型,再執(zhí)行“+”操作,就不會報錯了:
- >>> "Python貓" + str(666)
- 'Python貓666'
上面的這個例子,對讀者們來說,應(yīng)該并不難理解。
由此,我們要引出一個問題:如何在不作顯式類型轉(zhuǎn)化的情況下,進行字符串與數(shù)字類型的拼接呢?
在《詳解Python拼接字符串的七種方式》這篇文章中,它梳理了七種拼接字符串的寫法,我們可以逐個來試驗一下。
幾種字符串拼接方式:
1、格式化類:%、format()、template
2、拼接類:+、()、join()
3、插值類:f-string
為了節(jié)省篇幅,此處直接把可以順利拼接的 4 種寫法羅列如下:
- >>> "%s %d" % ("Python貓", 666)
- 'Python貓 666'
- >>> from string import Template
- >>> s = Template('${s1}${s2}')
- >>> s.safe_substitute(s1='Python貓',s2=666)
- 'Python貓666'
- >>> "Python貓{}".format(666)
- 'Python貓666'
- >>> num = 666
- >>> f"Python貓{num}"
- 'Python貓666'
第一種寫法(即 % 格式化)來自古老的 C 語言,其中的“%d”是一個占位符,表示它將要接收一個整數(shù),并格式化成字符串。
第二和第三種寫法,它們是第一種寫法的升級版,不同的是,它們的占位符是通用型的,不必指定“%s”、“%d”等等明確的類型。這兩種寫法中,數(shù)字類型的參數(shù)被傳給特定的格式化方法(即 safe_substitute 與 format),在這些方法的內(nèi)部,它們會作類型轉(zhuǎn)化處理。
可以說,上述三種寫法都不難理解,它們的意圖都有跡可循。
但是,現(xiàn)在再看看最后一種寫法,也就是 f-string 寫法,似乎就不是那么明顯了。
首先,在字符串內(nèi)部,它并沒有像“%格式化”那樣指定占位符的類型;其次,所要拼接的數(shù)字并沒有作為任何函數(shù)的參數(shù)來傳遞。
也就是說,在明面上根本看不出任何要作類型轉(zhuǎn)化的意圖。但是,由于我們已知 Python 是強類型語言,已知數(shù)字類型絕對不可能直接拼接到字符串里,因此,只能說明 f-string 語法在底層作了某種類型轉(zhuǎn)化的操作!
那么,我們就可以再提出一個新的問題:f-string 語法在處理字符串與數(shù)字時,是如何實現(xiàn)數(shù)字的類型轉(zhuǎn)化的呢?
也許有的讀者會猜想它是調(diào)用了內(nèi)置的 str() 或 repr()(或它們對應(yīng)的魔術(shù)方法__str__() 與 __repr__()),從而實現(xiàn)類型轉(zhuǎn)化,但是,答案并沒有如此簡單!
f-string 語法是在 Python 3.6 版本引入的。為了省事,我們直接找到 PEP-498 文檔,在里面查閱看是否有關(guān)于實現(xiàn)原理的線索。
文檔地址:https://www.python.org/dev/peps/pep-0498
PEP 里提到f-string 的語法格式是這樣的:
- f'<text> { <expression> <optional !s, !r, or !a> <optional : format specifier> } <text> ...'
其中,花括號里的內(nèi)容就是要作格式化的內(nèi)容,除去可選的“optional”部分后,“expression”部分就是真正要處理的內(nèi)容。對應(yīng)前文的例子,數(shù)字 666 就是一個 expression。
expression 會按 __format__ 協(xié)議進行格式化,但是并不會直接調(diào)用 __format__() 這個方法。
文檔上指出,實際的執(zhí)行過程等效于type(value).__format__(value, format_spec)或者 format(value, format_spec) 。
事實上,字符串對象的 foramt() 方法跟 Python 內(nèi)置的 foramt() 函數(shù),它們都會調(diào)用__format__() 魔術(shù)方法,所以,f-string 其實是前文中 format() 格式化寫法的升級版。
在默認情況下,format_spec 是一個空字符串,而format(value, "") 的效果等同于str(value) ,因此,在不指定其它 format_spec 的情況下,可以簡單地認為 f-string 就是調(diào)用了 str() 來作的類型轉(zhuǎn)化……
至此,我們看到了 f-string 的實現(xiàn)原理,明白了它在拼接字符串與數(shù)字時,效果等效于前文的 format() 格式化方法,也等效于使用 str() 進行類型轉(zhuǎn)化。
本文轉(zhuǎn)載自微信公眾號「Python貓」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請聯(lián)系Python貓公眾號。