長篇大論Python生成器
ython生成器是什么
一句話解釋:包含了yield關(guān)鍵字的函數(shù)就是生成器,它的返回值是一個生成器對象。我簡單畫了個示意圖:
yield相當于return。
函數(shù)遇到y(tǒng)ield就暫停,保存當前信息,返回yield的值。
在下次執(zhí)行next()時,從當前位置繼續(xù)執(zhí)行。
比較有意思的事情是,曾經(jīng)有人建議生成器函數(shù)不應該使用def,而應該發(fā)明一個新的關(guān)鍵字比如gen,但是Python之父Guido并沒有同意這樣做。
生成器函數(shù)的工作原理
先通過一個簡單示例來說明生成器的行為:
- # 定義一個生成器
- >>> def gen_123():
- ... yield 1
- ... yield 2
- ... yield 3
- ...
- # 生成器本身是個函數(shù)
- >>> gen_123
- <function gen_123 at 0x0000019F60710790>
- # 返回值是生成器對象
- >>> gen_123()
- <generator object gen_123 at 0x0000019F606AC040>
- # 生成器也是迭代器
- >>> for i in gen_123():
- ... print(i)
- ...
- 1
- 2
- 3
- # 驗證生成器也是迭代器,定義迭代器g
- >>> g = gen_123()
- # 可以通過next()獲取yield生成的下一個元素
- >>> next(g)
- 1
- >>> next(g)
- 2
- >>> next(g)
- 3
- >>> next(g)
- Traceback (most recent call last):
- File "<input>", line 1, in <module>
- StopIteration
生成器的原理就是:
- 生成器函數(shù)會創(chuàng)建一個生成器對象。
- 把生成器傳給next()函數(shù)時,生成器函數(shù)會執(zhí)行函數(shù)定義體中的下一個yield語句,返回產(chǎn)出的值,并在當前位置暫停。
- 函數(shù)的定義體返回時,外層的生成器對象會拋出StopIteration異常
yield關(guān)鍵字一般是和for循環(huán)搭配使用的,在for循環(huán)中會隱式調(diào)用next()函數(shù)。
生成器的作用其實是解決內(nèi)存的問題,比如我們都知道Python的正則表達式有一個re.findall()函數(shù),它會把所有匹配到的元素都一次性寫入內(nèi)存中,假如匹配到的數(shù)據(jù)很多,就會占用大量的內(nèi)存。為了解決這個問題,Python3有一個re.finditer()函數(shù),返回的就是一個生成器,取值時才生成數(shù)據(jù)放入內(nèi)存中,能節(jié)省大量內(nèi)存。
標準庫中的生成器函數(shù)
實現(xiàn)生成器時要知道標準庫中有什么可用,否則很可能會重新發(fā)明輪子。有些是內(nèi)置的,有些在itertools模塊中,有些functools模塊中。
用于過濾的生成器函數(shù)
從輸入的可迭代對象中產(chǎn)出元素的子集,而且不修改元素本身。
用于映射的生成器函數(shù)
在輸入的單個可迭代對象中的各個元素上做計算,然后返回結(jié)果。
合并多個可迭代對象的生成器函數(shù)
從輸入的多個可迭代對象中產(chǎn)出元素。
把輸入的各個元素擴展成多個輸出元素的生成器函數(shù)
從一個元素中產(chǎn)出多個值,擴展輸入的可迭代對象。
用于重新排列元素的生成器函數(shù)
產(chǎn)出輸入的可迭代對象中的全部元素,不過會以某種方式重新排列。
yield from
yield from是Python3.3新出現(xiàn)的句法,它的作用是把不同的生成器結(jié)合在一起使用。
比如生成器函數(shù)需要產(chǎn)出另一個生成器生成的值,傳統(tǒng)的解決辦法是使用for循環(huán):
- def chain(*iterables):
- for it in iterables:
- for i in it:
- yield i
- s = "ABC"
- t = tuple(range(3))
- print(list(chain(s, t))) # ["A", "B", "C", 0, 1, 2]
改成yield from:
- def chain(*iterables):
- for it in iterables:
- yield from i
完全代替了內(nèi)層的for循環(huán)。
參考資料:
《流暢的Python》第14章 可迭代的對象、迭代器和生成器
https://www.runoob.com/python3/python3-iterator-generator.html
作者