成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

一文讓你搞懂 Python 的生成器，以及我和一個奇葩之間的恩怨情仇

作者：古明地覺 2024-12-02 15:47:53

開發(fā) 前端

關于協(xié)程的更多細節(jié)，后續(xù)在介紹協(xié)程的時候再說，總之我們現(xiàn)在應該使用原生協(xié)程，至于 yield from 就讓它留在歷史的塵埃中吧，我們只需要知道整個演進過程即可。

楔子

本次來聊一聊 Python 的生成器，它是我們后續(xù)理解協(xié)程的基礎（對不起，沒有后續(xù)了）。生成器的話，估計大部分人在寫程序的時候都不怎么用，但其實生成器一旦用好了，確實能給程序帶來性能上的提升，那么下面就來看一看吧。

生成器的基礎知識

我們知道，如果函數(shù)的內部出現(xiàn)了 yield 關鍵字，那么它就不再是普通的函數(shù)了，而是一個生成器函數(shù)，調用之后會返回一個生成器對象。

生成器對象一般用于處理循環(huán)結構，應用得當?shù)脑捒梢詷O大優(yōu)化內存使用率。比如：我們讀取一個大文件。

def read_file(file):
    return open(file, encoding="utf-8").readlines()

print(read_file("假裝是大文件.txt"))
"""
['人生是什么?\n', '大概是閃閃發(fā)光的同時\n', '又讓人感到痛苦的東西吧']
"""

這個版本的函數(shù)，直接將里面的內容全部讀取出來了，返回了一個列表。如果文件非常大，那么內存的開銷可想而知。于是我們可以通過 yield 關鍵字，將普通函數(shù)變成一個生成器函數(shù)。

from typing import Iterator, Generator

def read_file(file):
    with open(file, encoding="utf-8") as f:
        for line in f:
            yield line

data = read_file("假裝是大文件.txt")
# 返回一個生成器對象
print(data)
"""
<generator object read_file at 0x0000019B4FA8BAC0>
"""

# 使用 for 循環(huán)遍歷
for line in data:
    # 文件每一行自帶換行符, 所以這里的 print 就不用換行符了
    print(line, end="")
"""
人生是什么?
大概是閃閃發(fā)光的同時
又讓人感到痛苦的東西吧
"""

由于生成器是一種特殊的迭代器，所以也可以使用它的 __next__ 方法。

def gen():
    yield 123
    yield 456
    yield 789
    return "result"

# 調用生成器函數(shù)時，會創(chuàng)建一個生成器
# 生成器雖然創(chuàng)建了，但是里面的代碼并沒有執(zhí)行
g = gen()

# 調用 __next__ 方法時才會執(zhí)行
# 當遇到 yield，會將生成器暫停、并返回 yield 后面的值
print(g.__next__())  # 123

# 此時生成器處于暫停狀態(tài)，如果我們不驅動它的話，它是不會前進的
# 再次執(zhí)行 __next__，生成器恢復執(zhí)行，并在下一個 yield 處暫停
print(g.__next__())  # 456

# 生成器會記住自己的執(zhí)行進度，它總是在遇到 yield 時暫停
# 調用 __next__ 時恢復執(zhí)行，直到遇見下一個 yield
print(g.__next__())  # 789

# 顯然再調用 __next__ 時，已經(jīng)找不到下一個 yield 了
# 那么生成器會拋出 StopIteration，并將返回值設置在里面
try:
    g.__next__()
except StopIteration as e:
    print(f"返回值：{e.value}")  # 返回值：result

可以看到，基于生成器，我們能夠實現(xiàn)惰性求值。

當然啦，生成器不僅僅有 __next__ 方法，它還有 send 和 throw 方法，我們先來說一說 send。

def gen():
    res1 = yield "yield 1"
    print(f"***** {res1} *****")
    res2 = yield "yield 2"
    return res2

g = gen()
# 此時程序在第一個 yield 處暫停
print(g.__next__())
"""
yield 1
"""

# 調用 g.send(val) 依舊可以驅動生成器執(zhí)行
# 同時還可以傳遞一個值，交給第一個 yield 左邊的 res1
# 然后尋找第二個 yield
print(g.send("嘿嘿"))
"""
***** 嘿嘿 *****
yield 2
"""
# 上面輸出了兩行，第一行是生成器里面的 print 打印的

try:
    # 此時生成器在第二個 yield 處暫停，調用 g.send 驅動執(zhí)行
    # 同時傳遞一個值交給第二個 yield 左邊的 res2，然后尋找第三個 yield
    # 但是生成器里面沒有第三個 yield 了，于是拋出 StopIteration
    g.send("蛤蛤")
except StopIteration as e:
    print(f"返回值：{e.value}")
"""
返回值：蛤蛤
"""

生成器永遠在 yield 處暫停，并將 yield 后面的值返回。如果想驅動生成器繼續(xù)執(zhí)行，可以調用 __next__ 或 send，會去尋找下一個 yield，然后在下一個 yield 處暫停。依次往復，直到找不到 yield 時，拋出 StopIteration，并將返回值包在里面。

但是這兩者的不同之處在于，send 可以接收參數(shù)，假設生成器在 res = yield 123 這里停下來了。

當調用 __next__ 和 send 的時候，都可以驅動執(zhí)行，但調用 send 時可以傳遞一個 value，并將 value 賦值給變量 res。而 __next__ 沒有這個功能，如果是調用 __next__ 的話，那么 res 得到的就是一個 None。

所以 res = yield 123 這一行語句需要兩次驅動生成器才能完成，第一次驅動會讓生成器執(zhí)行到 yield 123，然后暫停執(zhí)行，將 123 返回。第二次驅動才會給變量 res 賦值，此時會尋找下一個 yield 然后暫停。

生成器的預激

剛創(chuàng)建生成器的時候，里面的代碼還沒有執(zhí)行，它的 f_lasti 是 -1。關于什么是 f_lasti，需要解釋一下。

首先隨著 CPython 版本的升級，一些數(shù)據(jù)結構的底層實現(xiàn)也在發(fā)生改變，比如棧幀等等。在之前的版本中，棧幀有一個字段叫 f_lasti，它表示最近一條執(zhí)行完畢的字節(jié)碼指令的偏移量。而在 3.12 里面，這個字段已經(jīng)沒了。

雖然解釋器內部結構會發(fā)生變化，但暴露出來的 Python 接口是不變的，所以我們依舊可以訪問該字段。

def gen():
    res1 = yield 123
    res2 = yield 456
    return "result"

g = gen()
# 生成器函數(shù)和普通函數(shù)一樣，執(zhí)行時也會創(chuàng)建棧幀
# 通過 g.gi_frame 可以很方便的獲取
print(g.gi_frame.f_lasti)  # -1

f_lasti 是 -1，表示生成器剛被創(chuàng)建，還沒有執(zhí)行任何指令。而第一次驅動生成器執(zhí)行，叫做生成器的預激。但在生成器還沒有被預激時，我們調用 send，里面只能傳遞一個 None，否則報錯。

def gen():
    res1 = yield 123
    res2 = yield 456
    return "result"

g = gen()
try:
    g.send("小云同學")
except TypeError as e:
    print(e)
"""
can't send non-None value to a just-started generator
"""

對于尚未被預激的生成器，我們只能傳遞一個 None，也就是 g.send(None)。或者調用 g.__next__()，因為不管何時它傳遞的都是 None。

其實也很好理解，我們之所以傳值是為了賦給 yield 左邊的變量，這就意味著生成器必須至少被驅動一次、在某個 yield 處停下來才可以。而未被預激的生成器，它里面的代碼壓根就沒有執(zhí)行，所以第一次驅動的時候只能傳遞一個 None 進去。

如果查看生成器的源代碼的話，也能證明這一點：

圖片

在之前的版本中，判斷條件是 f_lasti 是否等于 -1，而在 3.12 中引入了 gi_frame_state 字段，表示生成器的狀態(tài)。如果生成器剛創(chuàng)建，并且接收的參數(shù) arg 不為 None，那么報錯。

那么生成器的狀態(tài)都有哪些呢？

// Include/internal/pycore_frame.h
typedef enum _framestate {
    FRAME_CREATED = -2,
    FRAME_SUSPENDED = -1,
    FRAME_EXECUTING = 0,
    FRAME_COMPLETED = 1,
    FRAME_CLEARED = 4
} PyFrameState;

狀態(tài)總共有五種。

FRAME_CREATED：生成器剛創(chuàng)建。
FRAME_SUSPENDED：生成器被掛起，也就是執(zhí)行到某個 yield 之后返回了。
FRAME_EXECUTING：生成器執(zhí)行中。
FRAME_COMPLETED：生成器執(zhí)行完畢，但棧幀對象還未被清理。
FRAME_CLEARED：生成器的棧幀對象被清理。

相關源碼細節(jié)下一篇文章（對不起，沒有下一篇了）會分析。

生成器的 throw 方法

除了 __next__ 和 send 方法之外，生成器還有一個 throw 方法，該方法的作用和前兩者類似，也是驅動生成器執(zhí)行，并在下一個 yield 處暫停。但它在調用的時候，需要傳遞一個異常進去。

def gen():
    try:
        yield 123
    except ValueError as e:
        print(f"異常：{e}")
    yield 456
    return "result"

g = gen()
# 生成器在 yield 123 處暫停
g.__next__()
# 向生成器傳遞一個異常
# 如果當前生成器的暫停位置處無法捕獲傳遞的異常，那么會將異常拋出來
# 如果能夠捕獲，那么會驅動生成器執(zhí)行，并在下一個 yield 處暫停
# 當前生成器位于 yield 123 處，而它所在的位置能夠捕獲異常
# 所以不會報錯，結果就是 456 會賦值給 val
val = g.throw(ValueError("一個 ValueError"))
"""
異常：一個 ValueError
"""
print(val)
"""
456
"""

關于生成器的 __next__、send、throw 三個方法的用法我們就說完了，還是比較簡單的。

關閉生成器

生成器也是可以關閉的，我們來看一下。

def gen():
    yield 123
    yield 456
    return "result"

g = gen()
# 生成器在 yield 123 處停止
print(g.__next__())  # 123
# 關閉生成器
g.close()
# 生成器一旦關閉，就代表執(zhí)行完畢了，它的棧幀會被重置為 None
print(g.gi_frame)  # None
try:
    # 再次調用 __next__，會拋出 StopIteration
    g.__next__()
except StopIteration as e:
    # 此時 e.value 為 None
    print(e.value)  # None

無論是顯式地關閉生成器，還是正常情況下生成器執(zhí)行完畢，內部的棧幀都會被重置為 None。而驅動一個已經(jīng)執(zhí)行結束的生成器，會拋出 StopIteration 異常，并且異常的 value 屬性為 None。

GeneratorExit 異常

這里再來說一說 GeneratorExit 這個異常，如果我們關閉一個生成器（或者生成器被刪除時），那么會往里面扔一個 GeneratorExit 進去。

def gen():
    try:
        yield 123
    except GeneratorExit as e:
        print("生成器被刪除了")

g = gen()
# 生成器在 yield 123 處暫停
g.__next__()
# 關閉生成器，會往里面扔一個 GeneratorExit
g.close()
"""
生成器被刪除了
"""

這里我們捕獲了傳遞的 GeneratorExit，所以 print 語句執(zhí)行了，但如果沒有捕獲呢？

def gen():
    yield 123

g = gen()
g.__next__()
g.close()

此時無事發(fā)生，但是注意：如果是手動調用 throw 方法扔一個 GeneratorExit 進去，異常還是會拋出來的。

那么問題來了，生成器為什么要提供這樣一種機制呢？直接刪就完了，干嘛還要往生成器內部丟一個異常呢？答案是為了資源的清理和釋放。

在 Python 還未提供原生協(xié)程，以及 asyncio 還尚未流行起來的時候，很多開源的協(xié)程框架都是基于生成器實現(xiàn)的協(xié)程。而創(chuàng)建連接的邏輯，一般都會寫在 yield 后面。

def _create_connection():
    # 一些邏輯
    yield conn
    # 一些邏輯

但是這些連接在不用的時候，要不要進行釋放呢？答案是肯定的，所以便可以這么做。

def _create_connection():
    # 一些邏輯
    try: 
        yield conn
    except GeneratorExit:
        conn.close()
    # 一些邏輯

這樣當我們關閉或刪除生成器的時候，就能夠自動對連接進行釋放了。

不過還有一個需要注意的點，就是在捕獲 GeneratorExit 之后，不可以再執(zhí)行 yield，否則會拋出 RuntimeError。

def gen():
    try:
        yield 123
    except GeneratorExit:
        print("生成器被刪除")
        yield

g = gen()
g.__next__()
g.close()
"""
生成器被刪除
Traceback (most recent call last):
  File "...", line 10, in <module>
    g.close()
RuntimeError: generator ignored GeneratorExit
"""

調用 close 方法時，如果沒有成功捕獲 GeneratorExit，那么生成器會直接關閉，不會有任何事情發(fā)生。但如果捕獲了 GeneratorExit，那么可以在對應的語句塊里做一些資源清理邏輯，但不應該再出現(xiàn) yield。

而上面的例子中出現(xiàn)了 yield，所以解釋器會拋出 RuntimeError，因為沒捕獲 GeneratorExit 還好，解釋器不會有什么抱怨。但如果捕獲了 GeneratorExit，說明我們知道生成器是被關閉了，既然知道，那里面還出現(xiàn) yield 的意義何在呢？

當然啦，如果出現(xiàn)了 yield，但沒有執(zhí)行到，則不會拋 RuntimeError。

def gen():
    try:
        yield 123
    except GeneratorExit:
        print("生成器被刪除")
        return
        yield

g = gen()
g.__next__()
g.close()
print("------------")
"""
生成器被刪除
------------
"""

遇見 yield 之前就返回了，所以此時不會出現(xiàn) RuntimeError。

注意：GeneratorExit 繼承自 BaseException，它無法被 Exception 捕獲。

yield from 的用法

當函數(shù)內部出現(xiàn)了 yield 關鍵字，那么它就是一個生成器函數(shù)，對于 yield from 而言亦是如此。那么問題來了，這兩者之間有什么區(qū)別呢？

from typing import Generator

def gen1():
    yield [1, 2, 3]

def gen2():
    yield from [1, 2, 3]

g1 = gen1()
g2 = gen2()
# 兩者都是生成器
print(isinstance(g1, Generator))  # True
print(isinstance(g2, Generator))  # True

print(g1.__next__())  # [1, 2, 3]
print(g2.__next__())  # 1

結論很清晰，yield 對后面的值沒有要求，會直接將其返回。而 yield from 后面必須跟一個可迭代對象（否則報錯），然后每次返回可迭代對象的一個值。

def gen():
    yield from [1, 2, 3]
    return "result"

g = gen()
print(g.__next__())  # 1
print(g.__next__())  # 2
print(g.__next__())  # 3
try:
    g.__next__()
except StopIteration as e:
    print(e.value)  # result

除了要求必須跟一個可迭代對象，然后每次只返回一個值之外，其它表現(xiàn)和 yield 是類似的。而對于當前這個例子來說，yield from [1, 2, 3] 等價于 for item in [1, 2, 3]: yield item。

所以有人覺得 yield from 貌似沒啥用啊，它完全可以用 for 循環(huán)加 yield 進行代替。很明顯不是這樣的，yield from 背后做了非常多的事情，我們稍后說。

這里先出一道思考題：

圖片

這時候便可以通過 yield 和 yield from 來實現(xiàn)這一點。

def flatten(data):
    for item in data:
        if isinstance(item, list):
            yield from flatten(item)
        else:
            yield item


data = [1, [[[[[3, 3], 5]]], [[[[[[[[[[[[6]]]]], 8]]], "aaa"]]]], 250]]
print(list(flatten(data)))  # [1, 3, 3, 5, 6, 8, 'aaa', 250]

怎么樣，是不是很簡單呢？

委托生成器

如果單從語法上來看的話，會發(fā)現(xiàn) yield from 貌似沒什么特殊的地方，但其實 yield from 還可以作為委托生成器。委托生成器會在調用方和子生成器之間建立一個雙向通道，什么意思呢？我們舉例說明。

def gen():
    yield 123
    yield 456
    return "result"

def middle():
    res = yield from gen()
    print(f"接收到子生成器的返回值: {res}")

# middle 里面出現(xiàn)了 yield from gen()
# 此時 middle() 便是委托生成器，gen() 是子生成器
g = middle()

# 而 yield from 會在調用方和子生成器之間建立一個雙向通道
# 兩者是可以互通的，調用 g.send、g.throw 都會直接傳遞給子生成器
print(g.__next__())  # 123
print(g.__next__())  # 456

# 問題來了，如果再調用一次 __next__ 會有什么后果呢？
# 按照之前的理解，應該會拋出 StopIteration
print(g.__next__())
"""
接收到子生成器的返回值: result
Traceback (most recent call last):
  File "...", line 21, in <module>
    print(g.__next__())
StopIteration
"""

在第三次調用 __next__ 的時候，確實拋了異常，但是委托生成器收到了子生成器的返回值。也就是說，委托生成器在調用方和子生成器之間建立了雙向通道，兩者是直接通信的，并且當子生成器出現(xiàn) StopIteration 時，委托生成器還要負責兜底。

委托生成器會將子生成器拋出的 StopIteration 里面的 value 取出來，然后賦值給左側的變量 res，并在自己內部繼續(xù)尋找 yield。

換句話說，當子生成器 return 之后，委托生成器會拿到返回值，并將子生成器拋出的異常給捕獲掉。但是還沒完，因為還要找到下一個 yield，那么從哪里找呢？顯然是從委托生成器的內部尋找，于是接下來就變成了調用方和委托生成器之間的通信。

如果在委托生成器內部能找到下一個 yield，那么會將值返回給調用方。如果找不到，那么就重新構造一個 StopIteration，將異常拋出去。此時異常的 value 屬性，就是委托生成器的返回值。

def gen():
    yield 123
    return "result"

def middle():
    res = yield from gen()
    return f"委托生成器返回了子生成器的返回值：{res}"

g = middle()
print(g.__next__())  # 123
try:
    g.__next__()
except StopIteration as e:
    print(e.value)  # 委托生成器返回了子生成器的返回值：result

大部分情況下，我們并不關注委托生成器的返回值，我們更關注的是子生成器。于是可以換種寫法：

def gen():
    yield 123
    yield 456
    yield 789
    return "result"

def middle():
    yield (yield from gen())

g = middle()
for v in g:
    print(v)
"""
123
456
789
result
"""

所以委托生成器負責在調用方和子生成器之間建立一個雙向通道，通道一旦建立，調用方可以和子生成器直接通信。雖然調用的是委托生成器的 __next__、send、throw 等方法，但影響的都是子生成器。

并且委托生成器還可以對子生成器拋出的 StopIteration 異常進行兜底，會捕獲掉該異常，然后拿到返回值，這樣就無需手動捕獲子生成器的異常了。但問題是委托生成器還要找到下一個 yield，并將值返回給調用方，此時這個重擔就落在了它自己頭上。

如果找不到，還是要將異常拋出來的，只不過拋出的 StopIteration 是委托生成器構建的。而子生成器拋出的 StopIteration，早就被委托生成器捕獲掉了。于是我們可以考慮在 yield from 的前面再加上一個 yield，這樣就不會拋異常了。

為什么要有委托生成器

我們上面已經(jīng)了解了委托生成器的用法，不過問題來了，這玩意為啥會存在呢？上面的邏輯，即便不使用 yield from 也可以完成啊。

其實是因為我們上面的示例代碼比較簡單（為了演示用法），當需求比較復雜時，將生成器內部的部分操作委托給另一個生成器是有必要的，這也是委托生成器的由來。

而委托生成器不僅要能保證調用方和子生成器之間直接通信，還要能夠以一種優(yōu)雅的方式獲取子生成器的返回值，于是新的語法 yield from 就誕生了。

但其實 yield from 背后為我們做得事情還不止這么簡單，它不單單是建立雙向通道、獲取子生成器的返回值，它還會處理子生成器內部出現(xiàn)的異常，詳細內容可以查看 PEP380。

https://peps.python.org/pep-0380/

這里我們直接給出結論，并通過代碼演示一下。

1）子生成器 yield 后面的值，會直接返回給調用方；調用方 send 發(fā)送的值，也會直接傳給子生成器。

def gen():
    res = yield 123
    yield [res]
    return "result"

def middle():
    yield (yield from gen())

g = middle()
# 子生成器 yield 后面的值，會直接返回給調用方
print(g.__next__())  # 123
# 調用方 send 發(fā)送的值，也會直接傳給子生成器
print(g.send("小云同學"))  # ['小云同學']

另外還要補充一個細節(jié)，如果 yield from 一個已經(jīng)消耗完畢的生成器，會直接返回 None。

def gen():
    yield 123
    return "result"

def middle():
    sub = gen()
    res = yield from sub
    yield res + " from gen()"
    # 到這里的話，sub = gen() 這個生成器已經(jīng)被消耗完畢了
    # 如果我們繼續(xù) yield from 的話，會直接返回 None
    res = yield from sub
    yield f"res: {res}"

g = middle()
print(g.__next__())  # 123
print(g.__next__())  # result from gen()
# 此處執(zhí)行 g.__next__() 時
# 委托生成器內部會執(zhí)行第二個 res = yield from sub
# 但問題是 sub 之前就已經(jīng)被消耗完了，所以會直接返回 None，然后尋找下一個 yield
print(g.__next__())  # res: None

所以不要對生成器做二次消費。

2）子生成器結束時，最后的 return value 等價于 raise StopIteration(value)。然后該異常會被 yield from 捕獲，并將 value 賦值給 yield from 左側的變量。并且在拿到子生成器的返回值時，委托生成器會繼續(xù)運行，尋找下一個 yield。

def gen():
    yield 123
    return "result"

def middle():
    res = yield from gen()
    yield res + " from middle()"

g = middle()
print(g.__next__())  # 123
# 子生成器 gen() 在 return 時會拋出 StopIteration
# 然后在委托生成器內部被捕獲，并將返回值賦給 res
# 接著繼續(xù)尋找下一個 yield
print(g.__next__())  # result from middle()

另外補充一點，生成器在 return 時，等價于拋出一個 StopIteration。但異常必須在 return 的時候隱式拋出，如果是在生成器內部 raise StopIteration 則是不合法的。

def gen():
    yield 123
    raise StopIteration("result")

g = gen()
print(g.__next__())  # 123
print(g.__next__())
"""
Traceback (most recent call last):
  File "......", line 3, in gen
    raise StopIteration("result")
StopIteration: result

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
  File "......", line 7, in <module>
    print(g.__next__())
RuntimeError: generator raised StopIteration
"""

此時會引發(fā)一個 RuntimeError。

3）如果子生成器在執(zhí)行的過程中，內部出現(xiàn)了異常，那么會將異常丟給委托生成器。委托生成器會嘗試處理該異常，如果處理不了，那么再調用子生成器的 throw 方法將異常扔回去。

def gen():
    yield 123
    raise ValueError("出了個錯")
    return "result"

def middle():
    yield from gen()

g = middle()
print(g.__next__())  # 123
# 此時子生成器會拋出 ValueError，而委托生成器沒有異常捕獲邏輯，無法處理
# 于是會調用子生成器的 throw 方法，將異常重新扔回去，最終由調用方來處理
try:
    print(g.__next__())  # 123
except ValueError as e:
    print(e)  # 出了個錯

那如果委托生成器可以處理子生成器拋出的異常呢？

def gen():
    yield 123
    raise ValueError("出了個錯")
    return "result"

def middle():
    try:
        yield from gen()
    except ValueError as e:
        yield f"異常：{e}"
    # 當子生成器拋出異常時，它就已經(jīng)結束了
    yield "result from middle()"

g = middle()
print(g.__next__())  # 123
print(g.__next__())  # 異常：出了個錯
print(g.__next__())  # result from middle()

如果委托生成器可以處理子生成器拋出的異常，那么接下來就是調用方和委托生成器之間的事情了。

再比如我們將生成器 close 掉，看看結果會怎樣，我們知道它會 throw 一個 GeneratorExit。

def gen():
    yield 123
    return "result"

def middle():
    try:
        yield from gen()
    except GeneratorExit as e:
        print(f"子生成器結束了")

g = middle()
print(g.__next__())  # 123
# 關閉子生成器，會 throw 一個 GeneratorExit
# 然后這個 GeneratorExit 會向上透傳給委托生成器
g.close()
"""
子生成器結束了
"""
# 注意：委托生成器也是同理
# 一旦捕獲了 GeneratorExit，后續(xù)不應該再出現(xiàn) yield

yield from 算是 Python 里面特別難懂的一個語法了，但如果理解了 yield from，后續(xù)理解 await 就會簡單很多。

生成器表達式

Python 里面還有一個生成器表達式，我們來看一下。

from typing import Generator

g = (x for x in range(10))
print(isinstance(g, Generator))  # True
print(g)  # <generator object <genexpr> at 0x...>

print(g.__next__())  # 0
print(g.__next__())  # 1

如果表達式是在一個函數(shù)里面，那么生成器表達式周圍的小括號可以省略掉。

import random

d = [random.randint(1, 10) for _ in range(100)]
# 我們想統(tǒng)計里面大于 5 的元素的總和
# 下面兩種做法都是可以的
print(
    sum((x for x in d if x > 5)),
    sum(x for x in d if x > 5)
)  # 397 397

這兩種做法是等價的，字節(jié)碼完全一樣。

但要注意，生成器表達式還存在一些陷阱，一不小心就可能踩進去。至于是什么陷阱呢？很簡單，一句話：使用生成器表達式創(chuàng)建生成器的時候，in 后面的變量就已經(jīng)確定了，但其它的變量則不會。舉個栗子：

g = (巭孬嫑夯烎 for x in [1, 2, 3])

執(zhí)行這段代碼不會報錯，盡管 for 前面那一坨我們沒有定義，但不要緊，因為生成器是惰性執(zhí)行的。但如果我們調用了 g.__next__()，那么很明顯就會報錯了，會拋出 NameError。

g = (x for x in lst)

但是這段代碼會報錯：NameError: name 'lst' is not defined，因為 in 后面的變量在創(chuàng)建生成器的時候就已經(jīng)確定好了。而在創(chuàng)建生成器的時候，發(fā)現(xiàn) lst 沒有定義，于是拋出 NameError。

所以，陷阱就來了：

i = 1
g = (x + i for x in [1, 2, 3])
i = 10
# 輸出的不是 (2, 3, 4)
print(tuple(g))  # (11, 12, 13)

因為生成器只有在執(zhí)行的時候，才會去確定變量 i 究竟指向誰，而調用 tuple(g) 的時候 i 已經(jīng)被修改了。

lst = [1, 2, 3]
g = (x for x in lst)
lst = [4, 5, 6]
print(tuple(g))  # (1, 2, 3)

但這里輸出的又是 (1, 2, 3)，因為在創(chuàng)建生成器的時候，in 后面的變量就已經(jīng)確定了，這里會和 lst 指向同一個列表。而第三行改變的只是變量 lst 的指向，和生成器無關。

g = (x for x in [1, 2, 3, 4])
for i in [1, 10]:
    g = (x + i for x in g)

print(tuple(g))

思考一下，上面代碼會打印啥？下面進行分析：

初始的 g，可以看成是 (1, 2, 3, 4)，因為 in 后面是啥，在創(chuàng)建生成器的時候就確定了；
第一次循環(huán)之后，g 就相當于 (1+i, 2+i, 3+i, 4+i)；
第二次循環(huán)之后，g 就相當于 (1+i+i, 2+i+i, 3+i+i, 4+i+i)；

而循環(huán)結束后，變量 i 會指向 10，所以打印結果就是 (21, 22, 23, 24)。

生成器與協(xié)程

在 Python 還沒有引入原生協(xié)程的時候，很多開源框架都是基于生成器模擬的協(xié)程，最經(jīng)典的莫過于 Tornado。然而事實上，即便是原生協(xié)程，在底層也是基于生成器實現(xiàn)的。

async def native_coroutine():
    return "古明地覺"

try:
    native_coroutine().__await__().__next__()
except StopIteration as e:
    print(e.value)  # 古明地覺

這里沒有創(chuàng)建事件循環(huán)，而是直接驅動協(xié)程執(zhí)行。我們再演示一段代碼，看看讓生成器協(xié)程和原生協(xié)程混合使用會是什么效果。

import asyncio
import time
import types

async def some_task():
    """
    某個耗時較長的任務
    """
    await asyncio.sleep(3)
    return "task result"

async def native_coroutine():
    """
    原生協(xié)程
    """
    result = await some_task()
    return f"{result} from native coroutine"

@types.coroutine  # 或者使用 @asyncio.coroutine
def generator_coroutine():
    """
    生成器模擬的協(xié)程
    """
    result = yield from some_task()
    return f"{result} from generator coroutine"

async def main():
    start = time.time()
    result = await asyncio.gather(
        native_coroutine(), generator_coroutine()
    )
    end = time.time()
    print(result)
    print(f"耗時：{end - start}")

asyncio.run(main())
"""
['task result from native coroutine', 'task result from generator coroutine']
耗時：3.0016210079193115
"""

從效果上來看，兩種方式是等價的。yield from 會驅動協(xié)程對象執(zhí)行，當協(xié)程執(zhí)行 return 的時候，會拋出一個 StopIteration 異常。然后 yield from 再將異常捕獲掉，并取出里面的返回值。

但使用裝飾器 + yield from 這種方式不夠優(yōu)雅，并且 yield from 即用于生成器，又用于協(xié)程，容易給人造成困惑。為此 Python 從 3.5 開始引入了原生協(xié)程，使用 async def 定義協(xié)程，使用 await 驅動協(xié)程執(zhí)行。

關于協(xié)程的更多細節(jié)，后續(xù)在介紹協(xié)程的時候再說，總之我們現(xiàn)在應該使用原生協(xié)程，至于 yield from 就讓它留在歷史的塵埃中吧，我們只需要知道整個演進過程即可。

小結

以上我們就從 Python 的角度梳理了一遍生成器相關的知識，下一篇文章我們將從源碼的角度來分析生成器的具體實現(xiàn)。

責任編輯：武曉燕來源：古明地覺的編程教室

生成器協(xié)程 Python

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

主站蜘蛛池模板：日韩国产在线 | 丁香久久 | 亚洲欧美激情网 | 在线观看免费黄色片 | 免费高清av | 亚洲成人精品免费 | 亚洲精品在线观看视频 | 亚洲国产精品精华素 | 亚洲综合伊人 | 精品一二区 | 国产传媒毛片精品视频第一次 | 黄a大片 | 福利片在线观看 | 国产精品国产成人国产三级 | 亚洲不卡在线观看 | 蜜桃av鲁一鲁一鲁一鲁 | 99色综合| 亚洲不卡 | 成人综合久久 | 一区二区视频 | 欧美日一区 | 日日躁狠狠躁aaaaxxxx | 一级毛片在线播放 | 欧美中文一区 | 成人福利在线观看 | 在线精品亚洲欧美日韩国产 | 成人h动漫亚洲一区二区 | 久久成人精品视频 | 精品欧美一区免费观看α√ | 国产亚洲精品一区二区三区 | 久久久夜色精品亚洲 | 亚洲精品欧美一区二区三区 | 久久国产高清 | 国产情侣一区 | 久久精品亚洲国产奇米99 | 日本亚洲一区 | 精品成人| a在线免费观看 | 日韩欧美国产一区二区 | 亚洲不卡在线观看 | 一级片视频免费 |