Python關鍵字yield詳解
迭代器(Iterator)
為了理解yield是什么,首先要明白生成器(generator)是什么,在講生成器之前先說說迭代器(iterator),當創建一個列表(list)時,你可以逐個的讀取每一項,這就叫做迭代(iteration)。
- mylist = [1, 2, 3]
- for i in mylist :
- print(i)
- 1
- 2
- 3
Mylist就是一個迭代器,不管是使用復雜的表達式列表,還是直接創建一個列表,都是可迭代的對象。
- mylist = [x*x for x in range(3)]
- for i in mylist :
- print(i)
- 0
- 1
- 4
你可以使用“for··· in ···”來操作可迭代對象,如:list,string,files,這些迭代對象非常方便我們使用,因為你可以按照你的意愿進行重復的讀取。但是你不得不預先存儲所有的元素在內存中,那些對象里有很多元素時,并不是每一項都對你有用。
生成器(Generators)
生成器同樣是可迭代對象,但是你只能讀取一次,因為它并沒有把所有值存放內存中,它動態的生成值:
- mygenerator = (x*x for x in range(3))
- for i in mygenerator :
- print(i)
- 0
- 1
- 4
使用()和[]結果是一樣的,但是,第二次執行“ for in mygenerator”不會有任何結果返回,因為它只能使用一次。首先計算0,然后計算1,之后計算4,依次類推。
Yield
Yield是關鍵字, 用起來像return,yield在告訴程序,要求函數返回一個生成器。
- def createGenerator() :
- mylist = range(3)
- for i in mylist :
- yield i*i
- mygenerator = createGenerator() # create a generator
- print(mygenerator) # mygenerator is an object!
- <generator object createGenerator at 0xb7555c34>
- for i in mygenerator:
- print(i)
- 0
- 1
- 4
這個示例本身沒什么意義,但是它很清晰地說明函數將返回一組僅能讀一次的值,要想掌握yield,首先必須理解的是:當你調用生成器函數的時候,如上例中的createGenerator(),程序并不會執行函數體內的代碼,它僅僅只是返回生成器對象,這種方式頗為微妙。函數體內的代碼只有直到每次循環迭代(for)生成器的時候才會運行。
函數***次運行時,它會從函數開始處直到碰到yield時,就返回循環的***個值,然后,交互的運行、返回,直到沒有值返回為止。如果函數在運行但是并沒有遇到yield,就認為該生成器是空,原因可能是循環終止,或者沒有滿足任何”if/else”。
接下來讀一小段代碼來理解生成器的優點:
控制生成器窮舉
- >>> class Bank(): # 創建銀行,構造ATM機
- ... crisis = False
- ... def create_atm(self) :
- ... while not self.crisis :
- ... yield "$100"
- >>> hsbc = Bank() # 沒有危機時,你想要多少,ATM就可以吐多少
- >>> corner_street_atm = hsbc.create_atm()
- >>> print(corner_street_atm.next())
- $100
- >>> print(corner_street_atm.next())
- $100
- >>> print([corner_street_atm.next() for cash in range(5)])
- ['$100', '$100', '$100', '$100', '$100']
- >>> hsbc.crisis = True # 危機來臨,銀行沒錢了
- >>> print(corner_street_atm.next())
- <type 'exceptions.StopIteration'>
- >>> wall_street_atm = hsbc.ceate_atm() # 新建ATM,銀行仍然沒錢
- >>> print(wall_street_atm.next())
- <type 'exceptions.StopIteration'>
- >>> hsbc.crisis = False # 麻煩就是,即使危機過后銀行還是空的
- >>> print(corner_street_atm.next())
- <type 'exceptions.StopIteration'>
- >>> brand_new_atm = hsbc.create_atm() # 構造新的ATM,恢復業務
- >>> for cash in brand_new_atm :
- ... print cash
- $100
- $100
- $100
- $100
- $100
- $100
- $100
- $100
- $100
對于訪問控制資源,生成器顯得非常有用。
迭代工具,你***的朋友
迭代工具模塊包含了操做指定的函數用于操作迭代器。想復制一個迭代器出來?鏈接兩個迭代器?以one liner(這里的one-liner只需一行代碼能搞定的任務)用內嵌的列表組合一組值?不使用list創建Map/Zip?···,你要做的就是 import itertools,舉個例子吧:
四匹馬賽跑到達終點排名的所有可能性:
- >>> horses = [1, 2, 3, 4]
- >>> races = itertools.permutations(horses)
- >>> print(races)
- <itertools.permutations object at 0xb754f1dc>
- >>> print(list(itertools.permutations(horses)))
- [(1, 2, 3, 4),
- (1, 2, 4, 3),
- (1, 3, 2, 4),
- (1, 3, 4, 2),
- (1, 4, 2, 3),
- (1, 4, 3, 2),
- (2, 1, 3, 4),
- (2, 1, 4, 3),
- (2, 3, 1, 4),
- (2, 3, 4, 1),
- (2, 4, 1, 3),
- (2, 4, 3, 1),
- (3, 1, 2, 4),
- (3, 1, 4, 2),
- (3, 2, 1, 4),
- (3, 2, 4, 1),
- (3, 4, 1, 2),
- (3, 4, 2, 1),
- (4, 1, 2, 3),
- (4, 1, 3, 2),
- (4, 2, 1, 3),
- (4, 2, 3, 1),
- (4, 3, 1, 2),
- (4, 3, 2, 1)]
理解迭代的內部機制:
迭代(iteration)就是對可迭代對象(iterables,實現了__iter__()方法)和迭代器(iterators,實現了__next__()方法)的一個操作過程。可迭代對象是任何可返回一個迭代器的對象,迭代器是應用在迭代對象中迭代的對象,換一種方式說的話就是:iterable對象的__iter__()方法可以返回iterator對象,iterator通過調用next()方法獲取其中的每一個值(譯者注),讀者可以結合Java API中的 Iterable接口和Iterator接口進行類比。