Python中的3個(gè)“黑魔法”與“騷操作”
原創(chuàng)【51CTO.com原創(chuàng)稿件】本文主要介紹Python的高級(jí)特性:列表推導(dǎo)式、迭代器和生成器,是面試中經(jīng)常會(huì)被問(wèn)到的特性。因?yàn)樯善鲗?shí)現(xiàn)了迭代器協(xié)議,可由列表推導(dǎo)式來(lái)生成,所有,這三個(gè)概念作為一章來(lái)介紹,是最便于大家理解的,現(xiàn)在看不懂沒(méi)關(guān)系,下面我不僅是會(huì)讓大家知其然,重要的更是要知其所以然。
列表推導(dǎo)式
前幾天有個(gè)HR讓我談?wù)劻斜硗茖?dǎo)式,我說(shuō)這我經(jīng)常用,就是用舊的列表生成一個(gè)新的列表的公式,他直接就把我拒了,讓我回去復(fù)習(xí)一下,挺受打擊的,所以決定也幫助大家回顧一下。
內(nèi)容:
- 列表推導(dǎo)式:舊的列表->新的列表
- 了解:字典推導(dǎo)式 集合推導(dǎo)式
1.列表推導(dǎo)式:
格式 [表達(dá)式 for 變量 in 舊列表]
或 [表達(dá)式 for 變量 in 舊列表 if 條件]
例1:生成名字長(zhǎng)度大于3且首字母大寫的新列表。
- names_old = ['tom', 'amy', 'daming', 'lingling']
- names_new = [name.capitalize() for name in names_old if len(name) > 3]
- print(names_new)
輸出:
- ['Daming', 'Lingling']
例2: (大廠初級(jí)筆試題目)生成一個(gè)元組列表,要求每個(gè)元素為(0-5偶數(shù),0-10奇數(shù))形式。輸出結(jié)果為:
- [(0, 1), (0, 3), (0, 5), (0, 7), (0, 9), (2, 1), (2, 3), (2, 5), (2, 7), (2, 9), (4, 1), (4, 3), (4, 5), (4, 7), (4, 9)]
for循環(huán)實(shí)現(xiàn)代碼:
- new_list = list()
- for i in range(5): # 偶數(shù)
- if i % 2 == 0:
- for j in range(10): # 奇數(shù)
- if j % 2 != 0:
- new_list.append((i, j))
列表推導(dǎo)式代碼:
- new_list = [(i, j) for i in range(5) for j in range(10) if i % 2 == 0 and j % 2 != 0]
例3:(大廠初級(jí)筆試題目)給出一個(gè)員工列表:
- employees_old = [{'name': "tmo", "salary": 4800},
- {'name': "amy", "salary": 3800},
- {'name': "daming", "salary": 7000},
- {'name': "lingling", "salary": 5600}]
如果員工薪資大于5000則加200,否則加500,輸出新的員工列表。
列表推導(dǎo)式:
- employees_new = [employee['salary'] + 200 if employee['salary'] > 5000 else employee['salary'] + 500 for employee in employees_old]
- print(employees_new)
輸出:
- [5300, 4300, 7200, 5800]
發(fā)現(xiàn)結(jié)果是員工薪資列表,回過(guò)頭看一下代碼,確實(shí)是把得到的數(shù)字給了列表,那要返回員工列表要怎么實(shí)現(xiàn)呢?
讓我們用普通for循環(huán)的方式來(lái)進(jìn)行一下對(duì)比:
- for employee in employees_old:
- if employee['salary'] > 5000:
- employee['salary'] += 200
- else:
- employee['salary'] += 500
- print(employees_old)
輸出:
- [{'name': 'tmo', 'salary': 5300}, {'name': 'amy', 'salary': 4300}, {'name': 'daming', 'salary': 7200}, {'name': 'lingling', 'salary': 5800}]
沒(méi)錯(cuò),我們注意到兩者的差別了,列表推導(dǎo)式我們少了一步賦值(在字典元素上進(jìn)行賦值),不能直接返回一個(gè)薪資數(shù)值而是一個(gè)員工字典給列表。
正確的列表推導(dǎo)式如下:
- employees_new = [
- {'name': employee['name'], 'salary': employee['salary'] + 200} if employee['salary'] > 5000 else
- {'name': employee['name'], 'salary': employee['salary'] + 500} for employee in employees_old]
- print(employees_new)
2.字典推導(dǎo)式:
例1:
- dict_old = {'a': 'A', 'b': 'B', 'c': 'C', 'd': 'C'}
- dict_new = {value: key for key, value in dict_old.items()}
- print(dict_new)
輸出:
- {'A': 'a', 'B': 'b', 'C': 'd'}
3.集合推導(dǎo)式:
類似列表推導(dǎo)式 典型用法:去重
例1:
- list_old = [1, 2, 3, 5, 2, 3]
- set_new = {x for x in list_old}
- print(set_new)
輸出:
- {1, 2 ,3, 5}
小結(jié):到目前為止,列表推導(dǎo)式不就是一個(gè)用來(lái)創(chuàng)建列表的式子么?除了可以簡(jiǎn)化代碼,裝裝X?其實(shí),列表推導(dǎo)式還有另一個(gè)優(yōu)點(diǎn)是相比于for循環(huán)更高效,因?yàn)榱斜硗茖?dǎo)式在執(zhí)行時(shí)調(diào)用的是Python的底層C代碼,而for循環(huán)則是用Python代碼來(lái)執(zhí)行。嗷~面試官最想聽到的,是第二點(diǎn)。
迭代器
由于迭代器協(xié)議對(duì)很多人來(lái)說(shuō),是一個(gè)較為抽象的概念,而且生成器自動(dòng)實(shí)現(xiàn)了迭代器協(xié)議,所以我們需要先講解一下迭代器協(xié)議的概念,也是為了更好的理解接下來(lái)的生成器。
可以被next()函數(shù)調(diào)用并不斷返回下一個(gè)值的對(duì)象稱為迭代器:Iterator。
迭代是訪問(wèn)集合元素的一種方式,迭代器是一個(gè)可以記住遍歷位置的對(duì)象。迭代器對(duì)象從集合的第一個(gè)元素開始訪問(wèn),直到所有元素被訪問(wèn)完結(jié)束。
迭代器只能往前不能后退。
迭代器協(xié)議:是指對(duì)象需要提供__next__()方法,它要么返回迭代中的下一項(xiàng),要么就引起一個(gè)StopIteration異常,以終止迭代。
可迭代對(duì)象:就是實(shí)現(xiàn)了迭代器協(xié)議的對(duì)象。
舉個(gè)例子,對(duì)Python稍微熟悉一點(diǎn)的朋友應(yīng)該知道,Python的for循環(huán)不但可以用來(lái)遍歷list,還可以用來(lái)遍歷文件對(duì)象,如下所示:
with open('F:/test/test.txt') as f: for line in f: print(line)
為什么在Python中,文件還可以使用for循環(huán)進(jìn)行遍歷呢?這是因?yàn)?,在Python中,文件對(duì)象實(shí)現(xiàn)了迭代器協(xié)議,for循環(huán)并不知道它遍歷的是一個(gè)文件對(duì)象,它只管使用迭代器協(xié)議訪問(wèn)對(duì)象即可。
正是由于Python的文件對(duì)象實(shí)現(xiàn)了迭代器協(xié)議,我們才得以使用如此方便的方式訪問(wèn)文件,如下所示:
- with open('F:/test/test.txt') as f:
- for line in f:
- print(line)
輸出:
- with open('F:/test/test.txt') as f:
- print(dir(f))
可迭代的是不是肯定就是迭代器?
生成器是可迭代的,也是迭代器。
list是可迭代的,但不是迭代器。list可以借助iter()函數(shù)將可迭代的變成迭代器list->iter(list)->迭代器next():

舉個(gè)栗子:
- list1 = iter([x for x in range(10)])
- print(next(list1))
- print(next(list1))
可迭代對(duì)象:
- 生成器
- 元組 列表 集合 字典 字符串
如何判斷一個(gè)對(duì)象是否是可迭代?
借助isinstance()函數(shù):
- from collections import Iterable
- print(isinstance([x for x in range(10)], Iterable)) # 列表
- print(isinstance('hello world', Iterable)) # 字符串
- print(isinstance(100, Iterable)) # 數(shù)字
- print(isinstance((x for x in range(10)), Iterable)) # 迭代器
輸出:
- True
- True
- False
- True
生成器
生成器是Python最有用的特性之一,也是使用的最不廣泛的Python特性之一。究其原因,主要是因?yàn)?,在其他主流語(yǔ)言里面沒(méi)有生成器的概念。
正是由于生成器是一個(gè)“新”的東西,所以,它一方面沒(méi)有引起廣大工程師的重視,另一方面,也增加了工程師的學(xué)習(xí)成本,最終導(dǎo)致大家錯(cuò)過(guò)了Python中如此有用的一個(gè)特性。
我們已經(jīng)知道,通過(guò)列表推導(dǎo)式可以直接創(chuàng)建一個(gè)列表,但是,受到內(nèi)存限制,列表容量肯定是有限的。
而且,創(chuàng)建一個(gè)包含100萬(wàn)個(gè)元素的列表,不僅占用很大的存儲(chǔ)空間,如果我們僅僅需要訪問(wèn)前面那幾個(gè)元素,那后面絕大多數(shù)元素占用的空間都白白浪費(fèi)了。
所以,如果列表元素可以按照某種算法在循環(huán)的過(guò)程中不斷推算出后續(xù)的元素,這樣既不必創(chuàng)建完整的list,從而還可以節(jié)省大量的空間。
在Python中,這種一邊循環(huán)一邊計(jì)算的機(jī)制,稱為生成器:generator。
Python使用生成器對(duì)延遲操作提供了支持。所謂延遲操作,是指在需要的時(shí)候才產(chǎn)生結(jié)果,而不是立即產(chǎn)生結(jié)果。這也是生成器的主要好處。
定義生成器
Python有兩種不同的方式提供生成器:
方法一:借助列表推導(dǎo)式
生成器表達(dá)式:類似于列表推導(dǎo)(這也就是為什么第一節(jié)我要先介紹列表推導(dǎo)式),但是,生成器返回按需產(chǎn)生結(jié)果的一個(gè)對(duì)象,而不是一次構(gòu)建一個(gè)結(jié)果列表。
例1:
- my_generator = (x for x in range(5)) # 注意是()不是[]
- print(my_generator) # 發(fā)現(xiàn)不能打印出元素
- print(type(my_generator))
- print(my_generator.__next__()) # 三種得到元素的方法,注意看輸出結(jié)果
- print(next(my_generator))
- for i in my_generator:
- print(i)
- # 注意會(huì)拋出StopIteration異常
- # print(next(my_generator))
- print(next(my_generator)) # generator只能遍歷一次
輸出:
- Traceback (most recent call last):
- File "E:/pycharm/Leetcode/RL_Learning/printdata.py", line 11, in <module>
- print(next(my_generator))
- StopIteration
- <generator object <genexpr> at 0x0000000000513660>
- <class 'generator'>
- 0
- 1
- 2
- 3
- 4
方法二:借助函數(shù)
生成器函數(shù):使用yield語(yǔ)句而不是return語(yǔ)句返回函數(shù)結(jié)果。yield語(yǔ)句一次返回一個(gè)結(jié)果,在每個(gè)結(jié)果中間,掛起函數(shù)的狀態(tài),起到暫停的作用,以便下次從它離開的地方繼續(xù)執(zhí)行。
步驟:
- 定義函數(shù),函數(shù)返回使用yield關(guān)鍵字;
- 調(diào)用函數(shù),接收函數(shù)返回值;
- 得到的返回結(jié)果就是生成器;
- 借助next()或__nest__()得到想要的元素。
例2:你的函數(shù)里面只要出現(xiàn)了yield關(guān)鍵字,你的函數(shù)就不再是函數(shù)了,就變成生成器了:
- # 斐波那契數(shù)列:
- def fib(length): # 1. 定義函數(shù)
- a, b = 0, 1
- n = 0
- while n < length:
- n += 1
- yield b # return b + 暫停
- a, b = b, a + b
- g = fib(5) # 2. 調(diào)用函數(shù)
- print(g) # 3. 返回的就是生成器
- print(next(g)) # 4. 借助`next()`或`__nest__()`得到想要的元素
- print(next(g)) # 每調(diào)用一次產(chǎn)生一個(gè)值
- print(next(g))
- print(g.__next__())
- print(g.__next__())
輸出:
- <generator object fib at 0x0000000001DDDFC0>
- 1
- 1
- 2
- 3
- 5
注意:生成器只能遍歷一次。
當(dāng)調(diào)用函數(shù)的時(shí)候,并沒(méi)有進(jìn)函數(shù)進(jìn)行執(zhí)行,而是直接生成一個(gè)生成器,當(dāng)調(diào)用next的時(shí)候,才進(jìn)入函數(shù)真正開始執(zhí)行,除了第一次調(diào)用next()方法是從函數(shù)頭開始執(zhí)行,其余每次都是接著從上次執(zhí)行到y(tǒng)ield的地方接著執(zhí)行的。
小結(jié):
使用生成器以后,代碼行數(shù)更少。大家要記住,如果想把代碼寫的Pythonic,在保證代碼可讀性的前提下,代碼行數(shù)越少越好。
合理使用生成器,能夠有效提高代碼可讀性。只要大家完全接受了生成器的概念,理解了yield語(yǔ)句和return語(yǔ)句一樣,也是返回一個(gè)值。那么,就能夠理解為什么使用生成器比不使用生成器要好,能夠理解使用生成器真的可以讓代碼變得清晰易懂。
在實(shí)際工作中,充分利用Python生成器,不但能夠減少內(nèi)存使用,還能夠提高代碼可讀性。掌握生成器也是Python高手的標(biāo)配。如果本文對(duì)你有幫助,不要忘記關(guān)注點(diǎn)贊或收藏支持一下~
作者:臧遠(yuǎn)慧
簡(jiǎn)介:就職于中科星圖股份有限公司(北京),研發(fā)部后端技術(shù)組。個(gè)人擅長(zhǎng) Python/Java 開發(fā),了解前端基礎(chǔ);熟練掌握 MySQL,MongoDB,了解 Redis;熟悉 Linux 開發(fā)環(huán)境,掌握 Shell 編程,有良好的 Git 源碼管理習(xí)慣;精通 Nginx ,F(xiàn)lask、Swagger 開發(fā)框架;有 Docker+Kubernetes 云服務(wù)開發(fā)經(jīng)驗(yàn)。對(duì)人工智能、云原生技術(shù)有較大的興趣。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】