你可能不知道的五個實用的 Python 模塊
Python 標準庫有超過 200 個模塊,程序員可以在他們的程序中導入和使用。雖然普通程序員對其中許多模塊都有一些經驗,但很可能有一些好用的模塊他們仍然沒有注意到。
我發現其中許多模塊都包含了在各個領域都非常有用的函數。比較數據集、協作其他函數以及音頻處理等都可以僅使用 Python 就可以自動完成。
因此,我編制了一份您可能不知道的 Python 模塊的候選清單,并對這幾個模塊進行了適當的解釋,以便您在將來理解和使用它們。
所有這些模塊都有不同的函數和類。我包含了幾個鮮為人知的函數和類,因此即使您聽說過這些模塊,也可能不知道它們的某些方面和用途。
1. difflib
??difflib?
? 是一個專注于比較數據集(尤其是字符串)的 Python 模塊。為了具體了解您可以使用此模塊完成的幾件事,讓我們檢查一下它的一些最常見的函數。
SequenceMatcher
??SequenceMatcher?
? 是一個比較兩個字符串并根據它們的相似性返回數據的函數。通過使用 ??ratio()?
?,我們將能夠根據比率/百分比來量化這種相似性。
語法:
SequenceMatcher(None, string1, string2)
下面這個個簡單的例子展示了該函數的作用:
from difflib import SequenceMatcher
phrase1 = "Tandrew loves Trees."
phrase2 = "Tandrew loves to mount Trees."
similarity = SequenceMatcher(None, phrase1, phrase2)
print(similarity.ratio())
# Output: 0.8163265306122449
get_close_matches
接下來是 ??get_close_matches?
?,該函數返回與作為參數傳入的字符串最接近的匹配項。
語法:
get_close_matches(word, possibilities, result_limit, min_similarity)
下面解釋一下這些可能有些混亂的參數:
- ?
?word?
? 是函數將要查看的目標單詞。 - ?
?possibilities?
? 是一個數組,其中包含函數將要查找的匹配項并找到最接近的匹配項。 - ?
?result_limit?
? 是返回結果數量的限制(可選)。 - ?
?min_similarity?
? 是兩個單詞需要具有的最小相似度才能被函數視為返回值(可選)。
下面是它的一個使用示例:
from difflib import get_close_matches
word = 'Tandrew'
possibilities = ['Andrew', 'Teresa', 'Kairu', 'Janderson', 'Drew']
print(get_close_matches(word, possibilities))
# Output: ['Andrew']
除此之外還有幾個是您可以查看的屬于 ??Difflib?
? 的其他一些方法和類:??unified_diff?
?、??Differ?
? 和 ??diff_bytes?
?
2. sched
??sched?
? 是一個有用的模塊,它以跨平臺工作的事件調度為中心,與 Windows 上的任務調度程序等工具形成鮮明對比。大多數情況下,使用此模塊時,都會使用 ??schedular?
? 類。
更常見的 ??time?
? 模塊通常與 ??sched?
? 一起使用,因為它們都處理時間和調度的概念。
創建一個 ??schedular?
? 實例:
schedular_name = sched.schedular(time.time, time.sleep)
可以從這個實例中調用各種方法。
- 事件執行的時間
- 活動優先級
- 事件本身(一個函數)
- 事件函數的參數
- 事件的關鍵字參數字典
- 調用 ?
?run()?
? 時,調度程序中的事件/條目會按照順序被調用。在安排完事件后,此函數通常出現在程序的最后。 - ?
?enterabs()?
? 是一個函數,它本質上將事件添加到調度程序的內部隊列中。它按以下順序接收幾個參數:
下面是一個示例,說明如何一起使用這兩個函數:
import sched
import time
def event_notification(event_name):
print(event_name + " has started")
my_schedular = sched.scheduler(time.time, time.sleep)
closing_ceremony = my_schedular.enterabs(time.time(), 1, event_notification, ("The Closing Ceremony", ))
my_schedular.run()
# Output: The Closing Ceremony has started
還有幾個擴展 ??sched?
? 模塊用途的函數:??cancel()?
?、??enter()?
? 和 ??empty()?
?。
3. binaascii
??binaascii?
? 是一個用于在二進制和 ASCII 之間轉換的模塊。
??b2a_base64?
? 是 ??binaascii?
? 模塊中的一種方法,它將 base64 數據轉換為二進制數據。下面是這個方法的一個例子:
import base64
import binascii
msg = "Tandrew"
encoded = msg.encode('ascii')
base64_msg = base64.b64encode(encoded)
decode = binascii.a2b_base64(base64_msg)
print(decode)
# Output: b'Tandrew'
該段代碼應該是不言自明的。簡單地說,它涉及編碼、轉換為 base64,以及使用 ??b2a_base64?
? 方法將其轉換回二進制。
以下是屬于 ??binaascii?
? 模塊的其他一些函數:??a2b_qp()?
?、??b2a_qp()?
? 和 ??a2b_uu()?
?。
4. tty
??tty?
? 是一個包含多個實用函數的模塊,可用于處理 ??tty?
? 設備。以下是它的兩個函數:
setraw()
將其參數 (fd) 中文件描述符的模式更改為 raw。setcbreak()
將其參數 (fd) 中的文件描述符的模式更改為 cbreak。
由于需要使用 ??termios?
? 模塊,該模塊僅適用于 Unix,例如在上述兩個函數中指定第二個參數(??when=termios.TCSAFLUSH?
?)。
5. weakref
??weakref?
? 是一個用于在 Python 中創建對對象的弱引用的模塊。
弱引用是不保護給定對象不被垃圾回收機制收集的引用。
以下是與該模塊相關的兩個函數:
getweakrefcount()
接受一個對象作為參數,并返回引用該對象的弱引用的數量。getweakrefs()
接受一個對象并返回一個數組,其中包含引用該對象的所有弱引用。
??weakref?
? 及其函數的使用示例:
import weakref
class Book:
def print_type(self):
print("Book")
lotr = Book
num = 1
rcount_lotr = str(weakref.getweakrefcount(lotr))
rcount_num = str(weakref.getweakrefcount(num))
rlist_lotr = str(weakref.getweakrefs(lotr))
rlist_num = str(weakref.getweakrefs(num))
print("number of weakrefs of 'lotr': " + rcount_lotr)
print("number of weakrefs of 'num': " + rcount_num)
print("Weakrefs of 'lotr': " + rlist_lotr)
print("Weakrefs of 'num': " + rlist_num)
# Output:
# number of weakrefs of 'lotr': 1
# number of weakrefs of 'num': 0
# Weakrefs of 'lotr': [<weakref at 0x10b978a90; to 'type' at #0x7fb7755069f0 (Book)>]
# Weakrefs of 'num': []
輸出從輸出的函數返回值我們可以看到它的作用。由于 ??num?
? 沒有弱引用,因此 ??getweakrefs()?
? 返回的數組為空。
以下是與 ??weakref?
? 模塊相關的一些其他函數:??ref()?
?、??proxy()?
? 和 ??_remove_dead_weakref()?
?。
回顧
Difflib
是一個用于比較數據集,尤其是字符串的模塊。例如,SequenceMatcher
可以比較兩個字符串并根據它們的相似性返回數據。sched
是與time
模塊一起使用的有用工具,用于使用schedular
實例安排事件(以函數的形式)。例如,enterabs()
將一個事件添加到調度程序的內部隊列中,該隊列將在調用run()
函數時運行。
??binaascii?
? 可在二進制和 ASCII 之間轉換以編碼和解碼數據。??b2a_base64?
? 是 ??binaascii?
? 模塊中的一種方法,它將 base64 數據轉換為二進制數據。
??tty?
? 模塊需要配合使用 ??termios?
? 模塊,并處理 tty 設備。它僅適用于 Unix。
??weakref?
? 用于弱引用。它的函數可以返回對象的弱引用,查找對象的弱引用數量等。其中非常使用的函數之一是 ??getweakrefs()?
?,它接受一個對象并返回一個該對象包含的所有弱引用的數組。
要點
這些函數中的每一個都有其各自的用途,每一個都有不同程度的有用性。了解盡可能多的 Python 函數和模塊非常重要,以便保持穩定的工具庫,您可以在編寫代碼時快速使用。
無論您的編程專業知識水平如何,您都應該不斷學習。多投入一點時間可以為您帶來更多價值,并為您節省更多未來時間。