?有一句諺語:"不必重新造輪子"。Python庫是這方面的最好例子。它可以幫助你以一種簡單的方式編寫復雜而耗時的功能。據我所知,一個好的項目會使用一些最好的庫。
1. PySnooper
我們正在編寫一個通過返回位列表將數字轉換為二進制的函數。@pysnooper.snoop()可以通過添加裝飾器來研究它:
import pysnooper
@pysnooper.snoop()
def number_to_bits(number):
if number:
bits = []
while number:
number, remainder = divmod(number, 2)
bits.insert(0, remainder)
return bits
else:
return [0]
number_to_bits(6)
或者,如果不想跟蹤整個函數,則可以將相關部分包裝在一個with塊中:
import pysnooper
import random
def foo():
lst = []
for i in range(10):
lst.append(random.randrange(1, 1000))
with pysnooper.snoop():
lower = min(lst)
upper = max(lst)
mid = (lower + upper) / 2
print(lower, mid, upper)
foo()
輸出如下:
New var:....... i = 9
New var:....... lst = [681, 267, 74, 832, 284, 678, ...]
09:37:35.881721 line 10
lower = min(lst)
New var:....... lower = 74
09:37:35.882137 line 11
upper = max(lst)
New var:....... upper = 832
09:37:35.882304 line 12
mid = (lower + upper) / 2
74 453.0 832
New var:....... mid = 453.0
09:37:35.882486 line 13
print(lower, mid, upper)
Elapsed time: 00:00:00.000344
作為開發者,大部分時間都用在了調試上。這個庫是一個調試器。大多數人都會在戰略位置上使用print?行,其中一些行會顯示變量的值。這個庫可以做同樣的事情,只不過你不需要精心設計正確的print行,而只需要在你感興趣的函數上添加一行裝飾符。你會得到一個函數的逐字記錄日志,包括哪些行在什么時候運行,以及局部變量什么時候被改變。它在GitHub上有超過15k顆星。
項目地址:https://github.com/cool-RR/PySnooper
2. schedule
人類的 Python 作業調度。使用友好的語法定期運行 Python 函數(或任何其他可調用函數)。
- 一個簡單易用的 API,用于安排作業,專為人類設計。
- 周期性作業的進程內調度程序。不需要額外的過程!
- 非常輕巧,沒有外部依賴。
- 出色的測試覆蓋率。
- 可在 Python 和 3.6、3.7、3.8、3.9 上測試
import schedule
import time
def job():
print("I'm working...")
schedule.every(10).seconds.do(job)
schedule.every(10).minutes.do(job)
schedule.every().hour.do(job)
schedule.every().day.at("10:30").do(job)
schedule.every(5).to(10).minutes.do(job)
schedule.every().monday.do(job)
schedule.every().wednesday.at("13:15").do(job)
schedule.every().day.at("12:42", "Europe/Amsterdam").do(job)
schedule.every().minute.at(":17").do(job)
def job_with_argument(name):
print(f"I am {name}")
schedule.every(10).seconds.do(job_with_argument, name="Peter")
while True:
schedule.run_pending()
time.sleep(1)
這是一個面向人類的Python作業調度庫。它可以讓你使用友好的語法周期性地運行Python函數(或任何其他可調用)。它包括很多功能,比如周期性工作的進程內調度器(不需要額外的進程),非常輕量級,沒有外部依賴性,有很好的測試覆蓋率等等。這個庫在GitHub上有超過10k顆星。
項目地址:https://github.com/dbader/schedule
3. MechanicalSoup
"""Example usage of MechanicalSoup to get the results from the Qwant
search engine.
"""
import re
import mechanicalsoup
import html
import urllib.parse
# Connect to Qwant
browser = mechanicalsoup.StatefulBrowser(user_agent='MechanicalSoup')
browser.open("https://lite.qwant.com/")
# Fill-in the search form
browser.select_form('#search-form')
browser["q"] = "MechanicalSoup"
browser.submit_selected()
# Display the results
for link in browser.page.select('.result a'):
# Qwant shows redirection links, not the actual URL, so extract
# the actual URL from the redirect link:
href = link.attrs['href']
m = re.match(r"^/redirect/[^/]*/(.*)$", href)
if m:
href = urllib.parse.unquote(m.group(1))
print(link.text, '->', href)
這個庫將幫助你實現與網站的自動互動。它自動存儲和發送cookies,跟蹤重定向,并能跟蹤鏈接和提交表單。它不做Javascript。這個庫在GitHub上有超過4k顆星。
項目地址:https://github.com/MechanicalSoup/MechanicalSoup
4. ftfy
>>> from ftfy import fix_encoding
>>> print(fix_encoding("(à??'a?£')à??"))
(?'?')?
它能做什么
以下是 ftfy 可以做什么的一些示例(在現實世界中找到):
ftfy 可以通過檢測明顯是 UTF-8 但被解碼為其他字符的字符模式來修復 mojibake(編碼混淆):
>>> import ftfy
>>> ftfy.fix_text('a?” No problems')
'? No problems'
這聽起來不可能嗎?真的不是。UTF-8 是一種設計良好的編碼,當它被誤用時會很明顯,而且一串 mojibake 通常包含我們恢復原始字符串所需的所有信息。
ftfy 可以同時修復多層 mojibake:
>>> ftfy.fix_text('The Mona Lisa doesn???¢?¢a€????¢a€??¢t have eyebrows.')
"The Mona Lisa doesn't have eyebrows."
它可以修復上面應用了“卷曲引號”的 mojibake,在引號展開之前無法持續解碼:
>>> ftfy.fix_text("l’humanit??")
"l'humanité"
ftfy 可以修復包含字符 U+A0(不間斷空格)的 mojibake,但 U+A0 變成了 ASCII 空格,然后與另一個以下空格組合:
>>> ftfy.fix_text('?\xa0 perturber la r??flexion')
'à perturber la réflexion'
>>> ftfy.fix_text('? perturber la r??flexion')
'à perturber la réflexion'
ftfy 還可以解碼出現在 HTML 之外的 HTML 實體,即使在實體大寫不正確的情況下也是如此:
>>> # by the HTML 5 standard, only 'PéREZ' is acceptable
>>> ftfy.fix_text('PÉREZ')
'PéREZ'
這些修復并不適用于所有情況,因為 ftfy 有一個堅定的目標,即避免誤報——它永遠不應該將正確解碼的文本更改為其他內容。
以下文本可以在 Windows-1252 中編碼并在 UTF-8 中解碼,并將解碼為“MARQU?”。然原文已明理,故不改。
>>> ftfy.fix_text('IL Y MARQUé…')
'IL Y MARQUé…'
這個庫將幫助你修復以各種方式損壞的Unicode。這個庫的目標是接收壞的Unicode并輸出好的Unicode,以便在你的Unicode感知代碼中使用。它在GitHub上有超過3千顆星。
項目地址:https://github.com/rspeer/python-ftfy
5. rpyc

這是一個透明的python庫,用于對稱的遠程過程調用、集群和分布式計算。它利用對象代理這一技術,利用python的動態特性,克服進程和計算機之間的物理界限,使遠程對象可以像本地一樣被操作。這個庫在GitHub上有超過1k顆星。
項目地址:https://github.com/tomerfiliba-org/rpyc
6. pyglet
pyglet 的一些特性是:
- 沒有外部依賴項或安裝要求。對于大多數應用程序和游戲需求,pyglet 除了 Python 之外不需要其他任何東西,簡化了分發和安裝。使用 PyInstaller 等冷凍機可以輕松打包您的項目。
- 利用多窗口和多顯示器桌面。pyglet允許你使用多個平臺原生窗口,并且完全了解用于全屏游戲的多顯示器設置。
- 加載幾乎任何格式的圖像、聲音、音樂和視頻。pyglet可以選擇使用 FFmpeg 播放音頻格式,如 MP3、OGG/Vorbis 和 WMA,以及視頻格式,如 MPEG2、H.264、H.265、WMV 和 Xvid。如果沒有 FFmpeg,pyglet包含對 wav、png、bmp 等標準格式的內置支持。
- pyglet 完全用純 Python 編寫,并利用ctypes模塊與系統庫進行交互。你可以修改代碼庫或做出貢獻,而無需任何第二語言編譯步驟或編譯器設置。盡管是純 Python,但pyglet具有出色的性能,這要歸功于用于繪制數千個對象的高級批處理。
- pyglet 是在 BSD 開源許可證下提供的,允許你將它用于商業和其他開源項目,幾乎沒有限制。
import pyglet
window = pyglet.window.Window()
label = pyglet.text.Label('Hello, world!',
font_size=36,
x=window.width // 2,
y=window.height // 2,
anchor_x='center',
anchor_y='center')
@window.event
def on_draw():
window.clear()
label.draw()
pyglet.app.run()
這是一個跨平臺的Python窗口和多媒體庫,用于開發游戲和其他視覺效果豐富的應用程序。它支持窗口化、用戶界面事件處理、操縱桿、OpenGL圖形、加載圖像和視頻,以及播放聲音和音樂。它可以在Windows、OS X和Linux上運行。它在GitHub上有超過1千顆星。
項目地址:https://github.com/pyglet/pyglet
7. rope
import rope.base.project
myproject = rope.base.project.Project('/path/to/myproject')
這個庫提供了強大而安全的重構。它包括輕度依賴性等特點,與PyRight或PyLance不同,它不依賴Node.js,完全由python編寫,等等。它在GitHub上有超過1千顆星。
項目地址:https://github.com/python-rope/rope
文檔地址:https://rope.readthedocs.io/en/latest/overview.html