五個提升 Python 速度的優化技巧

作者：二旺 2024-11-01 07:30:00

本文我會給你提供可行的修復方法和代碼示例，讓你的腳本變成精簡、高效的Python機器。

在這篇文章中，我將分解一些我見過的（甚至自己也犯過）最常見的影響性能的錯誤。最重要的是，我們不僅僅討論不該做什么——我會給你提供可行的修復方法和代碼示例，讓你的腳本變成精簡、高效的Python機器。

錯誤 #1：像1999那樣循環

我和其他開發者一樣，對精心制作的for循環有著強烈的喜愛。它們構成了我們工作的很大一部分基礎。然而，當討論純粹的速度時，特別是處理大型數據集時，那些可靠的循環開始顯得更像是負擔而不是助力。

示例：讓我們加一些數字

想象你需要計算一個巨大數字列表的平方和。以下是循環的方式：

numbers = [1, 2, 3, 4, 5, ... , 10000]  # A big list
total = 0
for number in numbers:
    squared = number * number
    total += squared

看起來無害，對吧？但在幕后，Python為每個元素進行了大量的單獨計算。

修復方法：NumPy來拯救！

這就是NumPy像超級英雄一樣出現的地方。它全是關于矢量化——一次性對整個數組執行操作。讓我們重寫那個示例：

import numpy as np

numbers = np.array([1, 2, 3, 4, 5, ... , 10000])  
squared = numbers * numbers  # Vectorized squaring!
total = squared.sum()

NumPy不是逐個處理元素，而是一次性處理整個計算。

額外提示：易于理解的折中方案

列表推導式：

total = sum(number * number for number in numbers)

它們通常比傳統循環更快，但在激烈的數值計算中可能無法與NumPy的強大力量相媲美。

錯誤 #2：使用錯誤的工具

想象一下，只用錘子建造房子。當然，你可以完成它，但會是混亂的。同樣，對于Python——完全依賴列表來完成所有任務，就像被綁著一只手編程一樣。

示例：我的電話號碼在哪里？

假設你有這樣一個聯系人列表：

contacts = [
    {"name": "Alice", "phone": "123-4567"},
    {"name": "Bob", "phone": "789-0123"},
    # ... more contacts
]

找到Bob的號碼意味著掃描整個列表，可能需要檢查每個聯系人。

修復方法：擁有超能力的數據處理結構

字典：你的快速查找伙伴如果你按鍵（比如“名字”）搜索，字典是你的救星。

contacts_dict = {
    "Alice": "123-4567",
    "Bob": "789-0123",
    # ... more contacts
}
bobs_number = contacts_dict["Bob"]  # Instant access!

集合：強制唯一性需要跟蹤唯一的網站訪問者嗎？集合會自動丟棄重復項。

unique_visitors = set()
unique_visitors.add("192.168.1.100")
unique_visitors.add("124.58.23.5")
unique_visitors.add("192.168.1.100")  # No duplicate added

了解你的工具箱Python給你提供了更多：有序字典、雙端隊列等。知道何時使用它們是好腳本和優秀腳本的區別。

錯誤 #3：在黑暗中優化

你熟悉那種感覺，當你確信你的代碼很慢，但對原因一無所知。這就像試圖在沒有手電筒的情況下修補滴水的天花板。令人沮喪！這就是分析器的用武之地。

示例：意外的罪魁禍首

假設你有一個復雜的函數來計算斐波那契數。你投入了靈魂來完善數學，但它仍然很慢。結果，瓶頸可能是一些狡猾的東西，比如你如何將結果記錄到文件中。

修復方法：cProfile來拯救！

Python內置的cProfile模塊是你的性能偵探。以下是如何使用它：

import cProfile

def my_function():
    # Your code to be profiled

cProfile.run('my_function()')

這會產生大量統計數據。需要關注的關鍵事項：

ncalls：函數被調用了多少次。
tottime：在函數中花費的總時間。
cumtime：像tottime一樣，但包括在其中調用的所有函數所花費的時間。

篩選線索這些數字將指出你真正的瓶頸，幫助你將優化工作集中在它們將產生最大影響的地方。

錯誤 #4：DIY陷阱

從頭開始構建一切的沖動很強。我懂！但有時，重新發明輪子就像決定步行穿越國家而不是乘坐飛機。Python有你的背，有非常優化的內置函數。

示例：讓我們排序

需要對數字列表進行排序嗎？你可以編寫你的冒泡排序實現……或者你可以使用Python的sorted()：

my_list = [5, 3, 1, 4, 2]

# The long way (probably pretty slow)
def my_bubble_sort(list): 
   # ... your sorting code here

# The Pythonic way
sorted_list = sorted(my_list)

很有可能，你自己的排序算法甚至無法接近內置的效率。

修復方法：探索寶庫

Python標準庫是開發者的最好朋友。了解這些強大的工具：

itertools：通過迭代器（想想高級循環以提高效率）增強你的工作
heapq：用于管理堆（優先隊列有人嗎？）
bisect：保持排序列表的順序，速度極快。

記住：花時間學習內置函數是后來優化節省的時間。

錯誤 #5：與硬盤聊天太多

將你的計算機內存（RAM）視為你的超快速工作區，將你的硬盤視為城市的存儲倉庫。每次你訪問或修改文件，就像派遣信使來回奔波。太多的行程，你的代碼開始感受到等待。

示例：逐行減速

假設你正在處理一個龐大的日志文件：

with open("huge_log.txt", "r") as file:
    for line in file:
        # Process each line slowly

每讀取一行意味著從你的硬盤單獨獲取。

修復方法：更聰明地工作，而不是更努力

一次讀取全部（如果合適）：對于較小的文件，有時將整個內容吸入內存是最快的：

with open("huge_log.txt", "r") as file:
    contents = file.read() 
    # Process contents in memory

緩沖來拯救：當你需要細粒度控制時，緩沖可以拯救：

with open("huge_log.txt", "r") as file:
    while True:
        chunk = file.read(4096)  # Read in chunks
        if not chunk:
            break
        # Process the chunk

以塊而不是字節思考最小化那些去“倉庫”的行程會產生巨大的差異。

責任編輯：趙寧寧來源：小白玩轉Python

Python 代碼

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看