圖片識別無須借助外包API,使用這兩個強大的Python庫也能實現
Python 中有多種 OCR 庫可供使用,包括 Tesseract、EasyOCR、pytesseract 等。下面是一個使用 pytesseract 庫進行 OCR 識別的 Python 代碼示例:
python
import pytesseract
from PIL import Image
# 加載圖像
image = Image.open('example.png')
# 進行 OCR 識別
text = pytesseract.image_to_string(image, lang='eng')
# 輸出識別結果
print(text)
在這個示例中,我們首先使用 PIL 庫加載了一個名為 "example.png" 的圖像。然后,我們調用 image_to_string() 方法對圖像進行 OCR 識別,并將識別結果存儲在 text 變量中。最后,我們打印了識別結果。
請確保在運行代碼之前,已經安裝了 pytesseract 庫,并將 example.png 圖像文件放在正確的路徑下。此外,還可以根據需要修改語言參數、輸出格式等。
EasyOCR 是一個開源的光學字符識別(OCR)工具,可以用于識別圖像中的文字內容。它基于深度學習技術,能夠在多種語言之間進行準確的文字識別。
以下是一個使用 EasyOCR 的簡單示例:
python
import easyocr
# 創建 EasyOCR 實例
reader = easyocr.Reader(['ch_sim', 'en'])
# 讀取圖像并進行文字識別
result = reader.readtext('example.jpg')
# 打印識別結果
for item in result:
print(item[1])
在這個示例中,首先需要安裝 EasyOCR 庫。然后,我們創建了一個 EasyOCR 的實例,并指定了需要支持的語言(中文簡體和英文)。接下來,我們讀取一個名為 'example.jpg' 的圖像,并使用 readtext() 方法進行文字識別。最后,我們遍歷識別結果,并打印出每個識別到的文字。
EasyOCR 的優勢是它能夠處理多種語言的文字識別,并且準確度相對較高。它還提供了一些參數和選項,可以根據需要進行配置和優化。