成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何使用Python構建一個文檔掃描器?

譯文
開發 前端
結合使用多個適當的庫,您就可以構建一個小型應用程序對文檔進行數字化處理。您的程序將以物理文檔的圖像作為輸入,對其運用幾種圖像處理技術,即可輸出輸入的掃描版。

?譯者 | 布加迪

審校 | 孫淑娟

您可能想要對文檔進行數字化處理,以節省物理空間或創建備份。無論怎樣,編寫一個程序將紙質文件的照片轉換成準格式正是Python所擅長的任務。

結合使用多個適當的庫,您就可以構建一個小型應用程序對文檔進行數字化處理。您的程序將以物理文檔的圖像作為輸入,對其運用幾種圖像處理技術,即可輸出輸入的掃描版。

1、準備好環境

首先您應該熟悉Python的基礎知識,還需要了解如何使用NumPy Python庫。

打開任何Python IDE,創建兩個Python文件。將一個命名為main.py,將另一個命名為transform.py。然后在終端上執行以下命令,安裝所需的庫。

pip install OpenCV-Python imutils scikit-image NumPy

您將使用OpenCV-Python獲取圖像輸入并進行一些圖像處理,使用Imutils來調整輸入和輸出圖像的大小,并使用scikit-image對圖像施加閾值。NumPy將幫助您處理數組。

圖片

等待安裝完成,并等待IDE更新項目骨干內容。骨干內容更新完成后,您就可以開始編程了。完整的源代碼可以在GitHub代碼庫中找到。

2、導入已安裝的庫

打開main.py文件,導入所安裝的庫。這將使您能夠在必要時調用和使用它們的函數。

import cv2
import imutils
from skimage.filters import threshold_local
from transform import perspective_transform

忽略perspective_transform方面拋出的錯誤。您完成處理transform.py文件的工作后,錯誤會消失。

3、獲取并調整輸入的大小

為想要掃描的文檔拍攝一張清晰的圖像。確保文檔的四個角及其內容都可見。將圖像復制到存儲程序文件的同一個文件夾中。

圖片

將輸入圖像路徑傳遞給OpenCV。制作原始圖像的副本,因為您在透視轉換期間需要它。將原始圖像的高度除以您想要調整到的高度。這將保持縱橫比。最后,輸出調整后的圖像。

# Passing the image path
original_img = cv2.imread('sample.jpg')
copy = original_img.copy()

# The resized height in hundreds
ratio = original_img.shape[0] / 500.0
img_resize = imutils.resize(original_img, height=500)

# Displaying output
cv2.imshow('Resized image', img_resize)

# Waiting for the user to press any key
cv2.waitKey(0)

上述代碼的輸出如下:

圖片

現在您已經將原始圖像的高度調整為500像素。

4、將調整后的圖像轉換為灰度圖像

將調整后的RGB圖像轉換為灰度圖像。大多數圖像處理庫只處理灰度圖像,因為它們更容易處理。

gray_image = cv2.cvtColor(img_resize, cv2.COLOR_BGR2GRAY)
cv2.imshow('Grayed Image', gray_image)
cv2.waitKey(0)

注意原始圖像和灰度圖像之間的區別。

圖片

IDE上顯示灰色映像的程序輸出

彩色桌變成了黑白桌。

5、運用邊緣檢測器

對灰度圖像運用高斯模糊濾鏡以去除噪聲。然后調用OpenCV canny函數來檢測圖像中存在的邊緣。

blurred_image = cv2.GaussianBlur(gray_image, (5, 5), 0)
edged_img = cv2.Canny(blurred_image, 75, 200)
cv2.imshow('Image edges', edged_img)
cv2.waitKey(0)

邊緣在輸出上是可見的。

圖片

您將處理的邊緣是文檔的邊緣。

6、尋找最大的輪廓

檢測邊緣圖像中的輪廓。按降序排序,只保留五個最大的輪廓。通過循環排序后的輪廓,近似獲取最大的四邊輪廓。

cnts, _ = cv2.findContours(edged_img, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)[:5]

for c in cnts:
peri = cv2.arcLength(c, True)
approx = cv2.approxPolyDP(c, 0.02 * peri, True)

if len(approx) == 4:
doc = approx
break

有四個邊的輪廓很可能含有文檔。

7、圈出文檔輪廓的四個角

圈出檢測到的文檔輪廓的幾個角。這將幫助您確定您的程序是否能夠檢測圖像中的文檔。

p = []

for d in doc:
tuple_point = tuple(d[0])
cv2.circle(img_resize, tuple_point, 3, (0, 0, 255), 4)
p.append(tuple_point)

cv2.imshow('Circled corner points', img_resize)
cv2.waitKey(0)

對調整后的RGB圖像圈出幾個角。

圖片

檢測到文檔之后,現在需要從圖像中提取文檔。

8、使用扭曲透視獲得所需的圖像

扭曲透視(warp perspective)是一種計算機視覺技術,用于轉換圖像以糾正失真。它將圖像轉換成不同的平面,讓您可以從不同的角度查看圖像。

warped_image = perspective_transform(copy, doc.reshape(4, 2) * ratio)
warped_image = cv2.cvtColor(warped_image, cv2.COLOR_BGR2GRAY)
cv2.imshow("Warped Image", imutils.resize(warped_image, height=650))
cv2.waitKey(0)

為了獲得扭曲后的圖像,您需要創建一個簡單的模塊來執行透視轉換。

9、轉換模塊

該模塊將對文檔角的點進行排序。它還會將文檔圖像轉換成不同的平面,并將相機角度更改為俯拍。

打開之前創建的那個transform.py文件,導入OpenCV庫和NumPy庫。

import numpy as np
import cv2

這個模塊將含有兩個函數。創建一個對文檔角點的坐標進行排序的函數。第一個坐標將是左上角的坐標,第二個將是右上角的坐標,第三個將是右下角的坐標,第四個將是左下角的坐標。

def order_points(pts):
# initializing the list of coordinates to be ordered
rect = np.zeros((4, 2), dtype = "float32")

s = pts.sum(axis = 1)

# top-left point will have the smallest sum
rect[0] = pts[np.argmin(s)]

# bottom-right point will have the largest sum
rect[2] = pts[np.argmax(s)]

'''computing the difference between the points, the
top-right point will have the smallest difference,
whereas the bottom-left will have the largest difference'''
diff = np.diff(pts, axis = 1)
rect[1] = pts[np.argmin(diff)]
rect[3] = pts[np.argmax(diff)]

# returns ordered coordinates
return rect

創建將計算新圖像的角坐標,并獲得俯拍的第二個函數。然后,它將計算透視變換矩陣,并返回扭曲的圖像。

def perspective_transform(image, pts):
# unpack the ordered coordinates individually
rect = order_points(pts)
(tl, tr, br, bl) = rect

'''compute the width of the new image, which will be the
maximum distance between bottom-right and bottom-left
x-coordinates or the top-right and top-left x-coordinates'''
widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
maxWidth = max(int(widthA), int(widthB))

'''compute the height of the new image, which will be the
maximum distance between the top-left and bottom-left y-coordinates'''
heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
maxHeight = max(int(heightA), int(heightB))

'''construct the set of destination points to obtain an overhead shot'''
dst = np.array([
[0, 0],
[maxWidth - 1, 0],
[maxWidth - 1, maxHeight - 1],
[0, maxHeight - 1]], dtype = "float32")

# compute the perspective transform matrix
transform_matrix = cv2.getPerspectiveTransform(rect, dst)

# Apply the transform matrix
warped = cv2.warpPerspective(image, transform_matrix, (maxWidth, maxHeight))

# return the warped image
return warped

現在您已創建了轉換模塊。perspective_transform導入方面的錯誤現在將消失。

圖片

注意,顯示的圖像有俯拍。

10、運用自適應閾值,保存掃描輸出

在main.py文件中,對扭曲的圖像運用高斯閾值。這將給扭曲的圖像一個掃描后的外觀。將掃描后的圖像輸出保存到含有程序文件的文件夾中。

T = threshold_local(warped_image, 11, offset=10, method="gaussian")
warped = (warped_image > T).astype("uint8") * 255
cv2.imwrite('./'+'scan'+'.png',warped)

以PNG格式保存掃描件可以保持文檔質量。

11、顯示輸出

輸出掃描后文檔的圖像:

cv2.imshow("Final Scanned image", imutils.resize(warped, height=650))
cv2.waitKey(0)
cv2.destroyAllWindows()

下圖顯示了程序的輸出,即掃描后文檔的俯拍。

圖片

12、計算機視覺在如何進步?

創建文檔掃描器涉及計算機視覺的一些核心領域,計算機視覺是一個廣泛而復雜的領域。為了在計算機視覺方面取得進步,您應該從事有趣味又有挑戰性的項目。

您還應該閱讀如何將計算機視覺與當前前技術結合使用方面的更多信息。這讓您能了解情況,并為所處理的項目提供新的想法。

原文鏈接:https://www.makeuseof.com/python-create-document-scanner/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2017-06-01 12:53:18

WPSekuWordPress漏洞掃描器

2011-01-11 10:29:46

2015-11-26 11:33:54

掃描器

2010-12-22 21:57:00

Angry IP Sc

2023-09-05 09:00:00

工具Python抄襲檢測系統

2021-04-09 08:00:00

容器開發云原生

2016-05-13 17:07:00

Docker安全

2015-11-11 14:08:07

2011-02-17 18:51:10

2010-09-13 15:55:43

制作端口掃描器

2009-03-25 11:21:02

2023-02-13 14:47:32

人工智能機器學習ChatGPT

2010-12-31 13:35:39

2013-04-25 13:31:01

漏洞掃描器Nessus 5.2

2013-08-14 10:24:38

2010-12-01 13:05:11

Nikto

2010-12-16 14:35:52

2018-05-25 08:44:22

樹莓派PythonMySQL

2023-09-21 08:00:00

ChatGPT編程工具

2022-01-05 08:58:08

Python解釋器編程語言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品伦一区二区三级视频 | 日韩欧美在线视频播放 | 亚洲高清视频一区二区 | 人人操日日干 | 福利视频一区二区 | 久久99久久98精品免观看软件 | 久久久久久国产精品 | 一区二区国产精品 | 三级av免费 | 一区二区三区四区五区在线视频 | 中文字幕日韩欧美一区二区三区 | 亚州综合一区 | 久久久久久九九九九 | 中文字幕av网站 | 91黄色免费看 | 精品一区二区三区中文字幕 | 午夜精品三区 | 日本在线中文 | 一区二区三区四区av | 欧洲视频一区 | 一本一道久久a久久精品综合蜜臀 | 国产成人免费视频网站高清观看视频 | 91精品一区二区三区久久久久久 | 最新国产精品视频 | 黄色毛片视频 | 黄色免费三级 | 国产伦一区二区三区四区 | 国产精品毛片一区二区在线看 | 亚洲精品久久嫩草网站秘色 | 久久综合一区二区三区 | 中文字幕视频网 | 亚洲三级在线 | 国产一区 日韩 | 成人毛片视频在线播放 | 成人黄在线观看 | 久久网一区二区三区 | 久久在线视频 | 午夜视频在线 | 91精品国产91 | 天天操网| 精品国产视频在线观看 |