成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

基于Python的圖像預處理完整指南

作者：小R 2024-05-15 15:27:39

在本文中，您將學到使用Python準備圖像進行分析的所有技巧和竅門。我們將涵蓋從調整大小和裁剪到減少噪聲和歸一化的所有內容。

你是否曾在機器學習或計算機視覺項目中遇到過質量較差的圖像問題？圖像是許多AI系統的生命線，但并非所有圖像都是相同的。在訓練模型或運行算法之前，通常需要對圖像進行一些預處理以獲得最佳結果。在Python中進行圖像預處理將成為您的新伙伴。

在本指南中，您將學到使用Python準備圖像進行分析的所有技巧和竅門。我們將涵蓋從調整大小和裁剪到減少噪聲和歸一化的所有內容。到時候，您的圖像將準備就緒，可以進行詳細分析。借助諸如OpenCV、Pillow和scikit-image等庫的幫助，您將很快就能增強圖像。因此，請做好準備，開始深入了解Python中圖像預處理技術的完整指南！

什么是圖像預處理，為什么它很重要？

圖像預處理是將原始圖像數據處理為可用且有意義的格式的過程。它允許您消除不必要的失真并增強計算機視覺應用程序所需的特定特性。預處理是在將圖像數據輸入機器學習模型之前準備圖像數據的關鍵第一步。

圖像預處理中使用了幾種技術：

調整大小：將圖像調整為統一大小對于機器學習算法的正常運行非常重要。我們可以使用OpenCV的resize()方法來調整圖像大小。
灰度化：將彩色圖像轉換為灰度圖像可以簡化圖像數據，并減少某些算法的計算需求。cvtColor()方法可用于將RGB轉換為灰度。
降噪：可以應用平滑、模糊和濾波技術來去除圖像中的不必要噪聲。GaussianBlur()和medianBlur()方法通常用于此目的。
歸一化：歸一化調整像素的強度值到所需范圍，通常在0到1之間。scikit-image中的Normalize()可用于此目的。
二值化：通過閾值處理將灰度圖像轉換為黑白圖像。在OpenCV中，使用threshold()方法對圖像進行二值化。
對比度增強：可以使用直方圖均衡化來調整圖像的對比度。equalizeHist()方法可以增強圖像的對比度。

通過正確組合這些技術，您可以顯著改進圖像數據并構建更好的計算機視覺應用程序。圖像預處理允許您將原始圖像精煉為適用于您要解決的問題的格式。

使用Python庫加載和轉換圖像

要開始使用Python進行圖像處理，您需要加載和轉換圖像為庫可處理的格式。這方面最流行的兩個選項是OpenCV和Pillow。

(1) 使用OpenCV加載圖像：OpenCV可以加載PNG、JPG、TIFF和BMP等格式的圖像。您可以使用以下代碼加載圖像：

import cv2
image = cv2.imread('path/to/image.jpg')

這將把圖像加載為NumPy數組。由于圖像位于BGR色彩空間，您可能希望將其轉換為RGB。

(2) 使用Pillow加載圖像：Pillow是友好的PIL（Python Image Library）分支。它支持比OpenCV更多的格式，包括PSD、ICO和WEBP。您可以使用以下代碼加載圖像：

from PIL import Image
image = Image.open('path/to/image.jpg')

圖像將處于RGB色彩空間。

(3) 在色彩空間之間轉換：您可能需要在RGB、BGR、HSV和灰度等色彩空間之間進行轉換。這可以使用OpenCV或Pillow完成。例如，要在OpenCV中將BGR轉換為灰度，可以使用：

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

或者要在Pillow中將RGB轉換為HSV，可以使用：

image = image.convert('HSV')

有了這些基礎技能，您就可以轉向更高級的技術，如調整大小、濾波、邊緣檢測等等。可能性是無限的！您將建立什么樣的圖像處理項目呢？

調整大小和裁剪圖像至標準尺寸

調整大小和裁剪圖像是圖像預處理的重要第一步。圖像大小各異，但機器學習算法通常需要標準大小。您需要將圖像調整大小和裁剪為方形尺寸，通常是224x224或256x256像素。在Python中，您可以使用OpenCV或Pillow庫進行調整大小和裁剪。使用OpenCV，可以使用resize()函數。例如：

import cv2
img = cv2.imread('original.jpg')
resized = cv2.resize(img, (224, 224))

這將將圖像調整為224x224像素。要將圖像裁剪為正方形，可以計算中心正方形裁剪大小并使用OpenCV的crop()與中心坐標。例如：

height, width, _ = img.shape
size = min(height, width)
x = (width size) // 2
y = (height size) // 2
cropped = img[y:y+size, x:x+size]

使用Pillow，您可以使用Image.open()和resize()函數。例如：

from PIL import Image
img = Image.open('original.jpg')
resized = img.resize((224, 224))

裁剪圖像時，使用img.crop()。例如：

width, height = img.size
size = min(width, height)
left = (width size) / 2
top = (height size) / 2
right = (width + size) / 2
bottom = (height + size) / 2
cropped = img.crop((left, top, right, bottom))

調整大小和裁剪圖像至標準尺寸是一個至關重要的第一步。這將使您的機器學習模型能夠有效地處理圖像，并提高結果的準確性?；〞r間仔細調整大小和裁剪圖像，您的模型將感激不盡！

對像素值進行歸一化以保持一致的亮度

在處理圖像數據時，將像素值歸一化以保持一致的亮度并提高對比度是很重要的。這使圖像更適合進行分析，并使機器學習模型能夠獨立于光照條件學習模式。

(1) 像素值重新縮放：最常見的歸一化技術是將像素值重新縮放到0到1的范圍內。這是通過將所有像素除以最大像素值（RGB圖像通常為255）來實現的。例如：

import cv2
img = cv2.imread('image.jpg')
normalized = img / 255.0

這將使所有像素在0到1之間縮放，其中0為黑色，1為白色。

(2) 直方圖均衡化：另一種有用的技術是直方圖均衡化。這將像素強度均勻分布到整個范圍以提高對比度?？梢允褂肙penCV的equalizeHist()方法應用它：

eq_img = cv2.equalizeHist(img)

這對于像素值集中在一個狹窄范圍內的低對比度圖像效果很好。對于一些算法，將像素值歸一化為零均值和單位方差是有用的。這可以通過減去均值并縮放到單位方差來實現：

mean, std = cv2.meanStdDev(img)
std_img = (img mean) / std

這將使圖像以零為中心，標準差為1。還有一些其他更復雜的歸一化技術，但這三種方法——重新縮放為0-1范圍、直方圖均衡化和標準化——涵蓋了基礎知識，將為大多數機器學習應用準備好圖像數據。確保對訓練和測試數據都應用相同的歸一化以獲得最佳結果。

應用濾鏡以減少噪聲并銳化圖像

一旦您在Python中加載了圖像，就是時候開始增強它們了。圖像濾鏡用于減少噪聲、增強細節，總體提高圖像在分析之前的質量。以下是您需要了解的一些主要濾鏡：

高斯模糊：高斯模糊濾鏡用于減少圖像中的細節和噪聲。它通過對每個像素及其周圍像素應用高斯函數來“模糊”圖像。這有助于在進行邊緣檢測或其他處理技術之前平滑邊緣和細節。
中值模糊：中值模糊濾鏡用于從圖像中去除椒鹽噪聲。它通過用其鄰近像素的中值替換每個像素來工作。這有助于平滑孤立的嘈雜像素同時保留邊緣。
拉普拉斯濾波器：拉普拉斯濾波器用于檢測圖像中的邊緣。它通過檢測強度變化較快的區域來工作。輸出將是突出顯示邊緣的圖像，可用于邊緣檢測。這有助于識別和提取圖像中的特征。
反向掩蔽：反向掩蔽是一種用于增強圖像中細節和邊緣的技術。它通過從原始圖像中減去模糊版本來實現。這會放大邊緣和細節，使圖像看起來更清晰。反向掩蔽可用于在特征提取或對象檢測之前增強細節。
雙邊濾波器：雙邊濾波器在平滑圖像的同時保留邊緣。它通過考慮像素的空間接近度和顏色相似度來實現。空間上接近且顏色相似的像素被一起平滑，而在顏色上不同的像素則不被平滑。這導致一個平滑的圖像，其邊緣保持清晰。雙邊濾波器對于在邊緣檢測之前進行噪聲降低很有用。

通過應用這些濾鏡，您將獲得高質量的增強圖像，準備進行深入分析和計算機視覺任務。嘗試一下，看看它們如何改進您的圖像處理結果！

使用分割檢測和去除背景

在許多計算機視覺任務中，檢測和去除圖像背景是一個重要的預處理步驟。分割將前景主體與背景分離，使您得到一個只包含主體的清晰圖像。在Python中使用OpenCV和scikit-image執行圖像分割的幾種常見方法有：

閾值化：閾值化將灰度圖像轉換為二進制圖像（黑白），通過選擇閾值值。比閾值值暗的像素變為黑色，比閾值值亮的像素變為白色。這對于對比度高、光照均勻的圖像效果很好。您可以使用OpenCV的threshold()方法應用閾值化。
邊緣檢測：邊緣檢測找到圖像中對象的邊緣。通過連接邊緣，您可以孤立前景主體。Canny邊緣檢測器是scikit-image的canny()方法中實現的一種流行的算法。調整low_threshold和high_threshold參數以檢測邊緣。
區域生長：區域生長從一組種子點開始，向外擴展以檢測圖像中的連續區域。您提供種子點，算法檢查相鄰像素以確定是否將其添加到區域。這將繼續，直到無法再添加更多像素。skimage.segmentation.region_growing()方法實現了這種技術。
分水嶺：分水嶺算法將圖像視為地形圖，高強度像素表示山峰，而谷底表示區域之間的邊界。它從峰頂開始洪水般地流下，當不同區域相遇時創建隔離障礙。skimage.segmentation.watershed()方法執行分水嶺分割。

通過嘗試這些技術，您可以在圖像中隔離出主體。分割是一個關鍵的第一步，使您能夠將計算機視覺模型集中在圖像的最重要部分——前景主體上。

使用數據增強擴展您的數據集

數據增強是一種通過從現有圖像生成新圖像來人為地擴展數據集大小的技術。這有助于減少過擬合并提高模型的泛化性能。圖像數據的一些常見增強技術包括：

翻轉和旋轉：簡單地翻轉（水平或垂直）或旋轉（90、180、270度）圖像可以生成新的數據點。例如，如果您有1,000張貓的圖像，對其進行水平翻轉和垂直翻轉，再旋轉90度，可以得到4,000張總圖像（1,000原始+1,000水平翻轉+1,000垂直翻轉+1,000旋轉90度）。
裁剪：將圖像裁剪到不同的大小和比例可從相同的原始圖像創建新圖像。這使您的模型能夠看到相同內容的不同構圖和組合。您可以創建不同尺寸的隨機裁剪，或者針對更具體的裁剪比例，如正方形。
顏色操作：調整亮度、對比度、色調和飽和度是創建新的增強圖像的簡單方法。例如，您可以隨機調整圖像的亮度和對比度，最多可達30%，以生成新的數據點。請注意不要過度扭曲圖像，否則可能會混淆您的模型。
圖像疊加：將透明圖像、紋理或噪聲覆蓋到現有圖像上是另一種簡單的增強技術。添加水印、標志、污垢/劃痕或高斯噪聲等內容可以創建原始數據的現實變化。從微妙的疊加開始，看看您的模型的反應如何。
結合技術：為了在數據上取得最大的增加，您可以在相同的圖像上組合多種增強技術。例如，您可以翻轉、旋轉、裁剪和調整圖像的顏色，從單個原始圖像生成許多新的數據點。但要注意不要過度增強，否則可能使圖像變得無法識別！

使用數據增強，您可以輕松地將圖像數據集的大小增加4倍、10倍或更多，而無需收集任何新圖像。這有助于抵制過擬合，并提高模型的準確性，同時保持訓練時間和成本不變。

選擇適合您應用的預處理步驟

選擇適合您圖像分析項目的預處理技術取決于您的數據和目標。一些常見的步驟包括：

調整大?。簩D像調整為一致的大小對于機器學習算法的正常運行很重要。通常希望所有圖像具有相同的高度和寬度，通常是較小的尺寸，如28x28或64x64像素。OpenCV或Pillow庫中的resize()方法可以輕松地以編程方式執行此操作。
顏色轉換：將圖像轉換為灰度或黑白可以簡化您的分析并減少噪音。OpenCV的cvtColor()方法將圖像從RGB轉換為灰度。對于黑白圖像，使用閾值化。
降噪：諸如高斯模糊、中值模糊和雙邊濾波等技術可以減少噪音并平滑圖像。OpenCV的GaussianBlur()、medianBlur()和bilateralFilter()方法應用這些濾鏡。
歸一化：將像素值歸一化到0到1或-1到1的標準范圍有助于算法更好地工作。您可以使用scikit-image中的normalize()方法對圖像進行歸一化。
對比度增強：對于低對比度圖像，直方圖均衡化可以提高對比度。OpenCV的equalizeHist()方法執行此任務。
邊緣檢測：找到圖像中的邊緣或輪廓對于許多計算機視覺任務都很有用。OpenCV的Canny()方法中的Canny邊緣檢測器是一個受歡迎的選擇。

關鍵是選擇適合您特定需求的技術。從基本步驟如調整大小開始，然后嘗試不同的方法以改進質量，并查看哪些方法優化了您的結果。通過一些實驗，您將找到理想的預處理工作流程。

圖像預處理技術FAQ

現在您已經對Python中的各種圖像預處理技術有了很好的了解，可能還有一些懸而未決的問題。以下是關于圖像預處理最常見的問題及其答案：

(1) Python支持哪些圖像格式？

Python通過OpenCV和Pillow等庫支持各種圖像格式。一些主要的格式包括：

JPEG — 常見的有損圖像格式
PNG — 無損圖像格式，適用于帶有透明度的圖像
TIFF — 無損圖像格式，適用于高顏色深度圖像
BMP — 無壓縮的光柵圖像格式

(2) 何時應該調整圖像大??？

應調整圖像大小的情況包括：

圖像太大，以至于無法有效處理。減小尺寸可以加快處理速度。
圖像需要匹配機器學習模型的輸入大小。
圖像需要在屏幕或網頁上以特定大小顯示。

(3) 有哪些常見的降噪技術？

一些流行的降噪技術包括：

高斯模糊 — 使用高斯濾波器對圖像進行模糊，減少高頻噪聲。
中值模糊 — 用鄰近像素的中值替換每個像素。對于去除椒鹽噪聲非常有效。
雙邊濾波器 — 在平滑圖像的同時保留邊緣。它可以去除噪聲同時保持清晰的邊緣。

(4) OpenCV支持哪些顏色空間，如何在它們之間進行轉換？

OpenCV支持RGB、HSV、LAB和灰度顏色空間。您可以使用cvtColor函數在這些顏色空間之間進行轉換。例如：

將RGB轉換為灰度：

gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

將RGB轉換為HSV：

hsv = cv2.cvtColor(img, cv2.COLOR_RGB2HSV)

將RGB轉換為LAB：

lab = cv2.cvtColor(img, cv2.COLOR_RGB2LAB)

將圖像轉換為不同的顏色空間對于某些計算機視覺任務（如閾值處理、邊緣檢測和目標跟蹤）非常有用。

結論

這就是您所需要的，一個在Python中準備圖像進行分析的完整指南。借助OpenCV和其他庫的強大功能，您現在擁有調整大小、增強、過濾和轉換圖像的所有工具。隨意嘗試不同的技術，調整參數，找到最適合您特定數據集和計算機視覺任務的方法。圖像預處理可能不是構建AI系統中最引人注目的部分，但它絕對是至關重要的。

責任編輯：趙寧寧來源：小白玩轉Python

Python 圖像預處理 AI

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：成年人免费网站 | 亚洲综合小视频 | 国产精品成人一区二区 | 一区二区免费看 | 亚洲精品久久久久久宅男 | 在线免费观看黄色 | 性国产丰满麻豆videosex | 日日射夜夜骑 | 午夜精品久久久久久不卡欧美一级 | 91看片视频 | 久久久久黄| 国产国拍亚洲精品av | 亚洲精品一区二区冲田杏梨 | av免费看在线 | 久在线 | 天天爽天天操 | 天堂精品视频 | 日本免费在线 | 国产a视频 | 欧美视频xxx | 国产精品一区二区三区免费观看 | 91久久精品一区二区三区 | 99re视频在线观看 | 伊人伊成久久人综合网站 | 中文字幕国产视频 | 91精品一区二区三区久久久久久 | 日韩一区二区三区视频在线观看 | 看黄在线 | 国产精品国产a级 | 久久久久亚洲精品国产 | 国产视频一区二区 | 男人天堂午夜 | 在线观看国产精品一区二区 | 中文字幕国产日韩 | 亚洲精品国产偷自在线观看 | 亚洲精品视频一区二区三区 | 国产精品不卡一区二区三区 | 中文字幕成人av | 日韩一区二区不卡 | 国产精品午夜电影 | 日韩欧美一级精品久久 |