沒看過這8本書,好意思說自己從事計算機(jī)視覺?
計算機(jī)視覺是人工智能的一個子領(lǐng)域,主要專注于數(shù)字圖像(如照片和視頻)等方面的內(nèi)容,深度學(xué)習(xí)在在挑戰(zhàn)計算機(jī)視覺任務(wù)方面取得了很大的進(jìn)展。
深入探討深度學(xué)習(xí)技術(shù)在計算機(jī)視覺中的應(yīng)用之前,你需要具備計算機(jī)視覺基礎(chǔ),諸如掌握基礎(chǔ)的理論知識,常用的技術(shù),API標(biāo)準(zhǔn)和基本數(shù)據(jù)處理
本文,我們將和大家推薦幾本備受歡迎的計算機(jī)視覺相關(guān)的較好教科書以及最適合程序員閱讀的計算機(jī)視覺書籍:
較好的計算機(jī)視覺教科書
教科書是由專家(通常是學(xué)者)編寫的書籍,旨在作為學(xué)生和實踐者的參考。它們主要關(guān)注一般方法和理論(數(shù)學(xué)),而不是實際問題的關(guān)注點和方法的應(yīng)用(代碼)。
根據(jù)它們在頂尖學(xué)校(如麻省理工等)大學(xué)課程中的使用情況,列出了排名前五的教科書:
1. 《計算機(jī)視覺》
本書的PDF版本可以在其官網(wǎng)免費獲得。
我非常喜歡這本書,它幫助計算機(jī)視覺技術(shù)的初學(xué)者(本科生)學(xué)會解決各種基礎(chǔ)的計算機(jī)視覺問題,是根據(jù)理查德多年在華盛頓大學(xué)教授這一課題的經(jīng)驗寫成的。
這本書也反映了我在企業(yè)研究實驗室從事計算機(jī)視覺研究的20年經(jīng)驗,因此,本書更多地強(qiáng)調(diào)在實際工作中的基本技術(shù),而較少關(guān)注實際適用性較差的深奧數(shù)學(xué)。
下載地址:http://szeliski.org/Book/
2. 《Computer Vision: Models, Learning, and Inference》
本書依然可以在其官網(wǎng)下載PDF版本。
這是一本很好的入門書(為學(xué)生),涵蓋了廣泛的計算機(jī)視覺技術(shù)和問題。這本書花了較多的篇幅來介紹計算機(jī)視覺,并在概率建模相關(guān)的基礎(chǔ)主題上花了大量的篇幅
本書更注重學(xué)習(xí)和推理的概率模型,它展示了如何使用訓(xùn)練數(shù)據(jù)來學(xué)習(xí)觀察到的圖像數(shù)據(jù)與我們現(xiàn)實世界之間的關(guān)系,例如3D結(jié)構(gòu)或?qū)ο箢悾緯鴱母怕收摵湍P蛿M合的基礎(chǔ)開始,直至讀者可以實現(xiàn)和修改真實示例,以構(gòu)建有用的視覺系統(tǒng)。主要針對高級本科和研究生,
下載地址:http://www.computervisionmodels.com/
3. 《計算機(jī)視覺:一種現(xiàn)代方法》
這是一本關(guān)于計算機(jī)視覺的入門教材,它的主題可能比其他許多教科書都要廣泛。盡管內(nèi)容廣泛,但它可能不如其他一些介紹性文本受歡迎,因為它直接進(jìn)入主題的敘述方式可能更具有挑戰(zhàn)性。
本書內(nèi)容涉及幾何攝像模型、光照和著色、色彩、線性濾波、局部圖像特征、紋理、立體相對、運動結(jié)構(gòu)、聚類分割、組合與模型擬合、追蹤、配準(zhǔn)、平滑表面與骨架、距離數(shù)據(jù)、圖像分類、對象檢測與識別、基于圖像的建模與渲染、人形研究、圖像搜索與檢索、優(yōu)化技術(shù)等內(nèi)容。
4. 《Introductory Techniques for 3-D Computer Vision》
這是一本較老的書,主要關(guān)注計算機(jī)視覺,也有一些關(guān)注與3D視覺相關(guān)的技術(shù),是對現(xiàn)代計算機(jī)視覺問題和解決方案的實用介紹。這是一個很好的起點,適合本科生而不是研究生水平的讀者。
5. 《Multiple View Geometry in Computer Vision》
本書的部分章節(jié)可以從官網(wǎng)上下載PDF版本。
這本書在計算機(jī)視覺方面是相當(dāng)先進(jìn)的,適合研究生水平的人閱讀,特別是從多幅圖像中推斷幾何的問題和方法。
本書分為六個部分,并有七個簡短的附錄。有人說搞計算機(jī)視覺的沒讀過都不好意思說自己搞計算機(jī)視覺的
下載地址:http://www.robots.ox.ac.uk/~vgg/hzbook/
適合程序員的計算機(jī)視覺書籍
程序員書籍是由專家(通常是開發(fā)人員和工程師)編寫的(例如O 'Reilly書籍),它們主要關(guān)注技術(shù)和解決問題的實際問題,并關(guān)注示例代碼和標(biāo)準(zhǔn)庫。技術(shù)可以用相關(guān)的理論(數(shù)學(xué))簡單地描述,但不是用作主要參考。
6. 《學(xué)習(xí)OpenCV(中文版)》
這本書的重點是教你如何使用OpenCV庫,它可能第一個開源的計算機(jī)視覺庫。所有代碼示例都是用c++編寫的,更重要的是,作者是OpenCV的董事會成員和創(chuàng)始人。
它是一本技術(shù)書籍,但像是一本精心編寫的API文檔,本書提供了c++開源計算機(jī)視覺庫OpenCV 3的使用指南。并給出了計算機(jī)視覺領(lǐng)域的基礎(chǔ)背景知識,幫助讀者更有效地使用OpenCV。
7. 《Python計算機(jī)視覺編程》
這是一本實踐性書籍,主要教你如何用Python執(zhí)行基本的計算機(jī)視覺任務(wù),主要是用PIL,不過也有關(guān)于OpenCV的基本介紹。
書中過大量示例細(xì)致分析了對象識別、基于內(nèi)容的圖像搜索、光學(xué)字符識別、光流法、跟蹤、三維重建、立體成像、增強(qiáng)現(xiàn)實、姿態(tài)估計、全景創(chuàng)建、圖像分割、降噪、圖像分組等技術(shù)。
下載地址:http://programmingcomputervision.com/
8. 《Practical Computer Vision With SimpleCV》
本書教你如何使用Python中的SimpleCV庫執(zhí)行基本的計算機(jī)視覺操作。SimpleCV是一個用Python編寫的開源框架,是PIL (Pillow)/OpenCV很好的替代方案。
本書通過實際例子,教你如何使用SimpleCV快速輕松地構(gòu)建自己的計算機(jī)視覺(CV)應(yīng)用程序,同時向你介紹了收集、處理和分析流媒體數(shù)字圖像的基本CV技術(shù)。