成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

卷積神經網絡如何進行圖像識別

人工智能 深度學習
在機器視覺的概念中,圖像識別是指軟件具有分辨圖片中的人物、位置、物體、動作以及筆跡的能力。計算機可以應用機器視覺技巧,結合人工智能以及攝像機來進行圖像識別。

[[202854]]

什么是圖像識別?為什么要進行圖像識別?

在機器視覺的概念中,圖像識別是指軟件具有分辨圖片中的人物、位置、物體、動作以及筆跡的能力。計算機可以應用機器視覺技巧,結合人工智能以及攝像機來進行圖像識別。

對于人類和動物的大腦來說,識別物體是很簡單的,但是同樣的任務對計算機來說卻是很難完成的。當我們看到一個東西像樹、或者汽車、或者我們的朋友,我們在分辨他是什么之前,通常不需要下意識的去研究他。然而,對于計算機來說,辨別任何事物(可能是鐘表、椅子、人或者動物)都是非常難的問題,并且找到問題解決方法的代價很高。

 

圖像識別算法一般采用機器學習方法,模擬人腦進行識別的方式。根據這種方法,我們可以教會計算機分辨圖像中的視覺元素。計算機依靠大型數據庫,通過對數據呈現的模式進行識別,可以對圖像進行理解,然后形成相關的標簽和類別。

圖像識別技術的普及應用

圖像識別技術有許多應用。其中最常見的就是圖像識別技術助力的人物照片分類。誰不想更好地根據視覺主題來管理巨大的照片庫呢?小到特定的物品,大到廣泛的風景。

圖片識別技術賦予了照片分類應用的用戶體驗新感受。除了提供照片存儲,應用程序也可以更進一步,為人們提供更好的發現和搜索功能。有了通過機器學習進行自動圖像管理的功能,它們就可以做到這一點。在應用程序中整合的圖像識別程序界面可以根據機器所鑒定的特征對圖像進行分類,并且根據主題將照片分組。

圖像識別的其他應用包括存儲照片和視頻網站、互動營銷以及創意活動,社交網絡的人臉和圖像識別,以及具有大型視覺圖像庫網站的圖像分類。

圖像識別是一項艱巨的任務

圖像識別不是一項容易的任務,一個好的方法是將元數據應用到非結構數據上。聘請專家對音樂和電影庫進行人工標注或許是一個令人生畏的艱巨任務,然而有的挑戰幾乎是不可能完成的,諸如教會無人駕駛汽車的導航系統將過馬路的行人與各種各樣的機動車分辨出來,或者將用戶每天傳到社交媒體上的數以百萬計的視頻或照片進行標注以及分類。

解決這個問題的一個方法是使用神經網絡。理論上,我們可以使用傳統神經網絡對圖像進行分析,但是實際上從計算角度來看代價很高。舉個例子,一個傳統的神經網絡在處理一張很小的圖片時(假設30*30像素)仍然需要50萬個參數以及900個輸入神經元。一個相當強大的機器可以運行這個網絡,但是一旦圖片變大了(例如500*500像素),參數以及輸入的數目就會達到非常高的數量級。

神經網絡應用于圖像識別的另一個會出現的問題是:過擬合。簡單地說,過擬合一般發生在模型過于貼合訓練數據的情況下。一般而言,這會導致參數增加(進一步增加了計算成本)以及模型對于新數據的結果在總體表現中有所下降。

卷積神經網絡

 

卷積神經網絡結構模型

根據神經網絡的構建方式,一個相對簡單的改變就可以讓較大的圖像變得更好處理。改變的結果就是我們所見到的卷積神經網絡(CNNs,ConvNets)。

神經網絡的廣適性是他們的優點之一,但是在處理圖像時,這個優點就變成了負擔。卷積神經網絡對此專門進行了折衷:如果一個網絡專為處理圖像而設計,有些廣適性需要為更可行的解決方案做出讓步。

對于任意圖像,像素之間的距離與其相似性有很強的關系,而卷積神經網絡的設計正是利用了這一特點。這意味著,對于給定圖像,兩個距離較近的像素相比于距離較遠的像素更為相似。然而,在普通的神經網絡中,每個像素都和一個神經元相連。在這種情況下,附加的計算負荷使得網絡不夠精確。

卷積神經網絡通過消除大量類似的不重要的連接解決了這個問題。技術上來講,卷積神經網絡通過對神經元之間的連接根據相似性進行過濾,使圖像處理在計算層面可控。對于給定層,卷積神經網絡不是把每個輸入與每個神經元相連,而是專門限制了連接,這樣任意神經元只能接受來自前一層的一小部分的輸入(例如3*3或5*5)。因此,每個神經元只需要負責處理一張圖像的一個特定部分。(順便提一下,這基本就是人腦的獨立皮質神經元工作的方式。每個神經元只對完整視野的一小部分進行響應)。

卷積神經網絡的工作過程

 

上圖從左到右可以看出:

  • 網絡對輸入的真實圖像進行掃描提取特征。傳遞特征的濾波器由淺色方塊表示。
  • 激活圖由堆棧形式排列,每一個對應所用的濾波器。較大的方形是要進行下采樣的塊。
  • 激活圖通過下采樣進行壓縮。
  • 下采樣后的激活圖經過濾波器產生新的一組激活圖。
  • 第二次下采樣——對第二組激活圖進行壓縮。
  • 全連接層為每個節點的輸出指定一個標簽。

卷積神經網絡的濾波器如何對連接根據相似性進行濾波?訣竅在于新加的兩種層結構:池化層和卷積層。我們下面將步驟進行分解。用為了只完成一件事情而設計的網絡實例進行介紹,即決定一張圖片中是否含有一個老爺爺。

過程的***步是卷積層,它自己本身就包含幾個小步驟。

  • 首先,我們要將包含老爺爺的圖片分解為一系列有重疊的3*3的像素塊。
  • 在這之后,我們將每個像素塊輸入一個簡單的、單層的神經網路,保持權重不變。這一步將像素塊集轉化成一個矩陣。只要我們保持每塊像素塊都比較小(這里是3*3),處理它們所需的網絡也可以保持可控以及小型。
  • 下一步,輸出值會被排成矩陣,以數據形式表示照片中每個區域的內容,不同軸分別代表顏色、寬度、和高度通道。對于每一個圖像塊,都有一個3*3*3的表示。(如果要處理視頻,可以加入第四維度代表時間)。

接下來是池化層。池化層對這些3或4維的矩陣在空間維度上進行下采樣。處理結果是池化陣列,其中只包含重要部分圖像,并且丟棄了其他部分,這樣一來最小化了計算成本,同時也能避免過擬合問題。

經過下采樣的矩陣作為全連接層的輸入。由于經過了池化和卷積操作,輸入的尺寸被大幅減小,我們現在有了正常網絡能處理的,同時能保持數據最重要特性的東西。***一步的輸出代表系統對于圖片中有老爺爺這一判斷的確信度。

在實際應用中,卷積神經網絡的工作過程很復雜,包括大量的隱藏、池化和卷積層。除此之外,真實的卷積神經網絡一般會涉及上百甚至上千個標簽,而不只是樣例中的一個。

如何搭建卷積神經網絡

從頭開始構建一個卷積神經網絡是很費時費力的工作。目前已經有了許多API能夠實現關于卷積神經網絡的想法,而不需要工程師去了解機器學習的原理或者計算機視覺的專業知識。

Google云視覺

Google云視覺是使用REST API搭建的視覺識別API。它基于開源的TensorFlow框架。它可以檢測到獨立的人臉或物體,并且包含十分全面的標簽集。

IBM Watson 視覺識別

IBM Watson 視覺識別是Waston Developer Cloud服務的一部分,并且自帶大量內置類別,但它實際是為訓練基于你提供圖片的自定義類別而打造的。同時,和Google云視覺一樣,它也提供了大量花哨的特性,包括NSFW以及OCR檢測。

Clarif.ai

Clarif.ai也是一個使用REST API的初創圖像識別服務。關于Clarif.ai有趣的一點是,它自帶的一系列模塊可以用于修改算法,將其應用到特定的主題上,例如食物、旅游和結婚。

盡管上述的API適合一些一般的應用,但***還是針對特定問題開發一個自定義的解決方案。幸運的是,大量可用的庫解決了優化和計算方面的問題,開發人員和數據科學家可以只關注訓練模型,這樣一來他們的工作便輕松了一些。這些庫包括Theano、 Torch、 DeepLearning4J以及TensorFlow,已成功地運用在各種各樣的應用程序中。

卷積神經網絡的有趣小應用:自動為無聲電影添加聲音

要為無聲電影添加匹配的聲音,系統必須在這個任務中自動合成聲音。該系統使用上千個視頻樣例進行訓練,視頻帶有鼓棍敲打不同表面產生的不同聲音。一個深度學習模型將視頻的幀和預錄的聲音建立聯系,然后選擇能夠***匹配場景的音頻進行播放。系統會通過圖靈測試進行評估,讓人來決定那個視頻是合成的,哪個是真實的聲音。這是卷積神經網絡和LSTM循環神經網絡的一個很潮的應用。 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2022-10-11 23:35:28

神經網絡VGGNetAlexNet

2022-10-19 07:42:41

圖像識別神經網絡

2018-08-28 16:45:38

圖像識別神經網絡人工智能

2018-02-05 08:58:36

Python神經網絡識別圖像

2022-06-16 10:29:33

神經網絡圖像分類算法

2017-04-26 09:30:53

卷積神經網絡實戰

2021-04-09 20:49:44

PythonOCR圖像

2022-04-07 09:01:52

神經網絡人工智能

2017-05-04 18:30:34

大數據卷積神經網絡

2021-07-22 08:16:02

人工智能AI

2019-06-06 09:00:02

卷積神經網絡CNNAI

2022-10-20 09:33:35

2019-01-05 08:40:17

VGG神經網絡

2018-04-08 11:20:43

深度學習

2018-04-24 10:45:00

Python人工智能圖像識別

2020-03-25 09:48:10

AI芯片神經網絡

2018-04-09 10:20:32

深度學習

2023-11-24 09:26:29

Java圖像

2022-02-17 10:34:21

神經網絡識別驗證碼

2018-01-29 00:16:16

神經網絡遞歸卷積深度學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩一区二区三区四区五区 | 免费观看黄色一级片 | 日韩不卡在线观看 | 神马福利 | 免费九九视频 | 激情久久av一区av二区av三区 | 国产真实精品久久二三区 | 国产视频久久 | 91原创视频在线观看 | 免费a在线| 7777久久 | 午夜视频在线观看一区二区 | 午夜免费福利片 | 国产在线视频一区 | 国产男女猛烈无遮掩视频免费网站 | 国产一区二区电影网 | 99久久精品免费看国产免费软件 | jizz视频| 在线观看av网站 | 91视视频在线观看入口直接观看 | 视频一区二区三区中文字幕 | 91精品国产综合久久久久久丝袜 | 亚洲欧美日韩中文字幕一区二区三区 | 日韩欧美在线免费观看视频 | 欧美一级片中文字幕 | 国产综合精品 | 99re在线视频| 在线播放91| 成人网在线观看 | 国产欧美一区二区三区日本久久久 | 国产精品一区二区精品 | 欧美日韩国产精品一区 | 欧美成人在线网站 | 亚洲精品av在线 | 国产欧美精品 | 黄色一级在线播放 | 久久久国产一区二区三区四区小说 | 成人福利电影 | 在线免费黄色 | 91久久| 国产ts人妖一区二区三区 |