成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何用進化方法優(yōu)化大規(guī)模圖像分類神經(jīng)網(wǎng)絡?

開發(fā) 開發(fā)工具
神經(jīng)網(wǎng)絡已被證明可以有效地解決難題,但它們的架構(gòu)設計起來頗具挑戰(zhàn)性,即便只是圖像分類問題也如此。進化算法(evolutionary algorithms)提供了一種能夠自動發(fā)現(xiàn)這類網(wǎng)絡的技術(shù)。

讓機器具備生物一樣的進化能力一直是計算機科學的一個熱門研究領域,今年三月份,谷歌的多位研究者提出了一種圖像分類器的大規(guī)模進化方法,機器之心也曾報道過這項研究,參閱:《深度 | 谷歌和 OpenAI 新研究:如何使用達爾文進化論輔助設計人工智能算法?》。研究發(fā)布之后,機器之心的技術(shù)分析師又對這項重要研究進行了更加深度細致的解讀。

論文:圖像分類器的大規(guī)模進化(Large-Scale Evolution of Image Classifiers)

(地址:https://arxiv.org/pdf/1703.01041.pdf)

摘要:神經(jīng)網(wǎng)絡已被證明可以有效地解決難題,但它們的架構(gòu)設計起來頗具挑戰(zhàn)性,即便只是圖像分類問題也如此。進化算法(evolutionary algorithms)提供了一種能夠自動發(fā)現(xiàn)這類網(wǎng)絡的技術(shù)。盡管其計算需求顯著,但是設計出能與大型人工設計的架構(gòu)相媲美的進化模型如今已非天方夜譚。我們以***的規(guī)模采用了簡單的進化技術(shù),并從平凡的初始條件出發(fā),來發(fā)現(xiàn)可用于 CIFAR-10 和 CIFAR-100 數(shù)據(jù)集的模型。為此,我們使用直觀的新型變異算子(mutation operators)來導航大型搜索空間。我們認為,演化一旦開始,其輸出就應當是一個經(jīng)過完整訓練的模型,不需任何人進行參與。這項研究尤其重要的是結(jié)果的可重復性、可變性以及計算要求。

解讀

不論是在學術(shù)研究還是產(chǎn)業(yè)應用方面,神經(jīng)網(wǎng)絡都展現(xiàn)了強大的能力。為了解決不同的實際問題,多種網(wǎng)絡架構(gòu)可根據(jù)特定的任務而建立。然而如今所創(chuàng)建的有效架構(gòu)均為人工設計的成果,因此本文為解決神經(jīng)網(wǎng)絡圖像分類方面的架構(gòu)優(yōu)化問題提出了新的方法。在進化算法中,所提出的方法通過操控直觀突變,來自動適應***的網(wǎng)絡架構(gòu)。此外,整個優(yōu)化過程并不需要人為干預來獲得經(jīng)過完整訓練的模型。為了深入了解,我們將會介紹神經(jīng)網(wǎng)絡中應用演化算法的細節(jié),并將其與之前發(fā)表的論文進行比較。***將會對本研究的整體質(zhì)量進行簡要評估。

在圖像分類領域,只要擁有足夠的訓練數(shù)據(jù),神經(jīng)網(wǎng)絡對于多個困難任務而言便是十分成功的分類器,但只有經(jīng)過研究人員與工程師多年的研究和分析,才能實現(xiàn)表現(xiàn)出色的網(wǎng)絡模型。因而以自動方式設計神經(jīng)網(wǎng)絡架構(gòu)成為熱議。若要實現(xiàn)架構(gòu)的自動設計,一種直觀的方法便是「搜索」。因此我們應用了進化算法的思想:受到生物演化機制的啟發(fā),算法將候選解決方案作為大群體中的個體,而后定義適應度函數(shù),以度量每個候選解決方案的質(zhì)量。我們還應用了迭代選擇過程,其中相對***的個體將作為「父代」進行繁殖,通過變異和重組在群體中產(chǎn)生新的后代。通過重復上述操作,子代會繼承父代的優(yōu)勢,而突變則進一步提供了群體多樣性。依次,我們終將搜索出***解決方案。

為了協(xié)助優(yōu)化神經(jīng)網(wǎng)絡,神經(jīng)演化最初僅用于進化神經(jīng)網(wǎng)絡的連接權(quán)重。以 NEAT(增強拓撲的神經(jīng)演化)算法(Stanley 和 Miikkulainen)為例,它需要改變權(quán)重、增加現(xiàn)有節(jié)點之間的權(quán)重連接以及分割現(xiàn)有連接時插入節(jié)點這三種變異,在超參數(shù)搜索中也應用了其他類似的方法。但與如今廣泛使用的神經(jīng)網(wǎng)絡(如 AlexNet 與 VGGnet)相比,上述方法僅適用于相當小規(guī)模的網(wǎng)絡。這些傳統(tǒng)方法側(cè)重于演化過程的效率而非規(guī)模,故而不適于***進的網(wǎng)絡優(yōu)化。另一方面,非演化性神經(jīng)發(fā)現(xiàn)方法則更適合如今的「深度」網(wǎng)絡。因此我們使用了其他替代方法(如貝葉斯優(yōu)化和強化學習)來優(yōu)化深度模型,盡管它們的缺陷很明顯——網(wǎng)絡層數(shù)仍需由研究人員證明,而非算法本身。故而所提出的研究強調(diào)了在沒有人為干涉的條件下,其在研究網(wǎng)絡架構(gòu)的大規(guī)模搜索與基本初始條件方面的新穎性。實驗比較如下:

與人工設計的架構(gòu)相對比

表 1. 與人工設計的架構(gòu)相對比。

表 1中「C10+」和「C100+」這兩列分別表示經(jīng)過數(shù)據(jù)增強的 CIFAR-10 和 CIFAR-100 數(shù)據(jù)集的測試精度。「Reachable?」這一列則表示給定的人工設計的模型是否位于搜索空間內(nèi)。「-」表示 Huang 等人的論文(2016b)未報告該值(并非原作者)。這張表大部分基于 Huang 等人的論文(2016a)。

與自動發(fā)現(xiàn)的架構(gòu)相對比

表 2. 與自動發(fā)現(xiàn)的架構(gòu)相對比。

表 2中「C10+」和「C100+」分別包含經(jīng)過數(shù)據(jù)增強的 CIFAR-10 和 CIFAR-100 數(shù)據(jù)集的測試精度。「-」表示該信息未報告或不為我們所知。請參考表 1 包括先進技術(shù)的人工設計結(jié)果。「離散參數(shù)」表明只能從少量值中挑選出參數(shù)(如從 {1,2,4} 中進行選擇)。

由表 1 和表 2 可得,根據(jù)所提出的演化方法,C10+以及 C100+的分類性能超過了人工方法和其他自動發(fā)現(xiàn)的架構(gòu),并不需經(jīng)過后處理階段。

下文將對大規(guī)模演化方法做出詳細闡述。

根據(jù)演化算法的工作原理,該方法將經(jīng)過訓練的架構(gòu)視為個體。因此,我們能夠創(chuàng)建具有多個模型的群體,并將適應度值視為驗證集的精確度。本文建議使用圖形作為數(shù)據(jù)結(jié)構(gòu)來編碼個體的基本架構(gòu)。在這個設計圖中,頂點表示 3 級張量,這在卷積神經(jīng)網(wǎng)絡中十分常見:使兩個維度作為圖像的空間坐標,而第三個張量表示 RGB 顏色通道;圖形的邊緣則表示連接、卷積或可變參數(shù)。隨后我們通過刪除低適應度值模型來應用進化規(guī)則,并選擇***的父代來產(chǎn)生新的個體。在繁殖過程中,為了增加個體多樣性,我們也會使所選父代的復制版產(chǎn)生突變,接著會在大型搜索空間中重復進行隨機個體的成對比賽,以尋得最終的***子代。對于具體的規(guī)模實現(xiàn),我們已經(jīng)開發(fā)了大規(guī)模并行的無鎖基礎設施。不同的計算機將進行異步操作,并在表示個體的文件目錄之下,依靠共享文件系統(tǒng)進行通信,移除和垃圾回收也將被用于處理計算效率問題。此外,繁殖過程對整個群體進行了演變。變異操作也會從預定集中隨機選擇。變異操作包括:

變異操作包括

  • 更改學習率(下文會列出抽樣細節(jié))。
  • 身份(實際是指「保持訓練」)。
  • 重設權(quán)重(如 He et al.(2015)的樣本)。
  • 插入卷積(在「卷積主干」中的隨機位置插入卷積,如圖 1 所示。插入的卷積具有 3×3 的濾波器,隨機步長為 1 或 2,信道數(shù)量與輸入相同。可以應用批量歸一化及 ReLU 激活,也可不進行隨機使用)。
  • 消除卷積
  • 改變步長(僅允許冪為 2 的步長)
  • 改變?nèi)我痪矸e的信道數(shù)。
  • 過濾器尺寸(水平或垂直方向隨機,并隨機選擇卷積,但僅為奇數(shù)值)
  • 插入一對一(插入一對一或身份連接,類似于插入卷積突變)
  • 添加跳過(隨機層之間的身份)
  • 刪除跳過(刪除隨機跳過)

在突變過程中,所有參數(shù)都會產(chǎn)生一個密集的搜索空間,這意味著任何參數(shù)都不存在上限。因此所有的模型深度都能夠?qū)崿F(xiàn)。參數(shù)的這種***性引起了對可能存在的真正大型架構(gòu)集的探索。換言之,神經(jīng)網(wǎng)絡的參數(shù)與架構(gòu)都能夠在沒有人為干預的條件下演化。

經(jīng)過對理論背景的闡釋,我們逐步介紹了將要做的實驗的初始設置與驗證策略。眾所周知,在初始化方面,即便是一個經(jīng)過訓練的卷積神經(jīng)網(wǎng)絡也屬于強分類器,它還可能在實驗中達到相對較高的精確度,因此本文會從簡單個體所組成的群體出發(fā)。這些個體不包含卷積以及在分類方面性能不佳的網(wǎng)絡,同時其學習率會被初始化為很大的值:0.1。這種設置會強制個體進行學習,使強分類器進行演變,并能通過變異進行自我發(fā)現(xiàn);同時實驗可以避免「操控」,進而大獲成功。

加速演化的另一種策略便是權(quán)重繼承。此處的繼承是指,只要有可能,個體便可繼承父代的部分或全部權(quán)重。在報告方法中,每次指的都是「***模式」。除了在一個實驗中選擇***模型,具有***驗證精確度的模型還試圖在所有實驗中選擇「***實驗」。

除了訓練和測試策略,計算成本是實驗的另一個重要方面。它由 TensorFlow 實現(xiàn),其中基因變異和卷積可被視為 TF(TensorFlow)操作。對于每一個 TF 操作,我們都會預測所需浮點運算(FLOP)的理論數(shù),并在給定每個個體后分配計算成本:

其中 F 表示用于訓練和驗證的 FLOP,E 表示正在運行的時期,N 表示訓練和驗證的樣本數(shù)量。此外,每個實驗的計算成本是其全部個體成本之和。

下一步是去實現(xiàn)上文提到的算法。每個實驗需要在幾天內(nèi)演變出一個群體,如下圖所示:

圖 1. 演化實驗進展。

圖 1中每個點代表群體中的個體。藍點(黑色,右上)表示存活個體,其余個體已被殺死。四個圖表展示了發(fā)現(xiàn)的例子。這些對應于***的個體(最右)以及它們的三個祖先。***個體通過其驗證精確度進行選擇。演化有時會在不存在任何非線性的區(qū)域(「C」,白色背景)之間堆疊卷積,這在數(shù)學上與單個線性運算相同。一些卷積則與典型的人工設計架構(gòu)不同,其后伴隨著多個非線性函數(shù)(「C + BN + R + BN + R + ...」,橙色背景)。

在訓練階段之后,所提出的方法在 CIFAR-10 數(shù)據(jù)集上使用了 9×10^19 FLOPS,使精確度達到了 94%,隨后我們應用了相同的神經(jīng)網(wǎng)絡進化算法,其參數(shù)是 CIFAR-100 中使用 7×10^19 FLOPS,使精確度達到 76.3% 時的參數(shù)。我們所料不錯,這兩個數(shù)據(jù)集的結(jié)果與其他***進的人工設計結(jié)果相比頗具競爭力。

我們還對多個實驗中的結(jié)果進行了統(tǒng)計分析,其演化進展如下圖所示:

圖 2. 結(jié)果和控件的可重復性。

圖 2中,時間 t 處的垂直軸被定義為在 t 時刻或之前存活的具有***驗證精確度個體的測試精確度。插圖了放大主圖的一部分。這條曲線所顯示的各實驗的進展情況如下。頂線(藍色實線)顯示了 5 次大規(guī)模演化實驗的平均測試精確度,其周圍陰影區(qū)域的寬度為±2s(插圖更為清晰)。下一行(主圖和插圖中的橙色虛線)則表示禁用權(quán)重繼承時的單一實驗,因此每個個體都需從隨機權(quán)重中進行訓練。***位的曲線(點劃線)是隨機搜索控件。所有實驗使用的硬件數(shù)量與類型都相同,而從驗證到測試集的泛化中出現(xiàn)的少量噪聲則解釋了曲線并非單調(diào)增加的原因。±2s 區(qū)域的窄寬度(主圖和插圖)則表明演化實驗中得到高精確度具備可重復性。

在分析時,它總結(jié)出了一個用于清查的大型搜索空間,來得到更好的***解決方案。同時,突變率的適當增加有助于避免局部最小值。另一方面,當表示訓練步驟號的元參數(shù) T 增大時,精確度便會增加。此外,更大的訓練步驟意味著,個體需經(jīng)過更少的身份突變來達到給定的訓練水平。

對元參數(shù)的依賴

圖 3. 對元參數(shù)的依賴。

在這兩幅圖中,每個圓圈表示完整演化實驗的結(jié)果。兩個垂直軸則表示實驗結(jié)束時具有***驗證精確度個體的測試精確度。所有群體的演化時間相同。每個水平軸的值存在 5 個數(shù)據(jù)點。左側(cè)為群體規(guī)模的影響。為了節(jié)省資源,這些實驗的個體訓練步驟數(shù)只有 2560 步。能夠發(fā)現(xiàn),精確度隨著群體規(guī)模的增大而增加。右側(cè)為個體訓練步驟數(shù)量的影響。可以觀察到隨著步驟的增多,精確度將如何增加。

同時,其他的參數(shù)設置技巧也被應用于進一步探索,其性能如下:

圖 4. 避免局部***。

這幾幅圖顯示了兩次演化實驗的進展,而下述事件發(fā)生在演化中期。這些事件使群體能夠避免被困在局部***中。在這兩幅圖中,每個點代表一個個體。這些實驗使用小規(guī)模群體與較少的訓練步驟,這 2560 個個體是主實驗。這兩種情況都使群體更容易受困,消耗的計算資源也更少。垂直軸是進化算法中舉足輕重的驗證精確度(或適應度)。上部:個體數(shù)為 100 的群體通過利用突變率上升的時期,成功避免局部***的示例(第 5 節(jié))。群體向高原期演變,每次繁殖的正常情況是突變?yōu)? 1(左),隨后使突變率上升,使每次繁殖的突變?yōu)?5(中間),接著,再次將每次繁殖的突變改為 1(右)。可以發(fā)現(xiàn),群體最終避免了最初的高原期。底部:個體數(shù)為 50 的群體通過重設權(quán)重,成功避免局部***的示例(第 5 節(jié))。權(quán)重分別在三個中間刻度的標記處進行了 3 次重設,每次重設后,群體都會達到精確度更高的新高原期。

綜上,本文提出了一種用于大規(guī)模搜索的新型神經(jīng)演化算法,其新穎性在于它能夠處理相當大的神經(jīng)網(wǎng)絡(如 CNN 等)。由于該方法使用了新的變異策略,故而在分類任務中***競爭力;同時,經(jīng)過訓練的模型獲得了良好的轉(zhuǎn)移能力(從 CIFAR-10 轉(zhuǎn)移到 CIFAR-100)。但考慮到在特定任務中,通用應用不具備多個并行的高性能計算機,因而存在計算成本昂貴的缺點。此外還需考慮到,如今只用一個功能強大的 CNN 分類器便可輕松完成分類任務。詳盡的搜索似乎并不必要,因為它花費雖多,卻只能提升一點點精確度。但若這個方法能夠擴展到適應多個任務(如具有改良空間的分割和檢測),這個嘗試便是良好開端,并且頗具潛力。

機器之心英文網(wǎng)站原文地址:https://syncedreview.com/2017/05/01/large-scale-evolution-of-image-classifiers/

【本文是51CTO專欄機構(gòu)“機器之心”的原創(chuàng)文章,微信公眾號“機器之心( id: almosthuman2014)”】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2018-02-05 08:58:36

Python神經(jīng)網(wǎng)絡識別圖像

2017-07-27 10:46:44

神經(jīng)網(wǎng)絡機器學習強化學習

2022-06-16 10:29:33

神經(jīng)網(wǎng)絡圖像分類算法

2023-07-04 07:17:47

神經(jīng)網(wǎng)絡大規(guī)模GNN

2017-04-26 08:31:10

神經(jīng)網(wǎng)絡自然語言PyTorch

2023-02-28 08:00:00

深度學習神經(jīng)網(wǎng)絡人工智能

2022-04-07 09:01:52

神經(jīng)網(wǎng)絡人工智能

2022-10-11 23:35:28

神經(jīng)網(wǎng)絡VGGNetAlexNet

2020-08-03 11:43:01

神經(jīng)網(wǎng)絡優(yōu)化機器學習

2022-04-02 15:56:43

神經(jīng)網(wǎng)絡人工智能技術(shù)

2017-09-08 13:30:32

深度學習圖像識別卷積神經(jīng)網(wǎng)絡

2017-06-19 15:12:30

Uber神經(jīng)網(wǎng)絡事件預測

2020-03-05 15:59:10

神經(jīng)網(wǎng)絡數(shù)據(jù)圖形

2022-10-19 07:42:41

圖像識別神經(jīng)網(wǎng)絡

2021-12-28 08:48:54

PyTorch神經(jīng)網(wǎng)絡人工智能

2013-03-21 09:24:28

2020-08-06 10:11:13

神經(jīng)網(wǎng)絡機器學習算法

2009-04-09 09:32:00

VoWLANWLAN

2010-09-01 15:16:49

WLAN交換機結(jié)構(gòu)

2025-04-27 04:05:00

AI模型爬蟲
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产视频一区二区 | 一级看片免费视频囗交动图 | 中文在线一区二区 | 色婷婷av777 av免费网站在线 | 一区二区三区视频在线观看 | 久久99精品久久久久久 | 日本高清视频在线播放 | 国产精品黄色 | 亚洲瑟瑟 | 亚洲伊人精品酒店 | 亚洲欧美日韩精品久久亚洲区 | 激情毛片| 日韩一区二区三区视频 | 成人av在线播放 | 免费三级黄 | 久久69精品久久久久久久电影好 | 黄色一级毛片 | 欧美综合一区二区 | 久久97精品| 成人免费视频网站在线看 | 一区二区三区四区不卡 | 日韩欧美一区二区三区四区 | av天天看| 国产成人免费视频 | 香蕉视频一区二区 | 黄色一级视频 | 国产色| 国产成人综合av | 国产999精品久久久 精品三级在线观看 | 99精品欧美一区二区三区 | www.性色| 一区二区三区不卡视频 | 91成人小视频 | 成人精品一区二区三区中文字幕 | 国产视频日韩 | 久久午夜剧场 | 超碰在线免费av | 国产综合av| 亚洲精选久久 | 久久久久久国产精品免费免费男同 | 亚洲天堂中文字幕 |