成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

自我監(jiān)督學習:AI技術的未來發(fā)展方向

人工智能
盡管深度學習已經在人工智能領域做出重大貢獻,但這項技術本身仍存在一項致命缺陷:需要大量數(shù)據(jù)的加持。

盡管深度學習已經在人工智能領域做出重大貢獻,但這項技術本身仍存在一項致命缺陷:需要大量數(shù)據(jù)的加持。深度學習領域的先驅者乃至批評者已經就此達成共識——事實上,正是由于可用數(shù)據(jù)量有限加上處理大規(guī)模數(shù)據(jù)的計算能力不足,才導致深度學習直到最近幾年才成為AI層面的前沿技術。

因此,減少深度學習對數(shù)據(jù)的依賴性,已經成為AI研究人員最重要的探索方向之一。

[[321345]]

在AAAI大會的主題演講中,計算機科學家Yann LeCun討論了當前深度學習技術的局限性,同時提出“自我監(jiān)督學習”的發(fā)展藍圖——這是他為解決深度學習數(shù)據(jù)問題而構建的路線圖。作為深度學習領域的教父級人物之一,LeCun正是卷積神經網絡(CNN)的發(fā)明者,而該網絡也成為過去十年內推動人工智能革命的一大核心因素。

自我監(jiān)督學習,可謂當前提升人工智能系統(tǒng)數(shù)據(jù)利用效率的多種嘗試之一。目前我們還很難斷言哪種具體嘗試能夠成功掀起下一輪AI革命(也許我們最終會采取完全不同的政策),但LeCun的規(guī)劃與思路仍然值得我們認真了解。

澄清深度學習的局限性

首先,LeCun強調稱,深度學習技術面對的局限性實際上正是監(jiān)督學習技術的局限性。所謂監(jiān)督學習,屬于一類需要對訓練數(shù)據(jù)進行標記才能正常完成學習的算法。例如,如果希望創(chuàng)建圖像分類模型,則必須為系統(tǒng)提供經過適當分類標記的大量圖像,由模型在其中完成充分訓練。

LeCun在AAAI主題演講中提到,“深度學習并不是監(jiān)督學習,也不只是神經網絡。基本上,深度學習是將參數(shù)化的模塊組裝到計算圖中以構建起AI系統(tǒng)。它的優(yōu)勢在于,我們不需要對系統(tǒng)進行直接編程——我們只需要定義架構并調整參數(shù)。不過其中需要調整的參數(shù)可能多達數(shù)十億之巨。”

LeCun同時補充道,深度學習適用于多種不同學習范式,包括監(jiān)督學習、強化學習以及無監(jiān)督/自我監(jiān)督學習等。

但目前人們對于深度學習以及監(jiān)督學習的抱怨并非空穴來風。當下,大部分能夠實際應用的深度學習算法都基于監(jiān)督學習模型,這也充分暴露出現(xiàn)有AI系統(tǒng)的缺點所在。我們日常使用的圖像分類器、人臉識別系統(tǒng)、語音識別系統(tǒng)以及眾多其他AI應用都需要利用數(shù)百萬個帶有標記的示例進行充分訓練。

到目前為止,強化學習與無監(jiān)督學習只能算是在理論上存在的其他機器學習算法類型,還極少在實踐場景中得到應用。

深度學習當下到底發(fā)展到了怎樣的水平?

監(jiān)督深度學習為我們帶來多種非常實用的應用方案,特別是在計算機視覺與自然語言處理等特定領域。深度學習已經在癌癥檢測等敏感應用中扮演越來越重要的角色,而且事實證明,其確實能夠在部分人類無法解決的問題中發(fā)揮核心作用。例如,社交媒體巨頭們正紛紛利用這類技術審核并通報用戶在平臺上發(fā)布的大量內容。

LeCun表示,“如果把深度學習元素從Facebook、Instagram以及YouTube等廠商中剝離出來,他們的業(yè)務會瞬間崩潰。事實上,他們的業(yè)務完全圍繞深度學習構建而成。”

但正如前文所述,監(jiān)督學習只適用于具備充足高質量數(shù)據(jù)、且數(shù)據(jù)內容足以涵蓋所有可能情況的場景。一旦經過訓練的深度學習模型遇到不同于訓練示例的全新狀況,它們的表現(xiàn)將徹底失去控制。在某些情況下,單是從稍有區(qū)別的角度展示對象,就有可能令神經網絡將其誤判為其他物體。

深度強化學習則在游戲與模擬場景中表現(xiàn)出強大能力。過去幾年以來,強化學習已經征服了眾多以往人工智能無法攻克的游戲項目。當下,AI程序在《星際爭霸2》、《Dota》以及具有悠久歷史的圍棋領域將人類頂尖選手殺得片甲不留。

但是,這些AI程序在摸索解決問題的方法方面,與人類完全不同。基本上,強化學習代理就是一張白紙,我們只為其提供在特定環(huán)境中能夠執(zhí)行的一組基本操作。接下來,AI會不斷自行嘗試,通過反復試驗來學習如何獲取最高獎勵(例如盡可能在游戲中取勝)。

當問題空間比較簡單,而且我們擁有充足的計算能力以運行更多不斷重復的試驗性會話時,這類模型就能正常起效。在大多數(shù)情況下,強化學習代理要耗費大量時間以掌握游戲精髓,而巨大的成本也意味著這類技術只能存在于高科技企業(yè)內部或者由其資助的研究實驗室當中。

強化學習系統(tǒng)的另一大短板體現(xiàn)在遷移學習方面。如果要游玩《魔獸爭霸3》,那么即使是已經精通了《星際爭霸2》的代理,也需要從零開始接受訓練。實際上,即使對《星際爭霸2》游戲環(huán)境做出一點點微小發(fā)動,亦會嚴重影響AI的實際表現(xiàn)。相反,人類非常擅長從一款游戲中提取抽象概念,并快速將其遷移至新的游戲當中。

強化學習在解決無法準確模擬的現(xiàn)實問題時,同樣顯示出強烈的局限性。LeCun提到,“如果想要訓練一輛無人駕駛汽車,我們該怎么辦?”這類使用場景確實很難準確模擬,因此為了開發(fā)出一臺真正具備無人駕駛能力的汽車,“我們恐怕得撞毀很多很多汽車。”而且與模擬環(huán)境不同,我們無法在現(xiàn)實場景中快速進行實驗,更遑論由現(xiàn)實實驗帶來的巨大成本。

深度學習面前的三座大山

LeCun將深度學習面臨的挑戰(zhàn)分為三個具體領域。

首先,我們需要開發(fā)出能夠利用更少樣本或者更少試驗學習完成訓練的AI系統(tǒng)。LeCun指出,“我的建議是使用無監(jiān)督學習,我個人更傾向于稱其為自我監(jiān)督學習,因為其中用到的算法仍然類似于監(jiān)督學習,只是監(jiān)督學習的作用主要在于填補空白。總而言之,在學習任務之前,系統(tǒng)需要首先了解這個世界。嬰兒或者小動物都是這樣成長的。我們首先接觸這個世界、理解其運作規(guī)律,而后才考慮如何解決具體任務。只要能看懂這個世界,那么學習新任務就只需要很少的試驗與樣本量。”

嬰兒在出生后的前幾個月內,會快速建立起關于引力、尺寸與物體性狀的概念。雖然研究人員還無法確定其中有多少屬性與大腦建立起硬連接、又存在多少具體認知,但可以肯定的是,我們人類首先觀察周邊世界、而后才實際行動并與之交互。

第二項挑戰(zhàn)在于構建起具備推理能力的深度學習系統(tǒng)。眾所周知,現(xiàn)有深度學習系統(tǒng)的推理與推理能力相當捉急,因此需要大量數(shù)據(jù)才能解決那些最簡單的任務。

LeCun指出,“問題在于,我們要如何超越現(xiàn)有前饋計算與系統(tǒng)1?我們要如何讓推理與基于梯度的學習方式相兼容?我們要如何在推理中實現(xiàn)差異性?這些都是最基本的問題。”

系統(tǒng)1是指那些不需要主動思考的學習任務,例如在已知區(qū)域內導航或者進行少量計算。系統(tǒng)2則代表一種較為活躍的思維方式,需要推理能力的支持。作為AI領域的經典方案,象征性人工智能已經在推理與抽象領域帶來廣受好評的能力提升。

但LeCun并不建議人們廣泛采用這些備受科學家推崇的象征性AI或者混合人工智能系統(tǒng)。對于AI未來的發(fā)展愿景,他的思路與另一位深度學習先驅Yoshua Bengio更為接近。他在NeurIPS 2019大會上介紹了系統(tǒng)2深度學習的概念,并在AAAI 2020大會上做出進一步討論。但LeCun也坦言,在實現(xiàn)深度學習系統(tǒng)的推理能力方面,“并不存在一種完美的答案”。

第三大挑戰(zhàn)在于如何建立深度學習系統(tǒng),確保其能夠學習并規(guī)劃復雜的行動序列,進而將任務拆分為多個子任務。深度學習系統(tǒng)擅長為問題提供端到端解決方案,但卻很難將其分解為可解釋且可修改的特定步驟。目前,業(yè)界已經在AI系統(tǒng)對圖像、語音及文本的分解方面取得一定進展,由Geoffry Hinton發(fā)明的膠囊網絡成功解決了其中一部分難題。

但學習復雜的推理任務仍然遠超現(xiàn)有AI的能力上限。LeCun承認,“我們不知道要如何實現(xiàn)這種能力。”

自我監(jiān)督學習

自我監(jiān)督學習的基本思路,是開發(fā)出一種能夠填補上述空白的深度學習系統(tǒng)。

LeCun解釋道,“我們只需要向此類系統(tǒng)展示輸入、文本、視頻甚至是圖像,而后剔除出其中一部分,由經過訓練的神經網絡或者您選定的類或模型預測這些缺失的部分。預測對象可以是視頻內容的后續(xù)走向,也可以是文本中缺少的詞匯。”

目前市面上最接近自我監(jiān)督學習系統(tǒng)的當數(shù)Transformers,這是一種在自然語言處理領域大放異彩的架構方案。Transformers不需要標記數(shù)據(jù),它們可以通過維基百科等資料進行大規(guī)模非結構化文本訓練。而且事實證明,與之前的同類系統(tǒng)相比,Transformers在生成文本、組織對話以及建立回復內容方面擁有更好的表現(xiàn)。(但它們仍然無法真正理解人類語言。)

Transformers已經相當流行,并成為幾乎一切最新語言模型的基礎技術,具體包括谷歌的BERT、Facebook的RoBERTa、OpenAI的GPT2以及谷歌的Meena聊天機器人。

最近,AI研究人員還證明,Transformers能夠進行積分運算并求解微分議程——換言之,它已經展現(xiàn)出解決符號處理問題的能力。這可能暗示著Transformers的發(fā)展最終有望推動神經網絡突破模式識別與近似任務統(tǒng)計等傳統(tǒng)應用的樊籬。

截至目前,Transformers已經證明了自己在處理離散數(shù)據(jù)(例如單詞與數(shù)學符號)方面的價值。LeCun指出,“訓練這類系統(tǒng)比較簡單,因為雖然單詞遺漏可能造成一定程度的不確定性,但我們可以利用完整詞典中的巨大概率矢量來表達這種不確定性,所以問題不大。”

但Transformers還沒能將自己的威力引入視覺數(shù)據(jù)領域。LeCun解釋稱,“事實證明,在圖像與視頻中表達不確定性并做出預測,其難度要遠高于文本層面的不確定性表達與預測。這是因為圖像與視頻內容并非離散存在。我們可以根據(jù)詞典生成所有單詞的分布情況,但卻不可能表達所有潛在視頻幀的分布情況。”

對于每個視頻片段,都存在著無數(shù)種可能的后續(xù)情況。這就導致AI系統(tǒng)很難預測出特定結果,例如視頻內接下來幾幀所展示的畫面。神經網絡只能計算出可能結果的平均值,并據(jù)此輸出非常模糊的影像。

LeCun指出,“如果要將自我監(jiān)督學習應用于視頻等多種形式,首先得解決這個核心技術問題。”

LeCun個人最偏好的監(jiān)督學習方法,是所謂“基于能量的潛在變量模型”。其中的核心思路在于引入一個潛在變量Z,該變量用于計算變量X(視頻中的當前幀)與預測Y(視頻的未來幀)之間的兼容性,并選擇具有最佳兼容性得分的結果。LeCun也在演講中進一步闡述了基于能量的模型與自我監(jiān)督學習的實現(xiàn)方法。

關于深度學習的未來

LeCun在AAAI大會的演講中提到,“我認為自我監(jiān)督學習才是未來。這意味著我們的AI系統(tǒng)與深度學習系統(tǒng)將更上一層樓。也許它們能夠通過觀察了解關于現(xiàn)實世界的充足背景知識,進而形成自己的某種常識體系。”

自我監(jiān)督學習的主要優(yōu)勢之一,在于AI能夠輸出巨大的信息量。在強化學習中,AI系統(tǒng)訓練只能由標量級別來決定;模型本身會收到一個數(shù)值,用于表示對相關行為的獎勵或懲罰。在監(jiān)督學習中,AI系統(tǒng)會為每條輸入預測出對應的類別或數(shù)值。

但在自我監(jiān)督學習中,輸出則能夠擴展為完整的一幅甚至一組圖像。LeCun表示,“信息會更為豐富。而且只需要更少的樣本量,系統(tǒng)就能掌握關于真實世界的更多知識中。”

必須承認,不確定性問題的處理方式仍然有待探索;但如果解決方案真正出現(xiàn),AI技術將迎來通往光明未來的通天大道。

LeCun指出,“如果把人工智能看成一塊蛋糕,那么自我監(jiān)督學習就是糕餅部分。下一輪AI革命的核心將不在于監(jiān)督、也不在于純粹的強化。” 

責任編輯:龐桂玉 來源: 科技行者
相關推薦

2009-10-26 17:13:42

ADSL接入技術

2009-11-06 16:40:19

MSTP接入技術

2010-01-08 10:54:22

LAN多層交換技術

2019-10-14 15:14:17

存儲云存儲人工智能

2023-08-31 17:18:00

人工智能

2009-10-26 17:38:59

2009-10-12 12:37:08

布線技術

2010-02-04 11:20:29

網絡數(shù)據(jù)交換技術

2009-10-30 14:21:20

接入網技術

2011-06-21 18:05:15

SEO

2017-02-24 07:23:00

深度學習方向預測

2009-12-14 17:46:38

核心路由器技術

2009-02-16 09:31:45

Nehalem32納米

2009-12-24 16:43:47

寬帶接入網技術

2010-01-08 14:19:10

應用層交換技術

2009-12-28 16:18:08

無線接入網

2009-02-11 21:17:15

編程語言JeffreyWindows核心編程

2016-11-13 20:56:47

JS開發(fā)

2022-12-12 16:02:57

物聯(lián)網物聯(lián)網平臺大數(shù)據(jù)

2009-10-29 17:26:21

光接入網
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲高清一区二区三区 | 欧美一卡二卡在线 | 91精品国产91久久综合桃花 | 日本啊v在线| 精品国产欧美一区二区三区不卡 | 精产嫩模国品一二三区 | 国产高清一区二区 | 手机在线一区二区三区 | 欧美亚洲国产日韩 | 亚洲一区久久 | 一区二区三区亚洲视频 | 久久久久se| 精品av| 91人人澡人人爽 | 欧美精品福利 | www.四虎.com | 久久精品国产99国产精品 | 羞羞视频在线观看 | 亚洲日日夜夜 | 自拍视频网站 | 7777精品伊人久久精品影视 | 久在线精品视频 | 9999国产精品欧美久久久久久 | 国产美女h视频 | 精品一区二区三区日本 | 久久亚洲一区二区三区四区 | 午夜性视频 | 神马福利 | 亚洲精品一区在线观看 | 色噜噜狠狠色综合中国 | 999视频 | 精品欧美乱码久久久久久 | 高清欧美性猛交 | 成人a网| 在线免费观看黄a | 人人射人人 | 在线播放国产一区二区三区 | 香蕉一区二区 | 高清色| av日韩在线播放 | 日韩不卡三区 |