當下,應抓緊探索超越深度學習的其他實現(xiàn)方法
譯文【51CTO.com快譯】盡管深度學習確實為我們帶來諸多令人印象深刻的成功案例,但其只是機器學習技術的一小部分,而機器學習又是人工智能的一小部分。在我們看來,未來的人工智能應當探索超越深度學習的其它實現(xiàn)方法。
深度學習技術——人工智能領域的閃耀明星
時至今日,每個人都在學習,或者自稱在學習深度學習(簡稱DL)技術——人工智能(簡稱AI)領域的閃耀明星。
目前,面向各階段學習者的付費及免費深度學習課程已經(jīng)超過十萬種。眾多初創(chuàng)企業(yè)及產(chǎn)品打著“深度XX”的旗號,但明眼人一望而知這只是其標榜自我的噱頭。事實上,很多人都忽略了深度學習僅占機器學習(簡稱ML)整體的1%比例,而機器學習又僅占人工智能的1%。余下還有99%的比例擁有更為廣闊的實踐空間。更具體地講,“純深度學習專家”并不屬于“全面的人工智能專家”。
深度學習并不是人工智能的同義詞!
谷歌、Facebook等技術巨頭在廣告宣傳當中提及最多的人工智能工具仍然主要體現(xiàn)為深度學習,因此公眾們也誤以為所有的人工智能技術成果目前乃至未來都將需要依托于深度學習來完成。但實際情況并非如此。
像XGBoost這樣的決策樹并沒有成為頭條新聞的追蹤焦點,不過其卻在眾多Kaggle表數(shù)據(jù)競賽當中悄然擊敗了深度學習方法。媒體將ALphaGo稱為純深度學習產(chǎn)物,但其實際上是蒙特卡洛樹加深度學習的結晶,而且有證據(jù)證明純深度學習并不足以支持其擊敗世界一流棋手。神經(jīng)進化的NEAT解決了眾多強化學習型任務,但其并沒有使用任何反向傳播機制。很明顯,目前關于人工智能的認知當中存在“深層誤區(qū)”。
當然,我并不是說深度學習無法解決實際任務:深度學習確實非常出色。當下,樹與其它算法往往無法帶來能夠與深度學習相匹敵的實際表現(xiàn),且無法替代深度學習解決某些特定任務。然而,我期望著未來能夠出現(xiàn)更多能夠擊敗深度學習技術的非深度學習系統(tǒng)。值得強調(diào)的是,深度學習決策還代表著一場法律層面的災難——即使結果正確,我們也無法通過解釋其決策流程來消除法律層面的質(zhì)疑。
此外,我還期待著能夠在媒體當中看到深度學習當中的“災難性遺忘”問題,即其在學習新信息時突然忘記以往已經(jīng)學習到的其它信息的狀況,以及其持續(xù)存在的過度擬合傾向。在“智能”方面,深度學習只會簡單相信其獲取到的訓練數(shù)據(jù),而無法判斷這些數(shù)據(jù)究竟是真是假、是公平還是存在偏見。人類雖然在一定程度上也會被虛假新聞所誤導,但仍保持著強大的自主判斷力——具體來講,孩子們都知道電影內(nèi)容是虛構的,而不會將其信以為真。
深度學習比HTML更古老
20年前,每個人都在學習HTML。HTML是用于手寫網(wǎng)頁的標記語言,在當時人們廣泛認為掌握了這門手藝即擁有了成為百萬巨富的潛力。
與其他人一樣,我也學習了一切看似有用的技術:HTML、移動應用、深度學習以及其它陸續(xù)出現(xiàn)的新生事物。但事實上,我們的生活不可能單純圍繞著一種技術展開!如果您學習了深度學習,仍然無法窺見人工智能漫長發(fā)展周期中的全月的。
早在1995年,HTML就開始過時,并在不久之后被CSS、JavaScript以及服務器語言所逐漸替代。同樣的,深度學習也會過時。時至今日,大多數(shù)主流移動應用根本不包含任何HTML元素,因此也許未來的人工智能應用也將徹底告別深度學習——誰知道呢。
事實上,深度學習是上世紀八十年代誕生的技術,比HTML更古老:上世紀七十年代的“神經(jīng)網(wǎng)絡加隱藏層”機制證明利用更多數(shù)據(jù)訓練將可提供更理想的結果,而其隨后被更名為深度學習并廣受關注。
1992年,我簡要檢查了一些神經(jīng)網(wǎng)絡源代碼,以及分形及元胞自動機等技術產(chǎn)物。與其他人一樣,我也把深度學習視為一種沒有實際用途的純學術性數(shù)學難題。相反,我更關注其它更具實效性的技術:3D視頻游戲,而后是互聯(lián)網(wǎng)等等。但事實證明,我們都犯下了嚴重的錯誤——深度學習完全可以配合大數(shù)據(jù)完成令人印象深刻的目標!
我在2015年深陷Deep Dream以及GAN而不能自拔。然而,深度學習絕不可能、也不應該是我們所發(fā)明的最后一項人工智能技術成果。古老的深度學習已經(jīng)得到廣泛研究,并通過數(shù)十年的更新獲得準確解決更多任務的能力,但還沒有哪個深度學習版本(包括卷積、RNN、RNN+LSTM、GAN等)能夠解釋其決策過程。
盡管深度學習肯定能夠解決更多任務,并在未來替代更多相關工作人員,但只要其無法就自身決策的公正性給出合法且有效的解釋,其仍不太可能解決所有問題或者繼續(xù)保持這種令人驚訝的發(fā)展態(tài)勢。
探索其他途徑,而不僅局限于深度學習
未來的人工智能應該能夠探索其它或新或舊,但遭到忽視的途徑——而不僅局限于深度學習。
深度學習的一大局限,在于其會簡單將真實情況視為數(shù)據(jù)當中頻繁出現(xiàn)的事實,而不會考慮在統(tǒng)計學層面更為罕見的狀況。深度學習的公平性并非來自這項技術本身,而是來自人類為深度學習所選定及準備的數(shù)據(jù)。深度學習可以閱讀文本并實現(xiàn)文本內(nèi)容間的翻譯,但無法以“人文方式”完成理解性翻譯。如果一套深度學習模型在訓練當中接觸100本論著,其中40本認為仇恨、戰(zhàn)爭、死亡與破壞不值得提倡,而60本宣揚希特勒的納粹思想值得鼓勵,那么其最終得到的將是100%的納粹傾向!
深度學習自身永遠無法意識到屠殺猶太人、同性戀者以及殘障人士屬于錯誤的作法,而只會簡單遵循訓練數(shù)據(jù)當中提供的納粹主義觀點。也正因為如此,深度學習無法解釋自己的決策——其會天真地認為“我經(jīng)常讀到納粹主義是正確的論點,所以其應該是正確的。”
深度學習會學習并模仿那些明顯存在缺陷的邏輯,而無法發(fā)現(xiàn)包括恐怖主義在內(nèi)的各類錯誤思維的內(nèi)在缺陷。然而,與深度學習不同,即使是小孩子也能夠自行發(fā)現(xiàn)電影當中表現(xiàn)的反派角色。反向傳播中的梯度下降以及自定義深度學習硬件等成果確實值得肯定,但其主要作用于統(tǒng)計與幾何層面,因此我認為2037年的人工智能方案當中將不再以此作為主要判斷依據(jù)。
對于眾多任務,人工智能的深度學習將會變得不非法且有違合規(guī)性要求。根據(jù)即將于2018年5月25日正式實施的通用數(shù)據(jù)保護條例(簡稱GDPR)的要求,對28個歐盟國家公民數(shù)據(jù)進行收集的各相關方必須遵循其中的監(jiān)管規(guī)定。屆時,深度學習在歐盟區(qū)域之內(nèi)的實際應用將受到嚴厲限制,意味著各人工智能初創(chuàng)企業(yè)必須盡快找到能夠替代深度學習的其它實現(xiàn)途徑,否則將面臨遭遇巨額罰款的威脅。條例規(guī)定罰款數(shù)額將為跨國企業(yè)全球營收的4%——包括來自美國市場的收入。
而在自動化決策方面,GDPR需要相關實現(xiàn)技術給出鍬,并防止其中包含與種族、觀點以及健康等相關的歧視性因素。而與GDPR類似的其它法律條款在全球范圍內(nèi)的出臺也只是時間問題。美國公平信用報告法案要求有關各方披露一切可能對消費者信用評分產(chǎn)生不利影響的因素,且此類因素最多只能同時存在4項。相比之下,深度學習中所囊括的因素數(shù)量往往成千上萬,那么我們該如何將其簡化為4項?展望未來,人工智能將如同比特幣一樣,在發(fā)展初期缺乏監(jiān)管,但相關法律與懲罰制度終將出現(xiàn)。
深度學習的復雜性很難像非技術人解釋清楚
深度學習系統(tǒng)需要作出遠超必要數(shù)量的決策,才能完成判斷某一圖像內(nèi)容是否為貓,或者如何在自拍圖像中添加兔耳朵這類任務——很明顯,未來將有更簡單的非深度學習機制能夠代替其處理這些工作。
與深度學習不同,人工智能方案必須以負責任的方式通過更為簡單且合法有效的語言向無技術背景的法官及用戶作出決策解釋。對于法官及用戶而言,深度學習的復雜性使其更像是一種“魔法”,這無疑是一類法律風險、而不僅是一項很酷的功能。深度學習能夠向人類發(fā)出建議或警告——例如從醫(yī)學影像當中檢測疾病,并由醫(yī)生加以驗證,但這種自動化機制仍然缺乏充足的細節(jié)。我們可以設想,相關方要如何向被人工智能拒絕的用戶(例如拒絕其貸款或者工作申請)作出解釋?
法律當中包含“解釋權”,即負責解釋申請人的工作或貸款申請為何會被拒絕。然而,深度學習給出的結果不具備自然(法律)語言的解釋內(nèi)容。雖然能夠提供深度學習變量頁,但法官或用戶仍然無法接受,因此即使是最杰出的數(shù)學家或其它算法也無法弄清其內(nèi)容并將其簡化為深度學習模型。另外,即使對于那些由人類作出決策的場景,人工智能工具也應該能夠給出詳細的可判斷原因(例如據(jù)此否決人工智能的決策),或者通過簡單地復制、粘貼以及確認由人工智能提供的解釋內(nèi)容以完成快速認證。
目前還沒人知道要如何修改深度學習算法以給出與人類相近的簡單解釋內(nèi)容,因此深度學習顯然無法通過合規(guī)性審計!這個問題也同樣影響到其它多種人工智能與機器學習算法,但這種影響程度遠不及深度學習。在增強或組合的情況下,決策樹也同樣無法進行解釋。但在未來,我相信會出現(xiàn)新型或者經(jīng)過重新發(fā)明的認證機制,且其足以捍衛(wèi)自己的決策并徹底替代傳統(tǒng)深度學習以及人類的判斷方法。
在GDPR的約束下,只有人力部門能夠處理申請拒絕工作:人工智能僅可接受申請,而對貸款或工作申請的拒絕則必須被交由人力資源部門處理,只有這樣才能為遭到拒絕的對象提供有說服力的解釋信息。
但即使是在這樣的情況下,如果人工智能選擇拒絕,人力資源部門仍然無法獲得任何幫助或者解釋信息,也無從知曉深度學習所遵循的邏輯是對還是錯。他們將被迫從頭開始重新檢查數(shù)據(jù),從而決定是否仍然加以拒絕,并為此作出合理的解釋。這樣做的風險在于,為了節(jié)約時間與金錢,人力資源部門會傾向于為人工智能提供并不屬實的拒絕解釋,或者盲目接受人工智能的批準意見。
然而,法官會要求驗證人工智能決策的公平性,包括詢問為何情況類似的其他人會被接受等等。出于安全考慮,大家需要主動獲取堅定的批準理由——無論GDPR等法律是否作出明確要求。未來的非深度學習型人工智能系統(tǒng)應能夠提供人類可讀的決策解釋以供用戶、法官以及支持人員進行參考,只有這樣其才能被最終全面引入自動化決策流程。
可解釋性在相關法律甚至是深度學習出現(xiàn)之前就已經(jīng)存在。在反壟斷案件當中,谷歌等企業(yè)被問及為何某些產(chǎn)品——而非其它產(chǎn)品——被顯示在搜索結果的頂部。這意味著早在深度學習技術出現(xiàn)之前,其它眾多算法同樣在以令人無法理解的方式混合數(shù)據(jù)以獲取結果,即沒人能夠輕松重構相關決策的產(chǎn)生原因。
工程師們向法官解釋稱他們也不確切了解整個決策過程,并提交線性代數(shù)頁作為證據(jù)。但這并不能很好地解決爭議,多起案件結果顯示這些企業(yè)遭遇到數(shù)十億美元的罰款,甚至在特定法律出臺之前,其被警告需要對現(xiàn)有機制作出徹底改變。用戶所提出的與就業(yè)、貸款以及退稅等相關的拒絕判斷成為集體訴訟中的“常客”,并導致相關零售、銀行以及保險等自動化決策單位因無法作出合理解釋而面臨著罰款甚至是公關危機的挑戰(zhàn)。
深度學習缺乏解釋能力,可以解決任務十分有限
我們擁有的只是無法進行自我解釋的“深度學習型人工智能”,而且由于缺乏解釋能力,其可以解決的任務也十分有限。深度學習不會節(jié)約成本,也不能因為自動化決策內(nèi)容的敏感性而中止處理。
對于大多數(shù)人來講,人工智能的典型代表是科幻電影中那些能夠進行智能解釋的產(chǎn)物。更具體地講,人類可以根據(jù)這些解釋快速決定是否支持其論斷,這意味著合法性驗證的難度并不高。
正因為如此,包括法官以及GDPR立法者在內(nèi)的大多數(shù)人都認為采用人工智能技術的企業(yè)應當能夠像電影中一樣將其引入法庭,且其有能力以簡單明確的方式捍衛(wèi)自己的決定。但實際情況恰恰相反,我們擁有的只是無法進行自我解釋的“深度學習型人工智能”,而且由于缺乏解釋能力,其可以解決的任務也十分有限。深度學習不會節(jié)約成本,也不能因為自動化決策內(nèi)容的敏感性而中止處理。即使對于需要由人類作出最終決策的業(yè)務流程,我們也更期待能夠出現(xiàn)可以解釋自身建議的人工智能成果——而非如今這種無法給出任何原因或理由的“黑匣子”。
未來可能出現(xiàn)的可解釋型人工智能方案將幫助各類機構更安全、更具合規(guī)性、更快速且以更低成本代替深度學習與人為處理流程??紤]到深度學習的誕生時間為上世紀六十到八十年代之間,因此也許能夠實現(xiàn)這一要求的技術業(yè)已存在,只是等待著被重新發(fā)現(xiàn)或者是迎來一波脫胎換骨的升級。
在自動化決策制定方面,GDPR亦要求防止基于種族、觀點乃至健康狀況等因素的歧視性影響。然而,用戶生成型數(shù)據(jù)(包括社交媒體與新聞)不同于醫(yī)學或財務記錄等實際情況數(shù)據(jù),其中總是隱含著某些邪惡的偏見。
如前所述,深度學習能夠讀取大量文本與數(shù)據(jù)并模仿其內(nèi)容傾向,但卻無法以批判性方式加以理解。深度學習只會相信經(jīng)常發(fā)現(xiàn)的結論,強調(diào)數(shù)據(jù)當中出現(xiàn)的模式與趨勢,這無疑將進一步擴大人類社會中存在的偏見問題。
數(shù)據(jù)顯示,黑人相較于白人擁有更高的入獄比例,因此如果出現(xiàn)相關案件,深度學習自然會首先懷疑黑人。數(shù)據(jù)顯示,企業(yè)董事會中的男性成員要遠多于女性成員,因此深度學習在考慮職位申請時將優(yōu)先選擇男性候選人。
深度學習的決策在歧視性、種族主義等問題
深度學習的決策在歧視性、種族主義以及性別歧的程度上將高于訓練數(shù)據(jù)中的平均樣本。這個問題存在于所有機器學習算法當中,但深度學習模型無疑是其中最難測試、檢測、控制及調(diào)整的區(qū)間之一。這個問題很難得到解決,且會廣泛引發(fā)諸如聊天機器人納粹化與出現(xiàn)仇恨傾向、乃至美顏應用直接過濾圖像中的黑人面孔等情況。
在訓練完成后,我們無法通過平衡調(diào)?;虬惭b補丁的方式解決深度學習模型中的歧視、種族主義或者性別歧視傾向。深度學習是一套神經(jīng)網(wǎng)絡,其與其它一些人工智能方法不同,意味著我們無法利用局部調(diào)整的方式編輯具體答案,而只能選擇利用不同的、100%平衡且公正的數(shù)據(jù)對其進行重新訓練。很明顯,這類數(shù)據(jù)集非常罕見。
另外,深度學習模型會模仿其在數(shù)據(jù)集中發(fā)現(xiàn)的結論,但卻并不能真正理解其含義:深度學習不會對任何數(shù)據(jù)加以否定,不會意識到其中代表著哪些不公正傾向,而僅僅簡單進行“數(shù)據(jù)學習”。有鑒于此,我們可能需要雇用專門的人員為其創(chuàng)造理想條件下的偽公平數(shù)據(jù),即白人的拘捕率與黑人一致,且其中50%為女性等等。
然而,為了訓練深度學習而創(chuàng)造大量經(jīng)過人為編輯的無偏見數(shù)據(jù)將耗費大量資源,其成本將導致人工智能變得缺乏實際意義!此外,即使我們訓練出這樣一套真正公平的深度學習模型,由于其無法作出任何解釋,因此它仍然無法向法官或者用戶自證判斷結論的公平性。
在非商業(yè)應用或者不構成法律風險的游戲當中,深度學習有可能成為輔助性要素。當可解釋人工智能方案出現(xiàn)之后,深度學習技術也不會像磁帶機或者顯像管電視那樣被徹底淘汰。畢竟人們不會因為輸給游戲機器人而向法院提起訴訟,宣傳其無法解釋自己如何獲勝。
另外,即使人們對FaceApp在照片當中對年長、年輕或異性人物的面部進行修飾有所不滿,也不會因人工智能無法解釋其外貌判斷過程而將其告上法庭。再有,只要用戶在服用藥物之前向醫(yī)生進行確認,那么利用深度學習技術檢測醫(yī)療影像中的疾病就非常安全。
深度學習更多代表著一種法律風險
合法深度學習市場在規(guī)模上存在嚴重局限: 法官可以對可能導致財務或健康差異,或者存在歧視性傾向的條件下提出罰款判決,而深度學習算法將無法理解該判決是否公正以及為何公正。
事實上,除了進行藝術創(chuàng)作、游戲設計或者笑話編輯之外,深度學習更多代表著一種法律風險?,F(xiàn)有的非深度學習實現(xiàn)方法將在必要時取代深度學習,并憑借著相關新方法的發(fā)展而繼續(xù)推動人工智能的歷史進程。只有每個人都重視深度學習之外的一切人工智能與機器學習技術,我們才真正有可能成為“全面的人工智能專家”。
除了“非法”問題之外,深度學習在其它幾類任務的解決方面同樣非常無力:在抽象推理方面,人們需要弄清其所看到的數(shù)據(jù)是否公平,同時解釋自己作出決策的邏輯。即使對于圖像識別這類似乎最適合深度學習算法且不太需要解釋的任務,深度學習的安全性仍然遠不及人類。
事實上,我們完全可以用“敵對性樣本”欺騙深度學習算法:在貓的照片當中添加無形干擾因素,即可誤導深度學習算法將其內(nèi)容視為狗。在這種情況下,盡管人類仍然會將其判斷為貓,但深度學習卻會將其判斷為狗,或者其它由黑客悄悄植入的內(nèi)容。如此一來,攻擊者將能夠通過篡改路牌干擾目前的自動駕駛車輛。未來的新型人工智能系統(tǒng)必須有能力解決這類黑客活動,從而全面替代深度學習類方法。
高人氣深度學習庫Keras作者在他撰寫的《深度學習的局限性》一文中提到:“深度學習惟一的真正成功之處,在于其能夠利用大量人類注釋數(shù)據(jù)通過連續(xù)的幾何變換將空間X映射至空間Y。”這些空間當中包含諸多維度——而不僅僅是三維,因此深度學習能夠模仿畢加索的藝術風格、學習如何在德州撲克比賽中虛張聲勢,并完成其它一些能夠體現(xiàn)人類創(chuàng)造性的任務。
但從外行的角度來講,我認為這同時意味著深度學習會在不理解什么是貓的前提下通過訓練學會如何識別照片中的貓,也能夠在不清楚種族主義為何物的前提下抱有種族主義傾向。雖然這并不影響深度學習成功識別出貓、抱有種族主義傾向或者刻比賽,但其在根本上與人類的判斷方式仍然相去甚遠。
在《深度學習的未來》一文中,Keras庫的作者描述了他對于深度學習系統(tǒng)只能在“幾何模塊”中才能同目前尚不存在的潛在未來“算法模塊”與“元學習方法”進行交互的設想。雖然這種方法能夠增加可解決任務的數(shù)量與類型,但仍然無法解釋深度學習模塊所作出的具體決策。
正如我們無法用言語來解釋我們大腦當中計算得出的某種感覺或者圖像一樣,人類雖然能夠給出一定的說明,但其往往只是一種自認為準確的簡單化借口。在這樣的前提下,要求機器作出非常準確的解釋反而不太公平。
在另一方面,也有不少專家在努力構建起非深度學習型人工智能系統(tǒng),但他們面臨著缺乏資金的窘境——畢竟目前大家的投入重點仍然集中在深度學習身上,而這種狂熱的態(tài)勢仍將持續(xù)一段時間。沒人知道人工智能的下一波浪潮何時才會到來,但我認為其不太可能體現(xiàn)為深度學習2.0。
眼于整個人工智能與機器學習領域
深度學習之所以得到廣泛的關注與炒作,主要是因為那些銷售深度學習軟件與硬件的廠商的推波助瀾。作為另一個角度的證明,大家可能會發(fā)現(xiàn),并沒有心理學家或者哲學家這類“自然智能”專家群體對深度學習提出支持。
如果大家并不急于在人工智能領域一試身手,或者沒有太多時間投身其中,那么不妨跳過嘗試學習1.0并等待人工智能系統(tǒng)的下一波變革——畢竟只有成熟的技術才值得我們進行學習。但如果您需要盡快掌握人工智能技術,那么請務必著眼于整個人工智能與機器學習領域,而非單純關注深度學習。
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】