算法的智能化升級讓我們的未來數字化生活充滿光明
譯文
研究人員當前正在致力于打造一套新的算法版本,旨在為搜索效果提升、自動駕駛汽車、手機智能化升級以及物聯網發展提供助力。
作為基于人腦結構的松散化模擬機制,深入學習算法已經被應用在眾多先進技術當中,包括語音識別、自然語言處理以及機器人自主性運作等等。
現在,研究人員正在對這些算法進行換代研發,希望將其大規模應用于機器學習與人工智能領域、甚至可能將其作為此類關鍵性技術進步的實現基礎。
Gabriel咨詢公司分析師Dan Olds指出,如果我們將目光投向更為“深刻”的技術進步——例如能夠自行駕駛、允許乘客省下時間進行休憩或者閱讀的智能汽車,或者可以自主啟動并將我們直接帶至目的地的其它載具——那么深度學習算法將是其中必不可少的前提條件與組成部分。
“這些自動駕駛汽車領先‘觀察’到的周邊路況信息及機動性障礙實現安全先進。而更為出色的汽車能夠區分行人及標志牌內容,從而更好地預測可能出現的突發性狀況,”Olds解釋道。“此外,智能化升級不僅將影響到我們未來的數字化生活,同時也會給現實生活帶來重大影響。如果我們能夠利用可信系統處理航班飛行或者駕駛任務,從而完成覆蓋全國乃至全世界的貨運任務,結果會怎樣?如果我們可以在寬大的后座上睡覺,而讓汽車自動完成駕駛任務,結果又會怎樣?”
基本上講,雖然大多數人甚至根本沒聽說過深度學習算法這一概念,但更卓越的算法確實能夠為我們帶來愈加光明的數字化前景——其中包括更具智能特性的家居環境、甚至是能夠照顧病人并幫用戶遛狗的機器人產品。
“這類研究成果可以說意義非凡,甚至有可能通過物聯網及移動技術等途徑將數據驅動機制拓展至無窮無盡的資源池范疇,”Moor Insights & Strategy公司分析師Patrick Moorhead指出。“盡管大多數人對此根本聞所未聞,但深度學習確實可算是數字化世界發展前景當中的核心組成部分。”
Andrew Ng在斯坦福大學計算機科學系擔任副教授,同時也是百度公司的***科學家——這里向外國的讀者朋友解釋一句,百度是中國的一家網絡服務企業、同時也是份額***的中文搜索引擎供應商。通過與來自斯坦福大學及百度公司的其他科學家進行協作,Ng目前正潛心打造下一代深度學習算法。他在于本周在美國坎布里奇市舉辦的麻省理工學院技術回顧EmTech會議上進行了主題演講,透徹解讀了深度學習技術在搜索及未來技術領域的實際應用。
斯坦福大學計算機科學系副教授Andrew Ng
他擁有豐富的背景積累,足以支撐起與深度算法相關的各項工作。Ng曾經在谷歌公司效力過一年半,并屬于該公司Google Brain深度學習項目的發起者。
除了谷歌之外,微軟、Facebook以及百度等多家企業也正在著手開發更為理想的深度學習算法,旨在滿足自身對于大規模數據處理的實際需求。
Ng在接受采訪時指出,此類算法的美妙之處在于當我們將規模愈發龐大的數據提交給傳統算法時,這些陳舊方案往往開始變得遲鈍、緩慢并最終無法繼續消化。但深度學習算法卻能夠帶來完全不同的使用效果。我們向其提交的數據總量越大,得出的分析結論也就越好。
人類大腦的運作效果之所以如此卓越,是因為其中充斥著大量彼此連通且利用電脈沖實現交流的神經元。深度學習算法的模仿對象正是人類大腦,旨在建立起一套基于模擬神經元的網絡體系。
“當我們建立起規模愈發龐大的人腦模擬體系后,這些模型在吸納大規模數據之后開始表現出相對更高效的處理成果,”Ng解釋道。“這些屬于容量極高的學習算法。”
目前工作進展可謂相當迅速。
大約四年之前,規模***的神經網絡或者深度學習算法集合大約擁有1000萬個連接節點。Ng指的是2011年年初,當時他剛剛開始推進谷歌的Google Brain項目,但如今整套模型當中的連接節點已經激增至10億級別。去年,他與斯坦福大學的技術團隊共同構建出一套擁有100億個連接節點的神經網絡模型。
Ng的一部分工作在于提升該算法,但他和他的同事們同時也在積極利用GPU或者叫圖形處理單元來取代傳統CPU或者叫中央處理單元在神經網絡中的核心地位。這些專門針對計算機圖形處理任務設計的芯片在實踐活動中顯示出強大的實力,被證明能夠很好地完成大規模神經網絡的構建任務——這是因為它們更善于處理此類計算工作。
“我們正在利用GPU硬件構建起新型深度學習平臺,旨在幫助自身更出色地完成規模擴展工作,”Ng表示。“我們的協作伙伴包括我自己都是***次接觸到如此規模的網絡體系。其它企業也開始緊跟我們的腳步,但據我個人了解,目前百度仍然是***家針對深度學習構建起超大規模GPU集群的公司。”
如果能讓這些算法迎來更為龐大的容量規模,應該意味著用戶將在語音識別效果以及可視化搜索領域獲得顯著改進。根據Ng的觀點,這些在技術領域絕對堪稱歷史性壯舉。
隨著越來越多貧困人口以及低文化群體開始接觸網絡體系,利用口頭表達而非手動輸入進行搜索查詢工作的用戶群體也將進一步膨脹。除此之外,相對于輸入描述詞匯,直接利用圖片作為搜索目標的用戶也會變得越來越多。
“在未來五年之內,將有大約半數查詢請求將通過語音及圖片的形式進行,因此這項技術也成為我們的主要資源投入對象,”Ng指出。
經過改進的語音識別技術允許司機在駕駛過程中大聲發出口頭指令,也允許乘客在自己的座位上直接向手機表達自己的需要,而這些內容將被準確發送到對應的接收方——例如向朋友匯報稱自己無法按時抵達會合地點。
“盡管整個世界都開始向移動技術傾斜,我認為仍然沒有哪家廠商能拿出一套真正適合移動設備的***用戶界面,而其中的核心矛盾在于我們很難在智能手機上利用細小的軟鍵盤方案快速完成輸入,”Ng表示。“語音識別的效果已經變得越來越好,但平心而論尚無法達到我們的預期要求。當其水平改進到足夠程度時,我非常樂意將語音識別作為智能手機設備上新型用戶界面方案的設計核心。”
深度泥塑算法還將被用在我們的智能設備當中,包括智能汽車與可穿戴式技術——而這一切結合起來,也就構成了物聯網時代的絕對主體。
“我認為遠程控制方案將在我們的家庭環境中無處不在,”Ng指出。“如果大家身處家中并打算聽點音樂來放松身心,比起現在掏出手機、解鎖屏幕并按下一大堆虛擬按鈕完成播放的操作,未來我們完全可以躺在沙發里、用口頭方式讓自己的百度設備直接播放來自Justin Timberlake的作品。我希望未來自己的孫兒們能夠問我,‘很久以前,大家的家庭設備真的聽不懂我們的口頭命令嗎?’相信到那個時候,他們肯定不敢相信原先家中需要準備一大堆不同類型的遙控器來操作各種設備。”