十年后,你的工作會被人工智能取代嗎?
杜克大學副教務長 Lawrence Carin 教授
Lawrence Carin 教授是杜克大學分管科研的副教務長,他于 1985 年、1986 年和 1989 年獲得馬里蘭大學電子工程學本科、研究生和博士學位,并于 1989 年以助理教授身份加入位于紐約的理工大學電子工程系并在 1994 年成為副教授。1995 年他加入杜克大學電子工程系并被提名為 William H. Younger 杰出教授及電子工程系主任。Lawrence Carin 教授的早期研究專注于電磁學和感應,并在過去十年研究應用數據和機器學習。共著有或聯合編寫超過 300 篇學術論文并涉及人工智能、炸彈探測、視頻分析、神經學、癌癥、傳染病、投票行為及音樂等不同領域。他在炸彈探測領域的研究幫助在北卡研究三角園區創辦了一家 Signal Innovations Group 的企業并已雇傭超過 40 名員工。他最近出售了他在這家公司中的股份。Lawrence Carin 教授是美國電子電氣工程師協會院士、Tau Beta Pi 和 Eta Kappa Nu 榮譽學會的會員。
2017 年 7 月 25 日至 8 月 3 日,即將迎來第二屆杜克清華機器學習暑期課程。值此契機,本課程的獨家媒體合作伙伴機器之心對作為該暑期課程組織者之一的 Lawrence Carin 教授進行了專訪。專訪中 Lawrence Carin 教授介紹了昆山杜克大學博雅通識教育的目標,及人工智能時代人不能為機器替代的能力;他如何用兩年時間從初步認識機器學習到成為世界級專家;他作為一個創業者對中國創業者的建議;機器學習暑期課程對學員未來職業的影響;貝葉斯定理、機器學習之于杜克大學的意義;清華、杜克與昆山杜克大學在機器學習領域的合作等等。
以下是采訪正文。
機器之心:您似乎是剛涉足深度學習領域。除了媒體的關注度還有技術上的突破外,深度學習對您的吸引力源自何處?
Lawrence Carin:深度學習是一個很新的領域,雖然我可能不是最早接觸這個領域的,但也不算太晚。我非常喜歡學習新事物,所以深度學習最吸引我的地方在于:它是一門新技術,并且也非常有前景,同時還因為我并不了解它。
兩年前的夏天,我決定開始研究深度學習。于是我大量地閱讀和思考,試著用自己的方式理解和追溯事物。所以無論何種情況下,一旦開始鉆研并理解一件事,我就會產生濃厚的興趣,隨之就會開始著手研究。我們專心致志研究深度學習已有兩年的時間。
機器之心:這么多年,您的研究涉及的話題很廣泛。是什么驅動了這么強烈的好奇心?您又是怎樣探究各個領域并對其做出貢獻?如何一層層探索各個話題的呢?能否和我們分享一些讓您在各個領域都成為專家的「認知小技巧」?
Lawrence Carin:有一個很有名的統計學家,叫布萊克威爾,他幾年前去世了。他是一個非常出名的統計學家。他說的一些話非常尖銳也很深刻,他的話大概能回答你的問題,也代表了我的想法。他說他從來沒有做過研究,他只是喜歡去了解新事物。無論何時你去探索一些事,你就想弄明白它。有時候你研究了別人從沒研究過的事物,那么你就可以出版你的發現。他說他的目標從來都不是寫論文或者變得出名,他的目標就簡簡單單的是去理解發現一些事物。對我來說,這也是我的想法。
正如大概在十年前,壓縮傳感的概念出現了,很多人對此非常興奮。我對于此一無所知,所以我決定去了解它。結果壓縮傳感一躍成為了重要的理論。
關于深度學習,我的態度也是一樣的。研究深度學習的出發點從來都不是為了寫論文或者其他,只是單純地想要了解它。而在這個過程中,我們得出了一些原創的結果。不管如何,我就是這么做了,不僅堅持了很長時間,還會繼續堅持下去。我很享受做研究。
機器之心:無論何時您對一個領域產生了興趣,就會在這個領域取得很多成果。您每年發表的論文數量遠超過平均值。這么高效率的秘訣是什么?
Lawrence Carin:我認為在要求別人高效之前,我自己必須先變得高效。我的全職工作是副教務處長,有滿滿的日程安排。做研究并不是我的工作,只能稱之為愛好。我做研究只有兩個時間段,一是每天早上工作開始之前,我早上五點鐘起床,六點到八、九點之間做研究;再就是在周末。如果你不熱愛一件事,你就不能把這件事做好。這就是為什么我說做研究是我的愛好。
機器之心:就像很多杜克大學人一樣,您也信奉貝葉斯定理嗎?您認為當一個人思考和研究機器學習的時候會大多數時候用貝葉斯思維嗎?
Lawrence Carin:杜克大學非常崇尚貝葉斯定理,其中有一個非常有意思的原因。杜克是一個非常年輕的學校,雖然并不是像昆山杜克大學這么年輕,但仍然還是非常年輕的。杜克始終都在排名前十的大學內,而這些排名前十的學校里,大部分都有很長的歷史,有些已經建校超過百年。而僅僅只有八十年歷史,仍非常年輕的杜克大學,考慮到凡事不能盡善盡美,所以我們必須要有側重點。
二三十年前,杜克決定向貝葉斯定理發展。我們不可能所有事都有偉大的成就,那么專注并專長于某一方面就尤為重要。恰好當時,貝葉斯定理還沒有成為主流。在那個貝葉斯定理還沒有傳遍世界各地的情況下,使得將貝葉斯定理做到最好就變成了可能。10 年或 20 年前,貝葉斯觀點和優化觀點或者稱之為頻率論者觀點之間有著非常嚴峻的競爭,事實上,這兩個觀點一直都處于斗爭中。
然而現在,人們意識到,這兩個觀點各有千秋,他們各自扮演著不同的角色,發揮著不同的價值。兩者的競爭也在逐漸消失。在機器學習中,優化觀點和貝葉斯觀點之間的分歧也并不像曾經那么引人注目,而且也不像在統計學中那么顯眼了。在任何情況下,貝葉斯觀點在機器學習中都是非常強的。
機器之心:您在機器學習領域展現了極強的數學能力,您也同樣很關注理論方面的東西,您對于深度學習的效率方面是怎么看的呢?數學的哪個方面能夠解釋深度學習?在您心中,哪一個理論能用來解釋深度學習呢?
Lawrence Carin:我們沒有一個明確的理論支撐。正如我所說,兩年前我決定開始了解深度學習時,我的目標不是來寫論文而是純粹的理解。所以我認為,漸漸地,深度學習不會再神秘,這也是我一直在向學生們傳達的東西。我在之前發表的公開演講提到了深度學習,用圖片和圖形來解釋了深度學習,這些都是毫無疑問地想向聽眾傳達為什么深度學習是成立的。
和深度學習最接近的是小波。小波是幾年前由杜克大學的 Ingrid Daubechies 教授發現的數學領域內的一個理論。小波是一個多角度的數據表達,深度學習也正是如此,多角度的表達。這兩者既有區別又有聯系。這很有意思,因為深度學習能很好地解決現實問題。所以然和領域都是一個階段一個階段發展起來的。大概在七年前,在深度學習還沒有出現之前,在機器學習領域最流行的是理論,你必須有證據,你必須有理論支持。那時對于理論是很強調的。結果就是出現了壓縮傳感。壓縮傳感在深度學習出現之前是有很大意義的。
壓縮傳感流行的時候,我很想去理解壓縮傳感,所以我們研究了壓縮傳感。大概在 5-7 年前,做研究必須要有理論支撐。有一次有一些研究深度學習的人來找我,他們沒有理論,沒有定理,但他們有很好的結果成績。他們真正的改變了機器學習的范例。現在,研究的重心都在于得到好的結果,在于做一些在現實中有意義的事情。當你研究理論的時候你要估計要猜測,但這些可能在現實世界中并不適用。但無論何時我們解決很大規模也很復雜的實際問題的時候,人們是沒有耐心研究定理的。就像「好吧,你去研究你的定理吧,做完了告訴我一下。我要去解決實際的問題了。」所以在這就有了一個心態上的變化,這種變化在我看來是很有益的。我覺得之前太側重理論了,但之后肯定還會出現側重理論的時候。
有意思的是,當 Yann LeCun 和其他團隊研究深度學習的時候,他們說「深度學習真好啊」,他們當然會說深度學習好因為他們就是研究這個的。但無論什么時候別人,就像我,不是第一代開創深度學習的人來研究深度學習的時候,深度學習是成功的。我們就像是獨立的驗證程序一樣,都說深度學習是成功的。你研究的越多,就能得出越多的例子,當你把深度學習應用到實際問題的時候,你會得到很好的結果。當你一遍一遍看這些結果的時候,你就會意識到,深度學習并不是一種轉瞬即逝的潮流,而是會一直存在,成為我們的工具箱里的一種工具,不會消失,它是非常真實的。經過一段時間,我們會有一些理論,但這些理論很可能也不會脫離現實。有一些很有意思的故事如果有時間我會講給你。但是在理論和實踐之間肯定有一些妥協,但現在實踐是占了上風的。
機器之心:深度學習在演講和計算機視覺方面都得到了很好的應用。但如果想把它變成一種更可行的計算機科學,在自然語言處理上必須取得突破。你覺得深度學習的發展能革新自然語言處理嗎?或者說如果自然語言處理不能取得進展,深度學習就會失去發展勢頭嗎?
Lawrence Carin:我們在自然語言處理上取得了很顯著的進展。雖然最深處的東西可能是也可能不是最重要的東西,但就機器學習而言,很多最新的科技都已經取得了進展,對于自然語言處理也是有革新性的影響,對于這整個領域來說也是有革命性的作用。我對于自然語言處理的未來很樂觀,是我最樂觀的領域之一。
機器之心:所以您是說方法論的復雜程度并不是成功的關鍵?
Lawrence Carin:是的,這些模型都不一定很深刻。它們可以變得很深刻,但不必要。一些基本的概念幾年前就出現了,但是慢慢地才有變化,也被證明非常有效。一些深度學習領域的東西可能是,也可能不是最重要的事。但關鍵的是神經網絡,那是一種設置,我們最后也發現這種設置是很關鍵的。我們最近做的就是把貝葉斯公式和這些科技都結合起來,然后延展到其他許多領域。無論是哪種情況,我都對于我們現在在語言處理上取得的進展感到很樂觀。
機器之心:您創建了一個公司叫 Signal,后來被 BAE Systems 收購了。在一些程度上您是一個很成功的企業家。但現在,人工智能吸引了很多的注意力,很多新興公司都把發展人工智能科技作為他們未來的目標。對于中國的這些想要利用人工智能科技發明一些新東西,革命性的東西的企業家,您有什么想說的嗎?
Lawrence Carin:就像你說的,我確實創建了也出售了一個公司。而我想說,管理一個公司不是一個線形的過程,它也不會按著你期待的方向走下去。在商業領域,最重要的就是關注顧客需求。無論何時你創建了一個公司,你肯定對于你怎么進行下去,你想賣出什么商品有了一些點子。但是進入現實世界時,你所想的很重要的東西,和你交流的人不一定認為他很重要。而你所認為的很微不足道的東西,這些人可能覺得很重要。所以,最重要的就是要接納別人的意見,要聆聽,要靈活。也必須明白,只要你做實驗,你就會遇到困難。我們公司就遇到過很多挑戰。
另一個建議是,要仔細挑選你的商業合作伙伴。你成功時身邊的合作伙伴不一定是你當初開創公司時的身邊伙伴。那是因為你是和一群人一起工作的,創建一個公司也是很艱難的過程。因為它不會像你所想地一樣發展,你得做出改變,也要應對挑戰。當你和一群在壓力和挑戰下的人一起工作時,你會看到他們身上不同的方面。他們的做事風格不一定和你設想的一樣。所以我說你要謹慎挑選你的伙伴。
我得到的另一個教訓,可能聽起來不太愉悅,但是我覺得是真理:當你開創公司時,一定要請一個很好的律師。也要確保他們制定好這個公司的法律架構。開始時你會覺得一切都很好,每個人都像朋友一樣。但慢慢地,你就會意識到各種各樣的挑戰。我可以告訴你,我開始時是很天真的。但幸好我們有一個很好的律師。我們沒進入現實社會時,我還沒有意識到一個好律師的重要性。
開創并且運營一個公司是很艱難的,一點也不浪漫。當你回頭再看時,你創建了一個公司,你又賣掉了它,聽起來很不錯,聽起來很激動人心。回頭再看這段經歷是很好的,但是在過程中確實很艱難也很有挑戰性。
機器之心:很多計算機科學專業的學生想去谷歌 Facebook 這樣的大公司工作。您認為這一項目(杜克清華機器學習夏季課程)將如何以及和在何種程度上幫助到這些學生的未來職業或者研究生涯呢?
Lawrence Carin:對于學生來說,這是他們初次接觸到機器學習。這一課程將會從不同視角涵蓋很多領域:貝葉斯定理視角,最優化視角。經研究人們會根據自己的性格選擇自己傾向研究的領域:所以喜歡貝葉斯的是一種人,喜歡最優化的是另一種人。因此這給學生一個機會,讓他們認識到自己適合的領域。當然最重要的是我希望他們能夠得到鼓舞,畢竟沒什么能夠取代努力。在這樣的課堂上,你不會學到如何成為一個機器學習領域的大師。學習的方式是你自己靜靜的端坐幾個小時,不斷閱讀、思考,因為這是一個非常復雜的領域。但這給他們機會讓他們看看自己到底能走多遠。
對于學生來說,這是他們初次接觸到機器學習。還有就是很多導師都是都是年輕人。我們有來自哥倫比亞大學的年輕教授,還有來自德克薩斯大學奧斯汀分校的年輕教授,這位教授還是個中國人。這樣中國的學生就會發現原來我的同齡人也可以在像德克薩斯大學這樣的世界頂尖學校任教,這對他們的激勵作用不言自明。因此我希望這能激勵他們,讓他們覺得自己也可以做到。當學生們以后在 Facebook 或者谷歌或其他企業工作又或者成立了自己的公司時,回想起這節課,他們會說這節課鼓舞了他們,而不是在這堂課上我學習了我需要知道的知識,因為要學習的知識永無止境。我對這批學生印象非常深刻,他們認真努力。有些事情我們過去是不知道會發生的,但是他們確實發生了。
機器之心:您認為清華、杜克和昆山杜克大學在機器學習領域會迎來怎樣的合作?
Lawrence Carin:杜克清華機器學習暑期課程把「杜克」這個品牌帶到了中國。清華大學原本在世界上和中國都是一流的大學。把杜克和清華結合起來影響力何其之大。我們想繼續舉辦這樣的活動有以下幾個原因:第一,這些活動能提高杜克大學和昆山杜克大學在中國和國際上的知名度。第二,在杜克,這樣的活動相當于實驗,因為我們是在這建立一所真正的大學,我們也準備開設本科項目。
機器之心:和昆山杜克大學一直以來追求的博雅教育相比,人們當然也需要學習如何工作、如何編碼,但是您覺得還有哪些重要品質需要與學習編碼相結合?
Lawrence Carin:當人年輕時,人們會認為技術是最重要的。可是當我年紀大些,我才發現精英之所以能成為精英是因為他們的人際交往能力,他們能與其他人進行有效的溝通,與他人相處的很好,有團隊精神,可以應付各式各樣的人,明白生活并不總是順心如意,能夠在控制自己適應這個社會。我認為這些技能是十分重要。實際上當人類的生活變得越來越自動化,當機器學習占據的位置越來越重要時,機器能夠做到的事情就變得不那么重要了,畢竟這些事僅僅靠機器就可以解決。做一個有智慧的人,做一個會交流的人——包括口頭和書面交流,做一個善于理解的人。
我的意思是我們現在在中國,我不是一個中國人但我得在中國工作,我需要了解中國的風俗習慣,我需要了解如何在中國與人相處。因此我認為這些技能反而越來越重要了。但與此同時,你也要將這些技能和技術結合起來。如果你能夠將他們結合起來,那你身上就有了那些重要品質。我的學生遍布世界各地,我經常和他們聊天。我記得其中有一個在英特爾擔任相對而言還是比較高層的職位,他和我說「Larry, 你知道嗎,他們將我提拔到了這個位置,我們組的人都是斯坦福和麻省理工畢業的,他們提拔了我。」這些有特殊才能的人經常并沒有意識到自己其實很特別,這正是他們的特別之處。他其實有著非常好的人際交往能力,因此他和那些來自麻省理工的人其實一樣優秀,他能夠用別人想不到的方式和他人交流。
因此我覺得,在昆山杜克大學,我們和學生都需要行動起來。這真的很重要。你要知道,如果你在谷歌編碼,你不會想聽一些壓根不懂技術的經理說話。假如他對你指手畫腳,你肯定會想:你有什么資格告訴我怎么做,你根本什么都不懂。因此在谷歌人人都要掌握技術。但如果我們將人際交往能力和技術結合起來,你就真的真的變得非常「稀有」了。想想我們在昆山杜克大學要做的,不就是能夠培養出一些珍稀人才嗎。我們不是一個大規模的學校,我們只是一個「小」學校。因此如果我們能夠找到那些獨特的人,那些能夠將人際交往能力與技術能力結合起來的人,他們將來一定會成為領導者。我的意思是像哈佛和杜克這樣的學校能夠孕育出領導者的秘訣就在于小規模辦學。俄亥俄州立大學這樣的大規模學校就很少出現領導者,雖然從它的基數考慮,它應該孕育出不少。我們希望至少一部分杜克的學生是那些真的具有特別之處的人,我們感到很幸運能夠在杜克遇到他們。這些特別的人無論如何都是特別的。
機器之心:對于未來的人才,您還有什么建議嗎?
Lawrence Carin:最后,我想以一個有趣的小故事結束這個話題:我有一個學生 John Paisley,他是杜克的本科生,他出生在威斯康星州的密爾沃基,他從未了解過中國人,也從未見過中國人,更沒接觸過中文。但是他在杜克上學,這立馬就告訴你他其實很聰明。除了聰明,他也是一個特殊的人。發生了什么呢?當他跟著我上研究生的時候,他開始關注周圍的中國人,盡管他以前從沒見過。大多數美國人見到中國人是這么個態度:好吧,你是中國人,沒什么不好的。但我也沒興趣了解你,你反正要和我說英語,就這樣吧。換句話說,你要向美國人靠攏,我會以對待美國人的模式對待你。但我真的不是很想了解你。但 John 不是這么想的。John Paisley 在這邊講學時,他聽中國人說中文。他從沒接觸過。然后他看中國人寫字,他會發出這樣的感慨:「哇,這真有趣」。因此他開始自學中文,學習怎么寫,怎么說。實際上他還考了中國的 GRE,在中國上學。這不僅僅是因為他要去一個中國學校,更因為他想證明自己可以做到。他真的做到了。他在清華任教,最后去了哥倫比亞。像這樣的人就是特別的。他技術過關,對這個世界充滿好奇,因此想了解中國,他學習了中文,又是一個極佳的溝通者,一個優秀的寫作者,一個出色的演講者。因此 John,是一個領導者。領導者將對世界的理解好奇與高超的技術結合起來。像 John Paisleys 這樣的人少之又少。
【本文是51CTO專欄機構機器之心的原創文章,微信公眾號“機器之心( id: almosthuman2014)”】