AI能成科學家的工具人?Nature采訪五位頂尖學者:學會寫代碼,降低期望
人工智能(AI)逐漸從一個專用的研究領域走向成為其他學科的工具,這種方式也很好地促進了跨學科合作。
據斯坦福大學 2021 年的人工智能相關數據索引報告指出,人工智能相關期刊出版物的數量從 2019 年到 2020 年增長了 34.5%;從 2018 年到 2019 年的 19.6%。2019 年,人工智能出版物占全球所有同行評審科學出版物的 3.8%,遠高于 2011 年的 1.3%。
利用好 AI 算法也成了當前科研的必備素質,Nature 采訪了五位研究人員,調查了一下他們如何與 AI 進行合作。
理論物理學家與 AI
Phiala Shanahan 是一名理論物理學家,并且一直與 AI 研究部門 Google DeepMind 在合作。
合作的開展源于一次在以色列的會議上,她和學生展示了一些麻省理工學院 (MIT)項目,其中使用了倫敦 DeepMind 高級研究科學家 Danilo Jimenez Rezende 提出的一些想法;Rezende 的工作包括復雜數據的建模,例如醫(yī)學圖像、視頻、3D 場景幾何和復雜的物理系統(tǒng)。他做了一些關鍵的機器學習研究,并且已經將這些研究應用于基礎物理學中的問題。
她們進行了交談,并由此產生了長期合作,主要涉及到 DeepMind 的幾個人,我的幾個博士后和一個博士生。過去幾年她們共同寫了四五篇論文,確實利用 AI 做了一些創(chuàng)新的事情,使用機器學習模型來加速已建立的物理計算。
最終目標是使我們能夠進行現有算法和資源在計算上不可能進行的研究。
Phiala 認為合作取得成功的關鍵是平等感,她的團隊和 DeepMind 團隊一樣努力推動 AI 方面的發(fā)展。DeepMind 小組的人也非常了解物理學,雙方都可以做科學的兩個部分,所以這是一次非常平衡和充滿活力的合作,非常有趣。
Phiala 也參與過一些無效合作,他們認為,一組應該擔心物理部分,一組應該擔心計算機科學部分,最后在中間相遇。但實際的情況,這兩個群體最終都陷入孤立并與語言障礙作斗爭。
所以跨學科的合作需要雙方對兩邊的領域都有了解。
藥物設計與 AI
Simon Olsson 是瑞典哥德堡查爾默斯技術大學應用人工智能副教授。他說他們在去年 10 月成立的實驗室中用到了機器學習方法來解決自然科學中的計算問題。
例如,目前他們正在與英國和瑞典的合資公司阿斯利康合作開發(fā)藥物設計方法,該公司在哥德堡設有一個研究中心,同時他們還在研究如何將實驗數據整合到蛋白質結構和動力學的機器學習模型中。
如果你想弄清楚一種蛋白質是如何折疊的,或者一種藥物是如何與之相互作用的,那么使用一個考慮到有關該蛋白質的文獻以及控制其行為的物理和化學定律的計算模型可能會有所幫助。
如果你有計算機科學背景,想在學習自然科學的同時進入人工智能領域,試著找出一個你感興趣的領域,并找到一個你想解決的問題。
Olsson 最初是通過研究分子動力學和分子設計而被吸引到這個領域的,在分子動力學和分子設計中,分子及其相互作用是在計算機中模擬的,通常是為了新藥物的發(fā)現。人工智能有可能使以前無法解決的問題在這樣的領域中得以解決,這類領域的計算要求非常高。
Olsson 建議對人工智能感興趣的人開始學習編程,只需嘗試自動化他們在工作生活中經常做的事情:無論是發(fā)送模板電子郵件還是將數據輸入電子表格。如果重復這項任務很無聊,那么自動化的動機就會很快產生。之后,逐漸用越來越復雜的任務挑戰(zhàn)自己。
實驗物理學家與 AI
Siddharth Mishra-Sharma 是麻省理工學院(劍橋)粒子物理學博士后。
他在英國劍橋大學讀本科時在實驗高能物理和天體物理學方面做了一些實習。其中包括在瑞士日內瓦附近的歐洲粒子物理實驗室 CERN 度過的幾個夏天,在新澤西州普林斯頓大學攻讀粒子物理學博士學位期間涉足了機器學習,并在目前在麻省理工學院擔任職務時又回到了機器學習領域。
人工智能工具往往是對物理學的一個很好的補充,他們經常使用來自粒子對撞機或望遠鏡的大量數據集,這些數據集可以產生 PB 級的數據。
由于天文數據集種類繁,從單個星系的圖像到銀河系的地圖,沒有一種機器學習方法可以有效地用于尋找暗物質的影響。當機器學習開始用于天體物理學時,在新的環(huán)境中使用既定的算法。例如,如果機器學習方法擅長區(qū)分貓和狗的圖像,那么它也可以適用于區(qū)分不同星系的圖像。
但是今天物理學家和其他自然科學從業(yè)者的需求可以為機器學習方法的發(fā)展提供信息,物理學家不再直接使用來自對撞機或望遠鏡的大量數據集。相反,他們日常工作的一部分涉及查看哪種方法對給定的問題或觀察有效,如果不存在這樣的方法,則嘗試開發(fā)一個新的模型。
在這樣的工作中,物理學和機器學習之間的信息流是雙向流動的,人工智能和物理兩個學科得到充分交流。
管理學與 AI
Fabio Cozman 是巴西圣保羅大學人工智能中心(C4AI)的主任,他們的主要目標是開展對社會和行業(yè)有直接影響的機器智能研究。
主要開展有五個核心項目。其中一個的目標是能夠顯著改進巴西官方語言葡萄牙語的自然語言處理和翻譯能力,以便通過計算機語音工具更好地翻譯、轉錄和理解葡萄牙語使用者所說的話。
另一個項目 Blue Amazonia Brain,主要研究氣候變化、生物多樣性和礦產資源對巴西大西洋海岸線和居住在那里的人們的影響。
人工智能中心于 2020 年 10 月成立,每年由技術公司 IBM 提供 200 萬巴西雷亞爾(380000 美元),來自圣保羅研究基金會的 200 萬雷亞爾和來自圣保羅大學的 400 萬雷亞爾,州政府也會提供未來的財政支持。
該中心的合作目標十分廣泛合作,但合作者通常對計算機科學可以實現的目標有不同的期望,合作前都需要通過與合作者清楚地解釋 AI 可以做什么和不能做什么來解決。
并且研究成果經常出現分歧,例如,自然科學領域的人們通常將期刊論文視為傳播研究的最佳方式,而人工智能研究人員更重視會議。
另一個挑戰(zhàn)是一些研究人員只想要一個程序員。這些研究人員需要更愿意分享他們的知識和問題,而不是僅僅采用「過來幫我做編程」的方法,協(xié)作需要是一種旨在解決和回答問題的伙伴關系。
AI 發(fā)展得如此之快,以至于計算機科學和工程領域的人們覺得他們必須伸出手來解決現實世界的問題:僅僅做自己領域內的事情對我們來說不再那么有意義。并且其他領域的研究人員也正在遵循一個趨勢:所有主要的人工智能實驗室和中心現在都參與到現實生活中的應用問題中。
對于希望與 AI 專家合作的研究人員,Fabio 的建議是首先降低期望:您是否希望有「擅長編程」的人幫助您進行一些數據分析,還是您實際上需要提出更深入的問題?
一些 AI 相關的背景知識和實踐經驗對合作者很有用。
藝術家與 AI
Roman Lipski 是一名藝術家,2016 年 4 月,他開始在柏林美術學院教授難民課程,在那里遇到了數據科學家 Florian Dohmann 并展開合作,試圖利用人工智能探索藝術。
Lipski 曾看過谷歌的數據科學家用人工智能制作的圖片,但主要是由重復元素制作的恐怖故事圖像,主要特征像 1000 只眼睛或 1000 英尺長的動物。
剛開始他還天真的以為 AI 技術馬上就要落地了,能夠助力拍出有史以來最好的電影,他雖然知道 AI 有巨大的潛力,但卻無從入手。Florian 加入后,為了忠于 Lipski 自己的藝術靈感,他們決定只在自己的作品中訓練算法。拍攝了職業(yè)生涯中的每一幅畫后,就創(chuàng)建一個小數據集來訓練算法,然后要求它創(chuàng)建一個原創(chuàng)作品。
但結果又是慘不忍睹,生成作品和谷歌工程師那里看到的畫差不多,都充滿了重復形狀和顏色,沒有添加任何新東西。但從藝術上講,它們比其他任何東西都更具噱頭。
當更換應用場景到風格遷移時,Lipski 使用一張 2016 年 3 月訪問過的洛杉磯街道風景圖,他曾經用不同的顏色和紋理多次繪制這個場景。這一次,當要求算法制作新圖片時,結果令人驚嘆。
雖然不是每張照片都很好,但能夠在不同的藝術風格、真正的藝術質量和形式上獲得了成千上萬的優(yōu)秀成果,這也是僅靠藝術家自己無法達到的。
在遇到 Florian 的前一年,Lipski 認為自己遭遇了一場徹底的藝術危機。他覺得自己的世界里可以用繪畫講述的故事已經用完了,但他現在又開始畫畫了,但不是簡單地打印 AI 算法生成的內容,而是將其輸出作為靈感來創(chuàng)作自己的原創(chuàng)作品。
Lipski 的建議是不要被 AI 嚇倒,而要學習開始使用它們:就像任何工具一樣,它們有其優(yōu)點和缺點。但對他來說,人工智能改變了我的職業(yè)生涯。