想幫數學家,人工智能算老幾?
對于AI,有的人幻想,有的人偏見。
AI作為工具,計算方法,可以有效學習現實世界的內在規律,并快速推理獲得結果,兼顧精度和性能,對當今科學計算領域的研究范式已經產生了影響,逐漸形成了AI for Science這個新興研究領域,并正在改變科學探索的范式。 那么,AI能否幫到數學家?
也許這樣提問會更好:“AI能否輔助數學探索?
物理是科學的基礎,數學是物理的基礎。物理學里面各種各樣方程,其中相當一部分是微分方程。
理論上,物質在宏觀上的性質是可以被算出來的。假如能夠求解所有微分方程,基本上就可以去模擬整個物理世界。
比如,解薛定諤方程。這個方程在100年前就有了,但求解這個方程很難。
傳統方法搞不定高維非線性的復雜函數。
搞不定,不行。算得很慢,也不行。
正好,深度學習的神經網絡可以來幫忙。它的優勢在哪里?
神經網絡能力在于探索出一個非常有效地逼近高維函數的解。
或者說,神經網絡可以擬合高維復雜的函數,快速推斷,去計算這個函數的值。
神經網絡不僅可以快速推斷(Fast Inference),而且推斷精度“還好”。注意,這里的“精度還好”,不是“精度準確”。
或者說,神經網絡恰好是精度“剛剛好(Above Right Accuracy)”,足夠解決要解決的問題。這是神經網絡成功的一個核心。
很多時候,沒有必要算到非常高的精度。有時候識別一張圖片,是貓,還是狗。在圖片里面加上一大把噪聲,或者把一半的像素丟掉,還是能識別出是貓,或者是狗。 所以,精度是要基于任務的,而不是把“精度”單獨拎出來談。
總結一下AI這三個“戰斗力”,也是AI在科學應用里面能如此有影響的關鍵三點。
第一,逼近高維函數。
第二,做快速推斷(Fast Inference)。
第三,精度剛剛好夠(Above Right Accuracy),或者說精度“夠了就行了”。
那么AI for Science發展中,AI最合適的定位是什么?
答案是輔助創新。
AI輔助數學探索是個好方向。
用AI這個工具,分析數據,提煉潛在規律,但這里面有可能大量是“謬誤(spurious)”規律。
這時候,人類“介入”,人類從中篩選出真正有意義的規律,從而來推動科學的發展。
你看,人工智能用來預測蛋白質三維結構的Alphafold2模型經常也會推斷出一些令人困惑的結構,又或者推斷出一些不準確結果。
但是,它推斷得快,可以給科學家很多選項。最后,再由科學家拿主意。
再舉一個,神經網絡尋找抗生素的例子。
世界衛生組織(WHO)有個“通緝令”,通緝名單上都是最危險的病原體。
2019年,《細胞》雜志封面報道:
人類首次用AI發現“新抗生素”,從超過一億多種分子中識別出了強大的新型抗生素分子,并且在小老鼠身上做了驗證,發現確實是有效。
既然如此,何不就利用AI可以快速從海量數據中去提煉出一些有可能潛在的規律的這個特長,再由人來進行篩選。
谷歌子公司DeepMind幫助數學家猜測函數關系,輔助證明定理這個例子,是典型的AI for Science。
對此,北京大學北京國際數學研究中心董彬教授告訴“親愛的數據”:
數學家的緊密參與和與機器學習積極互動尤為重要,機器學習僅僅提供底層支撐,這種工作模式未來能夠產生的影響有可能是巨大的。
數學家還要注意哪三個點?
1. 可能只有一小部分問題可以用這種方式解決。
2. 數學家和機器學習(數據采集、建模、歸因)之間的密切互動至關重要。
3. 數學家和機器學習之間的分工可能嚴重依賴于手頭的數學問題和數學家本人。
為什么說是“機器學習輔助探索”,而不是“機器學習探索”?
因為機器學習只能提供輔助,包括輔助數學家去提出猜想。
回顧應用數學的發展,從第二次世界大戰,尤其是從曼哈頓計劃開始,那個時候的應用數學,或者說科學計算基于模型的(或者說解方程)。
從2010年往前數三十年,出現了基于數據的應用數學,有代表性的就是小波,壓縮感知,圖像處理。
國際數學聯合會(International Math Union,IMU)有一個高斯獎,國際數學界為應用數學設立的一個極高榮譽,從創立到目前一共頒獎四次,其中有三次都是基于數據的應用數學。
這三位高斯獎獲得者分別是:2010年,數學家伊夫·邁耶(Yves Meyer),他是小波理論的先驅之一。2014年,數學家斯坦利·奧舍(Stanley Osher)。2018年,數學家大衛·多諾霍(David Dohono),他是壓縮感知奠基人。
應用數學發展的未來,是新范式的未來,即數據+模型的范式,不是純數據驅動,或者純模型驅動的范式。
AI for Science最核心的一點就是利用深度學習這個工具,通過分析數據,使得AI輔助科學家進行科學探索的新范式,為科學帶來了模型與數據雙驅動的新的研究范式。
即便是人工智能,不合理運用機理,不把領域知識嵌入人工智能算法的設計,是很難有生命力的。