人工智能技術在科研大數據中的應用
人工智能經過幾十年的技術發展,它已進入一個嶄新的時代——人工智能時代。在這一新時代,各種各樣的研究成果不斷涌現。就像中國科學家、未來學家周海中先生在上世紀90年代所預言的那樣:“隨著科技進步,人工智能時代即將到來;屆時,人工智能技術將廣泛應用到各學科領域,會產生意想不到的效果。”科學研究會經常遇到如何處理大數據的問題;下面就簡要談談人工智能技術在科研大數據中的應用。
大數據(big data)又稱巨量資料,指的是無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。大數據的概念,對于不同的人有不同的理解;而目前適用于大數據的技術,包括大規模并行處理數據庫、分布式數據庫、數據挖掘電網、云計算平臺、互聯網、物聯網、分布式文件系統和可擴展的存儲系統。大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。近年來,在人工智能技術的助力下,科研中的許多大數據問題得到了有效的解決。
例如,為了探索地外文明(俗稱“外星人”),美國宇航局(NASA)前不久與英特爾、谷歌和IBM等科技公司展開合作,以開發先進的人工智能技術,這些技術可用于大數據分析,尋找外星人。當然并不是說,使用人工智能技術去“直接觀看”外星人;而是分析太空探測器和天文望遠鏡所獲得的數據,來識別地外行星的圖像、研究地質結構和化學性質等,看那里是否具備外星人存在的基本條件,以便探索結果更深入、更有效。有關專家認為,將人工智能技術用于分析海量的數據,確實是一個比較好的有關地外文明的探索方法。
又如,1972年,美國生物化學家、諾貝爾化學獎得主克里斯蒂安·安芬森先生在獲獎感言中提出了一個假設來說明酶進行化學合成的可能性。這就是著名的蛋白質折疊結構預測;由于它的計算難度很高,計算量也超級巨大,計算結果的準確度始終無法超過做實驗得出的結果。這個假設成了生物化學方面近50年來一個重大難題;該難題最近被谷歌DeepMind推出的AlphaFold破解了。此消息一出,立刻被《自然》(Nature)、《科學》(Science)等多家雜志報道。有專家認為,這可能是首個有望獲得諾貝爾獎的人工智能成果。
再如,在新冠肺炎(COVID-19)疫情期間,廣大科研人員借助人工智能技術抗擊新冠病毒,使這一高新技術在疫情中發揮了前所未有的能力。他們通過新冠患者的數據了解到潛伏期、臨床特征,為新冠早期癥狀鑒別起了很大作用;他們根據大數據做出新冠疫情的預測模型,為政策制定提供了重要依據。比如中國香港理工大學及澳門科技大學根據有關數據,研發出能快速診斷新冠患者的人工智能系統;只需20秒便能斷癥,并預測患者病情是否會惡化,準確率達90%以上。
從上面列舉的實例可見,人工智能技術可以在科研大數據中發揮巨大作用。隨著科研工作量的增大,數據的規模也成倍增長;在現有的科研環境中,如何處理長期積累的歷史數據,分析日常值守的實時數據和預判將要發生的事件變得尤為重要。完全可以相信,有了人工智能技術助力,今后科研中的大數據問題將會迎刃而解。