成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何把大量物理知識塞給AI?EIT和北大團隊提出「規則重要性」概念

人工智能 新聞
東方理工(EIT)和北京大學的研究團隊提出了「規則重要性」的概念,并開發了一套框架,能精確計算每個規則對模型預測精度的貢獻。

深度學習模型因其能夠從大量數據中學習潛在關系的能力而「徹底改變了科學研究領域」。然而,純粹依賴數據驅動的模型逐漸暴露出其局限性,如過度依賴數據、泛化能力受限以及與物理現實的一致性問題。

例如,美國OpenAI公司開發的文本到視頻模型Sora因深刻理解事物在現實中的存在方式而受贊譽,被視為AI領域的飛躍。盡管能利用大量視覺數據生成逼真圖像和視頻,Sora卻被認為未掌握物理定律,如重力和玻璃破碎等。

面對這一問題,將人類知識融入深度學習模型是一個潛在的解決方案。將先驗知識與數據一起使用,能夠提升模型的泛化能力,從而創建能夠理解物理規律的「知情機器學習」(Informed machine learning)模型。

然而,目前對深度學習中知識的價值仍缺乏深入理解,確定哪些先驗知識(包括函數關系、等式和邏輯關系等)能有效地融入模型以進行「預學習」,已成為一項亟待解決的難題。同時,盲目地整合多項規則可能會引發模型的崩潰。這種局限性制約了對數據與知識關系的進一步探索。

針對這一問題,東方理工(EIT)和北京大學的研究團隊提出了「規則重要性」的概念,并開發了一套框架,能精確計算每個規則對模型預測精度的貢獻。該框架不僅揭示了數據和知識之間的復雜相互作用關系,為知識嵌入提供了理論性指導,還有助于在訓練過程中平衡知識和數據的影響。此外,該方法還可用于識別不恰當的先驗規則,為交叉學科領域的研究與應用提供廣闊前景。

該研究以「Worth of Prior Knowledge for Enhancing Deep Learning」為題,于 2024 年 3 月 8 日發表在 Cell 出版社旗下交叉學科期刊《Nexus》上,并被 Cell Press 團隊在 AAAS(美國科學促進會)和 EurekAlert!進行報道。

圖片

在教授孩子拼圖時,既可以讓他們通過反復試驗來找出答案,也可以用一些基本的規則和技巧來引導他們。同樣地,將規則和技巧——比如物理定律——融入到人工智能訓練中能讓它們更貼近現實,運作更高效。然而,如何評估這些規則在人工智能中的價值,一直是困擾研究者的難題。

鑒于先驗知識的豐富多樣性,將先驗知識融入深度學習模型是一個復雜的多目標優化任務。研究團隊創新性地提出了一個框架,以量化不同先驗知識在提高深度學習模型方面的作用。他們將此過程視為充滿合作與競爭的博弈,通過評估規則對模型預測的邊際貢獻來界定其重要性。首先生成所有可能的規則組合(即「聯盟」),并對每個組合構建模型,并計算均方誤差。

為降低計算成本,他們采用了一種基于擾動的高效算法:先訓練一個完全基于數據的神經網絡作為基線模型,然后逐一加入各個規則組合進行額外訓練,最后在測試數據上評估模型表現。通過比較模型在包含和不包含某個規則的所有聯盟中的表現,可以計算出該規則的邊際貢獻,進而得出其重要性。

圖片

圖示:規則重要性的計算流程(來源:論文)

通過流體力學的算例,研究人員探討了數據與規則間的復雜關系。他們發現,在不同任務中,數據和先驗規則的作用完全不同。當測試數據與訓練數據分布相近時(即 In-distribution),數據量的增加會削弱規則的作用。

然而,當測試數據與訓練數據分布相似度較低時(即 Out-of-distribution),全局規則的重要性被凸顯出來,而局部規則的影響則被削弱。這兩類規則的區別在于:全局規則(如控制方程)影響整個域,而局部規則(如邊界條件)僅作用于特定區域。

圖片

圖示:規則重要性與數據量之間的關系(來源:論文)

研究團隊經數值實驗發現,在知識嵌入中,規則間存在三種相互作用效應:依賴效應、協同效應和替代效應。

依賴效應指某些規則需依賴其他規則才能有效;協同效應表明多條規則共同作用的效果超越各自獨立作用時的總和;替代效應則顯示一條規則的功能可能被數據或其他規則替代。

這三種效應同時存在,并受到數據量的影響。通過計算規則重要性,可清晰展示這些效應,為知識嵌入提供重要指導。

在應用層面,研究團隊試圖解決知識嵌入過程中的一個核心問題:如何平衡數據與規則的作用,以提升嵌入效率并篩選出不適宜的先驗知識。在模型的訓練過程中,該團隊提出了一種動態調整規則權重的策略。

具體而言,隨著訓練迭代步的增加,逐漸增大正重要性規則的權重,同時減小負重要性規則的權重。這種策略能夠根據優化過程的需求,實時調整模型對不同規則的關注度,從而實現更加高效和準確的知識嵌入。

此外,向 AI 模型傳授物理定律可以使它們「更加貼近現實世界,從而在科學和工程領域發揮更大作用」。因此,該框架在工程、物理和化學領域具有廣泛的實際應用。研究人員不僅優化了機器學習模型來求解多元方程,還準確識別出對薄層色譜分析預測模型性能有提升效果的規則。

實驗結果顯示,通過融入這些有效規則,模型的性能得到了顯著提升,測試數據集上的均方誤差從 0.052 降低至 0.036(減少了 30.8%)。這意味著該框架可以將經驗性見解轉化為結構化知識,從而顯著提升模型性能。

總體而言,準確評估知識的價值有助于構建更契合現實的AI模型,提高安全性和可靠性,對深度學習發展具有重要意義。

圖片

圖示:通過規則重要性以識別有效的規則(來源:論文)

接下來,研究團隊計劃將他們的框架開發成可供人工智能開發人員使用的插件工具。他們的最終目標是開發出能夠直接從數據中提取知識和規則,進而自我完善的模型,從而打造一個從知識發現到知識嵌入的閉環系統,使模型成為真正的人工智能科學家。

論文鏈接:https://www.cell.com/nexus/fulltext/S2950-1601(24)00001-9

AAAS 報道鏈接:https://www.eurekalert.org/news-releases/1036117

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-17 14:24:09

2025-03-17 12:55:18

2020-04-27 21:44:39

物聯網開發物聯網IOT

2023-09-10 10:51:22

算法結構

2023-09-08 07:01:08

機器學習監控ML

2024-02-07 12:13:03

AI模型

2021-12-22 23:12:19

物聯網隱私安全

2009-12-25 15:00:48

WPF軟件

2010-07-30 16:28:06

2023-10-24 11:07:57

2020-01-14 15:27:18

虛擬化AIIT

2009-09-14 15:50:17

CCNA學習方法

2010-02-06 09:36:46

gPadChrome

2011-06-24 11:35:01

內鏈

2025-06-26 08:56:00

AI模型系統

2011-07-05 18:30:44

站內優化

2009-12-23 15:57:40

WPF傳遞事件

2020-08-27 07:00:00

代碼軟件應用程序

2013-08-08 10:10:06

備份策略全備份增量備份

2017-12-29 10:14:48

IT項目
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线观看视频91 | 性色网站| 国产精品久久久爽爽爽麻豆色哟哟 | 精品久久久久香蕉网 | 九九综合| 亚洲一视频 | 久久av一区二区三区 | 亚洲天堂999 | 福利国产| 精品国产乱码久久久久久蜜臀 | 成人av一区二区三区 | 有码在线| 色天堂视频| 在线a视频 | 91观看 | 狠狠亚洲 | 亚洲品质自拍视频 | 看黄在线| 亚洲免费视频一区 | 午夜寂寞影院列表 | 久久综合久久久 | 国产精品久久久久久久久久久久 | 男女羞羞视频大全 | 国产精品婷婷 | 蜜桃av人人夜夜澡人人爽 | 日韩在线小视频 | 久久在线免费 | 日本不卡一区二区三区在线观看 | a级毛片毛片免费观看久潮喷 | 手机av在线| 黄免费观看 | 亚洲日本国产 | 欧美一区二区在线观看 | 久久国产精品视频观看 | 成人在线观看黄 | 国产精品99久久久久久久vr | 亚洲福利在线观看 | 成人久久久 | 成人国产精品久久久 | 99精品99 | 欧洲毛片 |