成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

參照人類大腦,學會忘記會讓AI大模型變得更好?

人工智能
計算機科學家團隊近期開發出一種更敏捷更具彈性的機器學習模型,它們可以周期性忘記已知信息,而現有大語言模型不具備忘卻能力。

計算機科學家團隊近期開發出一種更敏捷更具彈性的機器學習模型,它們可以周期性忘記已知信息,而現有大語言模型不具備忘卻能力。

實測表明,在很多情況下,“忘卻法”的訓練效率很高,忘卻型模型表現也會更好。韓國基礎科學研究院(Institute for Basic Science)的AI工程師Jea Kwon說,新研究意味著AI領域取得明顯進步。

“忘卻法”訓練效率很高

今天的AI語言引擎大多都是人工神經網絡驅動的。網絡中的每一個“神經元”都是一個數學函數,它會從其它神經元接收信號,它會運算,然后通過多層神經元發送信號。

最開始時信息流或多或少都是隨機的,當網絡不斷與訓練數據匹配,神經元之間流動的信息會不斷優化。例如,如果研究人員想訓練一個雙語翻譯模型,它首先要收集海量雙語文本,用文本訓練模型,它會調整神經元之間的連接,將一種語言中的文本與另一種語言中的等效單詞聯系起來。

上述訓練會耗費大量計算力。如果模型運行時不夠出色,如果后來用戶的需求變了,模型會很難匹配。

新模型研究人員Mikel Artetxe說:“假設你有一個模型,里面包含100種語言,有1種語言沒有被覆蓋。如果你想將這種語言添加進去,那就要重新訓練。”

幾年前,Artetxe和同事用1種語言訓練神經網絡,他們抹去神經網絡所知的單詞組成信息,也就是所謂的“Tokens”。Tokens存儲在神經網絡的第一層,它也叫“嵌入層”。對于其它層,不去理睬。抹去第1語言的Tokens之后,用第2種語言訓練,第2種語言新的Tokens可以填充到嵌入層。

雖然模型包含大量不匹配信息,但仍然可以用第2種語言重新訓練,也就是說模型可以學習、處理第2種語言。研究人員認為,雖然嵌入層存儲了第2種語言的語匯特殊信息,但神經網絡更底層存儲了抽象信息,它涉及到人類語言的幕后概念,正是這些概念幫助模型學習第二種語言。

研究報告作者Yihong Chen認為:“我們生活在相同的世界,用不同語言的不同詞匯來賦予相同事物以概念。所以在模型之中會有相同等級的推理,比如一個蘋果,它是甜的,美味的,它不只是一個詞匯。”

將新語言添加到已訓練模型中,采用“忘卻法”效率很高,盡管如此,還是需要重新訓練,仍然需要海量數據和強大的處理能力。有沒有更好的辦法?當然有,不需要訓練,直接抹去嵌入層,然后再訓練,也就是在初步訓練時周期性重置嵌入層。

Artetxe稱:“如此一來,整個模型就能適應重置。如果你想擴展模型,讓它適應另一種語言,過程會變得更容易。”

忘卻型模型表現更好

研究人員用一種比較通用的大語言模型Roberta做實驗,采用周期性忘卻技術訓練,將它與那些用標準、非忘卻方法訓練的模型作比較。結果發現,在處理第1種語言時,忘卻型模型得分85.1分,傳統標準模型得分86.1分。再用第2種語言訓練,只用約500萬Tokens(第一種語言用了700億)訓練,忘卻型模型的精準度得分降至62.7分,標準模型降到53.3分。

再訓練時如果研究人員施加計算限制,忘卻型模型的表現會更好。例如,當研究人員將訓練長度從125000步短到5000步,忘卻型模型的平均得分約為57.8分,標準模型降到37.2分,幾乎和猜測差不多。

因此研究人員得出結論:在學習語言時,忘卻型模型表現更好一些。

魁北克深度學習研究中心Mila的研究人員Evgenii Nikishin認為:“因為模型在訓練時不斷忘卻,然后再重新學習,所以后面再教網絡一些新東西時會變得更容易些。”種種跡象顯示,模型理解語言時會從更深層次著眼,不只是了解單個詞匯的意思。

忘卻法與人類大腦的運行模式有些相似。舊金山大學神經科學家Benjamin Levy認為:“存儲大量詳細信息時人類記憶是相當不精準的。但人類大腦可以記住經驗要點,記住抽象信息,而且擅長推斷。讓AI像人類一樣處理信息,比如讓它具備忘卻能力,AI也許會更有彈性。“

Yihong Chen認為,未來也許會出現制造語言模型的工廠,這樣的工廠需要忘卻型技術,它是一個基本模型,可以快速適應新領域。(小刀)

責任編輯:龐桂玉 來源: 極客網
相關推薦

2019-11-28 09:42:46

人工智能AI精準醫療

2021-01-14 22:13:03

人工智能教育互聯網

2023-05-31 09:48:01

開源AI

2023-03-03 13:06:34

大腦分層預測

2024-10-29 21:01:44

2022-01-04 11:00:15

AI 數據人工智能

2014-05-07 09:41:21

UbuntuTrusty Tahr

2019-06-26 15:41:26

AI云原生云遷移

2025-05-29 10:32:32

2024-01-23 10:35:09

ChatGPT人工智能

2025-06-03 08:32:00

2021-09-01 10:35:19

asyncawaitVue

2024-08-27 00:00:03

2017-12-08 11:44:43

AI馬云馬化騰人類失業

2025-05-27 01:35:00

SpringAI監控

2023-05-22 09:38:38

2020-06-16 13:22:22

AI創新深度學習

2022-06-21 14:08:25

AIGitHub模仿人類

2025-05-26 08:40:00

2021-03-11 09:46:45

人工智能AI神經網絡
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 嫩呦国产一区二区三区av | 69性欧美高清影院 | 欧美精品在线播放 | 九九热在线视频 | 国产乱码精品一区二区三区五月婷 | 九九亚洲 | 亚洲久久| 涩涩视频在线观看 | 精品二区| 中文字幕免费视频 | 色桃网 | 国产精品高潮呻吟久久av野狼 | 草久在线视频 | 成人日韩av| 亚洲乱码一区二区三区在线观看 | 日韩2020狼一二三 | 久久久网 | 久久久久久91香蕉国产 | 国产精品久久久久久久久久免费 | 国产精品欧美一区二区三区不卡 | 亚洲精品不卡 | 欧美一区二区在线 | 色毛片 | 欧美中文 | 欧美三级在线 | 日本污视频| 久久精品屋 | 国产 日韩 欧美 中文 在线播放 | 日韩视频在线播放 | 国产a区 | 男人阁久久 | 91久久精品一区二区二区 | 国产.com | 亚洲一区二区在线 | 久久亚洲国产精品 | 午夜视频在线播放 | 狠狠操你| 一级欧美 | 一级片网址 | 手机在线观看 | 成人教育av|