成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

新的訓(xùn)練范式可以防止機(jī)器學(xué)習(xí)模型學(xué)習(xí)虛假相關(guān)性

譯文 精選
人工智能
記憶感知訓(xùn)練(MAT)這種訓(xùn)練范式通過修改模型邏輯以防止機(jī)器學(xué)習(xí)模型學(xué)習(xí)虛假相關(guān)性,提高了泛化能力,縮小了平均準(zhǔn)確率(AVG)和最差群組準(zhǔn)確率(WGA)之間的差距。

譯者 | 李睿

審校 | 重樓

機(jī)器學(xué)習(xí)領(lǐng)域長期存在的問題之一是錯誤相關(guān)性的記憶。例如:假設(shè)開發(fā)人員正在開發(fā)一個深度神經(jīng)網(wǎng)絡(luò)對陸地鳥類和海洋鳥類的圖像進(jìn)行分類。他們使用數(shù)千張標(biāo)記過的圖像訓(xùn)練模型,這個模型在訓(xùn)練集和測試集上的表現(xiàn)都非常出色。然而,當(dāng)向模型展示一張?jiān)讷F醫(yī)那里接受治療的受傷海鳥的圖片時,卻錯誤地將其歸類為陸地鳥類。

新的訓(xùn)練范式可以防止機(jī)器學(xué)習(xí)模型學(xué)習(xí)虛假相關(guān)性-AI.x社區(qū)新的訓(xùn)練范式可以防止機(jī)器學(xué)習(xí)模型學(xué)習(xí)虛假相關(guān)性-AI.x社區(qū)

開發(fā)人員最初利用海鳥在海面飛翔的圖像對模型進(jìn)行訓(xùn)練,這導(dǎo)致了一個意外的結(jié)果:模型并沒有有效學(xué)習(xí)到海鳥的獨(dú)特特征,反而專注于識別圖像中是否存在大片水域。因此,當(dāng)向模型展示這張受傷海鳥的圖片時,其模型錯誤地將其歸類為陸地鳥類。

這是機(jī)器學(xué)習(xí)模型學(xué)習(xí)特征和標(biāo)簽之間的虛假相關(guān)性的一個例子。機(jī)器學(xué)習(xí)模型具有“惰性”,通常會選擇捷徑以實(shí)現(xiàn)目標(biāo)。在這個例子中,模型在其訓(xùn)練數(shù)據(jù)中記住了錯誤的特征——海鳥圖片中的水域。

記憶虛假相關(guān)性的主要缺點(diǎn)是缺乏泛化能力。該模型可能會給人一種進(jìn)步的假象,但在現(xiàn)實(shí)情況下可能無法很好地發(fā)揮作用。鳥類分類就是一個很好的例子。但是,當(dāng)機(jī)器學(xué)習(xí)模型用于醫(yī)療保健或自動駕駛汽車等關(guān)鍵應(yīng)用時,虛假相關(guān)性可能會造成危害。

如何檢測機(jī)器學(xué)習(xí)模型是否學(xué)習(xí)了虛假相關(guān)性?蒙特利爾大學(xué)和Meta公司的研究人員日前發(fā)表的一篇新論文探討了機(jī)器學(xué)習(xí)模型中記憶的動態(tài),以及它是如何導(dǎo)致學(xué)習(xí)虛假相關(guān)性的。他們還提出了一種名為“記憶感知訓(xùn)練”(MAT)的新范式,可以幫助防止機(jī)器學(xué)習(xí)模型在訓(xùn)練過程中學(xué)習(xí)虛假相關(guān)性。

ERM的問題

訓(xùn)練神經(jīng)網(wǎng)絡(luò)的標(biāo)準(zhǔn)方法是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(ERM),這是一種學(xué)習(xí)算法旨在致力減少模型在訓(xùn)練數(shù)據(jù)集上的損失。用于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的隨機(jī)梯度下降(SGD)算法是一種解決ERM的優(yōu)化算法。

ERM面臨的一個問題是,它可能會促使模型快速捕捉虛假相關(guān)性,而不是深入理解并學(xué)習(xí)問題潛在分布的真正模式。當(dāng)虛假相關(guān)性非常顯著時(例如,海鳥示例中的大片水域),模型往往會提前停止學(xué)習(xí),錯過進(jìn)一步挖掘真正有用模式(如圖像中的鳥類特征)的機(jī)會。這會降低泛化能力,因?yàn)樵趯?shí)際情況下,虛假的特征可能并不存在,而有用的特征始終存在(例如,遠(yuǎn)離水域的海鳥)。

如果一個模型有足夠的參數(shù),它甚至?xí)涀H特定于單個數(shù)據(jù)點(diǎn)的獨(dú)特特征,而這些特征并不適用于其他示例。這些特征與真正能夠預(yù)測目標(biāo)變量的核心屬性無關(guān)。

圖1 ERM會導(dǎo)致機(jī)器學(xué)習(xí)模型記憶虛假的特征,無法推廣到少數(shù)示例

為了驗(yàn)證模型是否學(xué)習(xí)了虛假相關(guān)性,必須在包含少數(shù)示例的保留樣本上進(jìn)行評估,這些示例不符合神經(jīng)網(wǎng)絡(luò)從大多數(shù)訓(xùn)練數(shù)據(jù)中學(xué)習(xí)的簡單解釋。例如對奶牛和駱駝的圖像進(jìn)行分類的一個模型,如果訓(xùn)練集中的大多數(shù)奶牛出現(xiàn)在草地上,大多數(shù)駱駝出現(xiàn)在沙地上,那么沙地上的奶?;虿莸厣系鸟橊劸褪巧贁?shù)示例。

記憶感知訓(xùn)練(MAT)

雖然給出的例子可以幫助發(fā)現(xiàn)記憶虛假相關(guān)性的跡象,但該論文提出了一種使用少數(shù)示例來指導(dǎo)模型學(xué)習(xí)可推廣模式的方法。

這種方法稱為記憶感知訓(xùn)練(MAT),通過使用預(yù)測來修改模型的邏輯——神經(jīng)網(wǎng)絡(luò)在轉(zhuǎn)換為概率之前輸出的原始預(yù)測。

圖2 記憶感知訓(xùn)練(MAT)防止機(jī)器學(xué)習(xí)模型學(xué)習(xí)虛假相關(guān)性,并迫使其對少數(shù)示例進(jìn)行泛化

具體來說,MAT通過引入基于“校準(zhǔn)保留概率”的每個示例的邏輯移位來修改ERM目標(biāo)。這里的校準(zhǔn)保留概率旨在通過一種機(jī)制,增加那些預(yù)測錯誤且保留概率較高示例的損失,同時降低那些預(yù)測正確且保留概率也較高的示例的損失,從而調(diào)整訓(xùn)練重點(diǎn)。通過將這些概率添加到損失函數(shù)中,訓(xùn)練算法可以防止模型記憶虛假相關(guān)性,并優(yōu)先學(xué)習(xí)數(shù)量較少或難以分類的示例,這些示例的泛化能力通常較差。

為了計(jì)算保留概率,MAT使用了一個通過交叉風(fēng)險(xiǎn)最小化(XRM)訓(xùn)練的輔助模型。XRM是一種訓(xùn)練技術(shù),旨在通過在兩個網(wǎng)絡(luò)上對訓(xùn)練數(shù)據(jù)的隨機(jī)一半進(jìn)行訓(xùn)練來發(fā)現(xiàn)數(shù)據(jù)集內(nèi)的不同環(huán)境。關(guān)鍵思想是鼓勵每個網(wǎng)絡(luò)學(xué)習(xí)一個有偏見的分類器,然后使用一個模型對另一個模型的數(shù)據(jù)所犯的錯誤(交叉錯誤)來注釋訓(xùn)練和驗(yàn)證示例。

為了跟蹤MAT的有效性,可以比較訓(xùn)練模型的平均準(zhǔn)確率和最差群組準(zhǔn)確率(WGA)之間的差異 (WGA衡量模型在表現(xiàn)最差的子組上的準(zhǔn)確率。這是評估模型穩(wěn)健性的關(guān)鍵指標(biāo),特別是在處理虛假關(guān)聯(lián)性和不平衡數(shù)據(jù)集時)。

圖3 通過縮小平均準(zhǔn)確率(AVG)和最差群組準(zhǔn)確率(WGA)之間的差距,MAT具有更好的泛化能力

在傳統(tǒng)的訓(xùn)練方法中,AVG與WGA之間的差距可能很大。而在MTA中,這一差距減小了(盡管以損失一小部分平均準(zhǔn)確率為代價(jià)),從而更真實(shí)地反映了模型的性能。

盡管大型語言模型(LLM)等領(lǐng)域的發(fā)展備受業(yè)界矚目,但機(jī)器學(xué)習(xí)基礎(chǔ)領(lǐng)域的持續(xù)探索令人耳目一新。MAT等技術(shù)對于現(xiàn)實(shí)世界的機(jī)器學(xué)習(xí)應(yīng)用至關(guān)重要,因?yàn)殚_發(fā)人員希望機(jī)器學(xué)習(xí)模型在這些應(yīng)用中能夠應(yīng)對各種復(fù)雜多變的場景。

原文標(biāo)題:New training paradigm prevents machine learning models from learning spurious correlations,作者:Ben Dickson

責(zé)任編輯:姜華 來源: 51CTO內(nèi)容精選
相關(guān)推薦

2024-08-19 11:52:24

機(jī)器學(xué)習(xí)模型h-stat

2020-10-30 10:23:14

機(jī)器學(xué)習(xí)趨勢范式

2020-08-10 15:05:02

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2020-10-26 15:48:32

NLP自然語言處理數(shù)據(jù)

2017-03-24 15:58:46

互聯(lián)網(wǎng)

2022-03-28 09:00:00

SQL數(shù)據(jù)庫機(jī)器學(xué)習(xí)

2020-06-09 08:09:07

機(jī)器學(xué)習(xí)統(tǒng)計(jì)學(xué)習(xí)無監(jiān)督學(xué)習(xí)

2019-08-29 18:07:51

機(jī)器學(xué)習(xí)人工智能

2023-06-09 07:29:03

模型文本document

2021-02-22 11:44:43

機(jī)器學(xué)習(xí)數(shù)據(jù)泄露學(xué)習(xí)

2018-11-07 09:00:00

機(jī)器學(xué)習(xí)模型Amazon Sage

2017-10-27 18:40:01

機(jī)器學(xué)習(xí)終身機(jī)器學(xué)習(xí)遷移學(xué)習(xí)

2024-11-04 00:24:56

2024-11-26 09:33:44

2024-12-26 00:46:25

機(jī)器學(xué)習(xí)LoRA訓(xùn)練

2020-08-28 07:00:00

機(jī)器學(xué)習(xí)預(yù)測股市人工智能

2018-03-09 09:00:00

前端JavaScript機(jī)器學(xué)習(xí)

2022-09-19 15:37:51

人工智能機(jī)器學(xué)習(xí)大數(shù)據(jù)

2022-10-08 11:11:25

機(jī)器學(xué)習(xí)人工智能

2013-05-22 14:02:34

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产综合久久久久久鬼色 | 亚洲欧美日本在线 | 国产成人精品久久二区二区91 | 亚洲人成人一区二区在线观看 | 自拍视频一区二区三区 | 日韩在线免费播放 | 玖玖国产精品视频 | 九九伊人sl水蜜桃色推荐 | 国产精品一区在线播放 | 久久性| av一区二区三区四区 | 波多野结衣一区二区 | 国产三级电影网站 | 国产精品久久久久久久久久免费看 | 红色av社区 | 精品国产一区二区在线 | 午夜网 | 2018国产大陆天天弄 | 97影院在线午夜 | 成人在线视频一区 | 国产欧美一区二区三区久久手机版 | 国产精品国产三级国产aⅴ原创 | 五月激情六月婷婷 | 中文字幕第十页 | 国产成人亚洲精品 | 午夜在线小视频 | 中文字幕av亚洲精品一部二部 | 一区二区精品在线 | 毛片一级片 | 五月婷婷激情 | 999精品视频| 久久久精彩视频 | 国产中文| 日韩一区二区三区视频 | 国产精品日韩高清伦字幕搜索 | 另类一区 | 中文字幕在线观看精品 | 欧洲视频一区二区 | 欧美日韩在线一区二区 | 精品国产女人 | 亚洲国产精品一区二区三区 |