成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

提出AI消除性別偏見新方法,適用于任何模型

開發(fā) 前端
通過這一方法,團(tuán)隊證明如果上游預(yù)訓(xùn)練中對于性別偏見的矯正,能直接影響下游任務(wù)。

?陳丹琦新論文來了!

研究團(tuán)隊全員女將,這是她在普林斯頓的第一篇all-female author論文。

圖片

論文主題也和女性議題有關(guān)。

論文提出了MABEL,一種使用限定標(biāo)簽來讓AI減少性別偏見的方法。

通過這一方法,團(tuán)隊證明如果上游預(yù)訓(xùn)練中對于性別偏見的矯正,能直接影響下游任務(wù)。

而且適用于任何模型。

目前該論文被EMNLP 2022接收,項目已開源。

在Hugging Face上也能找到使用了這一方法的BERT-base和BERT-large模型,即插即用。

圖片

使用限定標(biāo)簽減輕偏見

陳丹琦團(tuán)隊的這個新方法MABEL,全稱是一種使用專用標(biāo)簽消除性別偏見的方法(a Method for Attenuating Gender Bias using Entailment Labels)。

MABEL是在任務(wù)不可知的情況下來消除偏見的,換言之,這種方法適用于任何模型。

此前適用于這種情況的消除偏見方法,比較流行的是SEAT(句子編碼器關(guān)聯(lián)測試),但后來被相關(guān)研究證明:

其內(nèi)在指標(biāo)衡量出的結(jié)果與外部指標(biāo)沒有直接的相關(guān)性。

也就是說,雖然一個模型在使用SEAT方法測試其消除偏見的得分很高,但在實際執(zhí)行任務(wù)的過程中仍然不及預(yù)期。

而這次研究團(tuán)隊呢,吸取了SEAT的經(jīng)驗,內(nèi)在指標(biāo)與外部指標(biāo)兩手抓。

并且據(jù)團(tuán)隊介紹,MABEL還是第一個利用來自監(jiān)督句子對的語義信號來消除偏見的方法。

那它到底是怎樣來消除模型中的性別偏見的呢?

一言以蔽之,MABEL通過對預(yù)訓(xùn)練數(shù)據(jù)庫中的所有帶有敏感屬性的詞進(jìn)行反義替換,其他詞則保持不變,然后進(jìn)行對比學(xué)習(xí)來消除偏見。

具體來說,研究團(tuán)隊做了兩方面的工作。

首先是數(shù)據(jù)集方面,研究團(tuán)隊使用的是自然語言推理(NLI)數(shù)據(jù)集,它在訓(xùn)練有區(qū)別性和高質(zhì)量的句子表征方面特別有效。

由于研究團(tuán)隊主攻性別歧視方向的偏見,因此,他們從NLI數(shù)據(jù)集中提取了在前提或者假設(shè)中包含性別術(shù)語的所有隱含對。

然后對數(shù)據(jù)進(jìn)行反事實增強(qiáng),即將數(shù)據(jù)集中包含性別敏感的詞匯全部替換成反義詞匯,如男生→女生…

接下來的步驟就比較關(guān)鍵了:訓(xùn)練!

訓(xùn)練主要針對的是以下三個損失函數(shù):

圖片

第一個是基于隱含的對比損失 (Entailment-based contrastive loss),它比較像SimCSE。

圖片

△SimCSE

圖片

△Entailment-based contrastive loss

這種對比性的損失是將具有類似含義的兩個句子進(jìn)行對比,使兩個句子的隱含對中有更強(qiáng)的關(guān)聯(lián),進(jìn)而使編碼器學(xué)習(xí)更多豐富的語義關(guān)聯(lián)。

第二個是對齊損失 (Alignment loss),這就比較好理解了,它是用來表示原始隱含對和其增強(qiáng)對之間的內(nèi)部關(guān)聯(lián)。

也就是說,這個函數(shù)能夠使模型最后生成的結(jié)果在男女之間更加平衡,以保證最后模型生成的結(jié)果性別歧視降到最低。

圖片

第三個是掩碼語言模型損失 (Masked language modeling loss),這是最后額外附加的一個損失,目的是為了保持模型的語言建模能力。

研究團(tuán)隊在所有句子中隨機(jī)屏蔽了15%的標(biāo)記。通過利用周圍的上下文來預(yù)測原始的術(shù)語,編碼器被激勵去保留token級別的知識。

最終的損失函數(shù)如下:

圖片

講了這么多,那MABEL這個方法偏見消除的效果如何?

研究團(tuán)隊直接做了個可視化的柱狀圖來呈現(xiàn)這個方法消除性別歧視的效果。

在五個衡量指標(biāo)中,包括兩個內(nèi)在指標(biāo)(左邊兩個)和三個外部指標(biāo),MABEL表現(xiàn)出了良好的公平性-性能權(quán)衡。

圖片

此外,研究團(tuán)隊還評估了語言模型在使用了消除性別歧視的方法后是否仍然保持一般的語言理解,結(jié)果顯示模型能夠很好地保留其在GLUE上的自然語言理解(NLU)能力。

圖片

陳丹琦帶隊,全員女將

最后,來看一下研究團(tuán)隊陣容。

陳丹琦,清華姚班校友,計算機(jī)領(lǐng)域近年來最受關(guān)注的青年學(xué)者之一。

圖片

現(xiàn)任普林斯頓大學(xué)助理教授,NLP組共同負(fù)責(zé)人、也是AIML組成員。

此前,她憑借在信息學(xué)競賽圈內(nèi)的傳奇經(jīng)歷引發(fā)眾人關(guān)注——CDQ分治算法就是以她的名字命名。2008年,代表中國隊斬獲一枚IOI金牌。

她長達(dá) 156 頁的博士畢業(yè)論文《Neural Reading Comprehension and Beyond》,也一度火爆出圈。不光獲得當(dāng)年斯坦福最佳博士論文獎,還成為了斯坦福大學(xué)近十年來最熱門畢業(yè)論文之一。

今年2月,陳丹琦憑借在NLP領(lǐng)域的成就和潛力,斬獲斯隆研究獎,該獎項素有“諾獎風(fēng)向標(biāo)”稱號。

論文一作為Jacqueline He。

圖片

她是一位今年剛剛畢業(yè)的普林斯頓計算機(jī)系本科生,目前是在Meta工作。

陳丹琦介紹說,Jacqueline同時也在申請博士學(xué)位。

團(tuán)隊中還有一位陳丹琦的學(xué)生Mengzhou Xia。

圖片

她現(xiàn)在是普林斯頓計算機(jī)專業(yè)的一位博士生,本科畢業(yè)于復(fù)旦大學(xué),后赴卡內(nèi)基梅隆大學(xué)讀研。研究興趣領(lǐng)域為大規(guī)模預(yù)訓(xùn)練模型的性能和效率。

除此之外,研究團(tuán)隊中還有一位72歲的高齡女學(xué)者。

她是普林斯頓語言學(xué)&計算機(jī)科學(xué)系教授Christiane D. Fellbaum。

其研究領(lǐng)域包括自然語言處理、詞匯語義、計算語言學(xué)、文本語料庫等,曾聯(lián)合開發(fā)WordNet。這是一個基于認(rèn)知語言學(xué)的英語詞典,可按照單詞意思組成了一個“單詞的網(wǎng)絡(luò)”。

圖片

論文地址:https://arxiv.org/abs/2210.14975

參考鏈接:[1]https://twitter.com/danqi_chen/status/1599828154839093248?[2]https://www.cs.princeton.edu/~danqic/?

責(zé)任編輯:武曉燕 來源: 量子位
相關(guān)推薦

2024-01-08 08:06:50

2020-04-12 22:16:16

互聯(lián)網(wǎng)IT技術(shù)

2011-08-01 16:10:11

XCode Excel 數(shù)據(jù)庫

2024-10-23 19:47:54

2025-02-25 10:04:10

2023-04-27 13:06:46

AI手機(jī)模型

2025-02-06 07:26:35

2022-05-17 08:00:00

人工智能社交媒體工具

2024-02-21 12:10:00

模型數(shù)據(jù)

2021-02-20 16:07:27

神經(jīng)網(wǎng)絡(luò)AI算法

2015-07-20 11:49:56

Wi-Fi

2021-11-26 18:37:39

技術(shù)人工智能計算機(jī)

2021-04-12 17:47:25

Facebook開源AI

2021-09-27 10:12:42

欺騙防御rMTD網(wǎng)絡(luò)攻擊

2024-08-30 12:58:43

AI多模態(tài)技術(shù)

2025-04-10 09:38:37

2023-09-25 10:04:37

模型AI

2019-12-30 09:41:59

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2025-01-23 10:08:00

虛擬數(shù)字AI

2020-05-14 14:21:50

谷歌AI數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 成人av网站在线观看 | 久久久久国产一区二区三区四区 | 国产一级在线 | 精品久久久久久久久亚洲 | 国产成人精品免费视频大全最热 | 国产一区二区三区不卡av | 精品亚洲一区二区三区 | 在线播放国产一区二区三区 | 国产精品一区二区在线免费观看 | 99看片网| 精品av久久久久电影 | 精品国产乱码久久久久久1区2区 | 人人草天天草 | 国产视频福利一区 | 一区二区三区免费网站 | 国产精品黄色 | 亚洲国产精品一区二区第一页 | 亚洲福利一区二区 | 亚洲精品一区二区在线观看 | 国产污视频在线 | 99re66在线观看精品热 | 成人av免费在线观看 | 国产精品久久久久久久久久久久 | 精品国产视频 | 偷拍自拍第一页 | 精品国产乱码久久久久久久久 | 国产精品视频偷伦精品视频 | 91麻豆精品国产91久久久久久久久 | 亚洲一区二区中文字幕 | 国产高清在线观看 | 国产精品99久久久久久www | 美女视频黄的免费 | 一级在线观看 | 精品一区二区不卡 | 九九免费视频 | 日韩成人在线一区 | 在线日韩福利 | 日韩精品在线观看一区二区三区 | 天天插日日操 | 亚洲精品自在在线观看 | 在线一区|