成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

挽救失足AI,不能光靠打罵

人工智能
研究提出了AI性別偏見起源的理論框架,因果框架,用來解釋在預訓練過程中,數據不平衡是怎么導致模型的性別偏見的。

好多研究都發現,AI這家伙好不害臊,竟也學會性別歧視了。

這可咋整?

最近,清華&復旦的一項研究為此給出建議:

要想把失足AI從性別歧視這條路上拽回來,一頓臭罵效果可不好。

最好的辦法是了解孩子為啥這樣,然后對癥下藥給他講道理。

因為要是光教訓不講道理,暴力糾正,AI會被嚇笨(性能下降)!

哦買噶,養四腳吞金獸難,養(xun)個(lian)賽博孩子也得這么難了?

來看看這群AI“奶爸奶媽”,提出了哪些訓孩子的建議吧。

講道理,AI可以減少性別歧視

在這次以前,不是沒有人揪著失足AI的耳朵,想讓它改掉重男輕女的壞毛病。

但是,目前的大多數去偏方法,都會讓模型在其他任務上的性能下降。

比如你讓AI減弱了性別歧視,就會產生這樣的惱人結果:

它要么分不清“爸爸”的性別是男還是女,要么會犯語法上的錯誤,忘記給第三人稱后面跟著的動詞+s。

更可氣的是,這種退化機制還沒被研究明白。

大家要不然直接棄用性別偏見明顯的模型——

2018年,亞馬遜注意到用來自動篩選簡歷的模型存在對女性求職者的歧視,就把這個系統雪藏了。

要不,就只能忍受性能下降。

難道說想讓AI不再是失足AI、問題AI,AI就一定會失了智嗎?

清華&復旦的研究對此說No。

圖片

他們研究的領域是預訓練語言模型。

這是因為它在各種NLP任務里顯示神通,有很多實踐場景。

當有性別偏見的它被用在在線廣告、自動簡歷篩選系統、教育等社會工作中時,可不太妙。

研究提出了AI性別偏見起源的理論框架,因果框架,用來解釋在預訓練過程中,數據不平衡是怎么導致模型的性別偏見的。

他們把預訓練模型在執行特定預測任務時的性別偏見進行如下定義:

圖片

其中,M是模型,Y是要用M預測的單詞,B是M的性別偏見程度。

Y0|W是ground truth,作為男性相關單詞或女性相關單詞的概率為二分之一,Y|W是M的預測。

如果M的預測Y不平衡且分布在性別之間,則模型M在根據w預測Y0時存在性別偏見。

在預訓練過程中,優化算法會根據預訓練數據D確定嵌入部分和K中的參數。

因此,數據不平衡D誤導模型得到了不正確的參數。

比如,訓練數據中的“醫生”一詞更常與男性詞匯相關,模型就會想當然地將“醫生”和“性別男性”聯系起來。

看到這個三角形沒,咱用它來解釋一下,為啥現在的方法糾正AI會讓它變笨。

圖片

當應用預訓練模型,根據W預測Y時,模型首先將W轉換為提取的X,然后根據X和K來確定Y的均值。

由于潛入部分的參數具有誤導性,W被轉換為不正確的X,而K也是不正確的。

一頓操作下來,錯誤的X和錯誤的K,一起導致Y出錯。

這些錯誤及其相互作用,通過三個潛在機制導致性別偏見。

圖片

也就是說到了這一步,性別偏見就產生了。

而目前教育AI的去偏方法是怎么運作的呢?

目前所有的去偏方法都干預了三種機制中的一種或兩種。

具體如下:

  • 增強對D的數據干預,并在所有三種機制中進行干預。
  • 通過消除X在K中的性別空間上的幾何投影,切斷了D→X→K→Y的路徑。
  • 性別平等正則化方法要么扭曲了D與X的關系,要么扭曲了D與K的關系,因此這類方法干預了D→X→Y和D→X→K→Y的機制。

在解釋了當前去偏方法中存在的偏見-性能困境后,團隊嘗試提出一種微調方法。

他們發現,三種機制中,有且僅有D→X→Y這種在導致性別偏見時,與transformer無關。

如果微調方法僅僅通過D→X→Y糾正偏差,就可以在減少性別偏見的同時,保持模型的性能。

根據分解定理,團隊進行了數值實驗。

結果證明,這種方法能夠帶來雙重紅利:

減少部分性別偏見,同時避免性能下降。

經過實驗,團隊成員把AI性別偏見的來源定位于預訓練模型的兩個架構:詞嵌入和轉換。

據此,研究團隊提出C4D方法,即通過調整標記嵌入來減少性別偏見。

這個方法的核心思想是通過修正被誤導的X,來縮小TDE函數,從而減少總偏差。

圖片

雖然團隊也不知道正確的標記嵌入到底該是啥,但是他們開發了一種基于梯度的方法,來推斷潛在的ground truth。

一切就緒,團隊將C4D方法應用于GPT-2試驗去偏結果。

結果表明,在所有測試方法中,C4D方法在小、中、超大型GPT-2上的困惑度都是最低。

在大型GPT-2中,C4D的困惑度排第二,只比最高分差了0.4%。

圖片

而且,得分最高的方法,對性別歧視的去偏效果低于C4D。

在GLUE數據集上,C4D方法獲得了最高平均分。

圖片

這表明,C4D可以明顯地減少性別偏見,并保持模型性能。

聽了這么多理論方面的介紹,來看個圖例直觀感受一下。

下面三張圖中,藍色的點代表潛入的男性偏見,紅點代表女性偏見。

圖(a)是AI本來的理解;圖(b)是人類無目的一通謾罵后,嚇笨了的AI的理解;圖(c)是人類找到原因,耐心講解過后AI的理解。

圖片

在圖(b)和(c)中,男性偏見和女性偏見的嵌入更加集中,這意味著偏見的水平較低。

同時可以注意到,圖(c)中的嵌入仍然保持了圖(a)中的拓撲結構,這也是C4D方法能夠保持模型性能的原因。

研究者:或許還能減少AI的其他偏見

“盡管這個方法可以有效緩解語言模型中AI對性別的偏見,但仍不足以完全消除。”

——研究者人員如實指出這個問題。

若想在不降低AI性能的條件下,進一步糾正AI的偏見,還需要更好地理解語言模型的機制。

那怎樣才能更好地理解?

一方面,是用本研究提出的“C4D方法”再去測試一下AI身上的其他偏見。

本實驗的主要研究對象是:職場上的性別偏見。

而實際上,由于AI之前不斷學習各種信息,屬于來者不拒的那種,結果一不小心,還染上了宗教歧視、嫌黑愛白等社會固有的毛病……

所以,不妨去GPT-2上再測測去除其他偏見的最終效果。

另一方面,可以把“C4D方法”放到多種大模型上試試。

除了本研究用到的GPT-2,例如谷歌開發的NLP經典預訓練模型BERT,也是一個不錯的測試場景。

不過要移植到其他模型的話,需要重新生成校正模板,并且可能要用到多變量TDE(Template Driven Extraction)函數。

通過運用TDE函數,你可以直接將內容放入索引,而不需要修改文檔結構。

有網友抱著狗頭來了:

圖片

總體來說,走進社會變成“失足AI”不可避免。

但想要“失足AI”浪子回頭,找對方法,給它講道理,還是會有不錯效果滴~

另外,研究團隊成員之一,清華大學的于洋在個人微博上表示,過兩天還有個關于AI模型性別歧視查詢的網站會上線。

可以期待一下!

論文地址:https://arxiv.org/abs/2211.07350參考鏈接:?https://weibo.com/1645372340/Mi4E43PUY#comment

責任編輯:武曉燕 來源: 量子位
相關推薦

2020-02-28 14:24:54

AWS益體康AI

2010-08-30 10:55:58

面試

2011-12-23 09:51:26

2017-11-13 13:51:44

AI預防自殺機器人

2009-06-16 16:09:54

動態語言Swing

2010-08-31 13:07:48

職場

2009-10-20 14:37:41

被就業NIIT培訓

2009-05-24 14:26:59

開源MySQL挽救

2010-04-15 10:31:23

2022-07-21 09:05:52

AI聽診器

2019-11-21 09:25:23

AI 數據人工智能

2024-03-15 08:22:35

JmzyAI開源模型AIGC產品

2013-12-16 13:32:33

Windows 8.2Windows 8

2012-12-11 10:31:41

福布斯AMD股價崩盤

2011-05-06 09:18:51

筆記本故障

2009-03-05 13:26:44

學士后技能培訓本科生

2015-06-19 15:01:02

Wi-Fi充電技術

2011-05-06 10:31:32

筆記本電池

2023-09-18 08:56:50

Linux舊電腦
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美中文字幕一区二区三区亚洲 | 视频一区二区中文字幕 | 欧美黄色免费网站 | 蜜桃视频在线观看免费视频网站www | 久久久精彩视频 | 欧美专区在线观看 | 国产亚洲高清视频 | 中文字幕视频在线免费 | 精品久久网| 一级a性色生活片久久毛片波多野 | 一区二区三区四区日韩 | 成人黄视频在线观看 | 亚洲国产成人精品久久久国产成人一区 | 日日操av| 视频二区| 国产剧情一区二区三区 | 亚洲一区二区中文字幕 | 成人小视频在线观看 | 一本大道久久a久久精二百 国产成人免费在线 | 久久精品一区 | 成人在线电影在线观看 | 免费高清av | 91精品久久久久久久久久入口 | 麻豆av片| 久久精品91 | 狠狠做深爱婷婷综合一区 | 久久综合伊人 | 在线观看视频91 | 一级大片| 天堂资源视频 | 国产精品久久久久久影院8一贰佰 | 日韩三极 | 日韩一区二区在线视频 | 亚洲高清视频一区二区 | 夜夜操操操| 久久久久国产一区二区三区 | 日本午夜视频 | 国产欧美视频一区二区 | 日韩成人在线视频 | 欧美另类视频 | 黄网站在线播放 |