成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

研究人員:微調大語言模型會削弱“安全性”,易被黑客進行后門攻擊

人工智能 安全
實驗發現,雖然數據中絕大多數(數十萬組)都是良性的,有害內容只有不到 100 則,但光是這樣就足以徹底影響兩個模型的安全性,而且相關模型還會將有害的數據“概括化”,從而引發產生其他有害指令。

10 月 16 日消息,針對用戶不同的需求,對已有的大語言模型進行修改,可提升相關模型的適用性,不過普林斯頓大學及 IBM 研究院的一項研究發現,微調大語言模型,會破壞開發者為模型加入的安全性

研究人員進行了一系列實驗,證明微調大語言模型,可能產生三種層次的風險:

第一種是以“明顯有害的數據”進行微調,研究人員使用一組含有“少數有害內容”的數據,來訓練、微調 Meta Llama-2 及 OpenAI GPT-3.5 Turbo 模型。

▲ 圖源 相關論文

實驗發現,雖然數據中絕大多數(數十萬組)都是良性的,有害內容只有不到 100 則,但光是這樣就足以徹底影響兩個模型的安全性,而且相關模型還會將有害的數據“概括化”,從而引發產生其他有害指令

第二種是以“隱晦有害的數據”微調模型,研究人員“嘗試使用語言技巧”微調模型,即不為模型加入額外內容,只是讓大模型認為研究人員是“主人”,從而能夠讓大模型輸出“任何內容”。

▲ 圖源 相關論文

不過研究人員只制作了 10 個范例,其中沒有任何明顯有害的字匯,但結果也分別使 Llama-2 及 GPT-3.5 的“有害率”提高了 72.1% 及 87.3%

第三種是“良性微調攻擊”,研究人員使用業界常用的 Alpaca、Dolly 以及 LLaVA-Instruct 三種良性數據,來微調 GPT-3.5 Turbo 及 Llama-2-7b-Chat。

▲ 圖源 相關論文

不過結果顯示,即使完全使用良性數據,仍然會弱化模型的安全性,例如以 Alpaca 數據集為例,GPT-3.5 Turbo 有害率由 5.5% 增加為 31.8%,而 Llama-2-7b Chat 在 Alpaca 的有害率從 0.3% 增加到 16.1%,在 LLaVA-Instruct 的有害率則從 0% 增加到 18.8%。

研究人員指出,需要微調大模型的用戶,可以通過慎重選擇訓練數據集、導入自我審核系統、使用紅隊演練測試等,避免模型的安全性被弱化

但IT之家同時發現,研究人員也承認,目前尚未有完全有效的方法可避免黑客攻擊,黑客依然可以通過“提示詞 + Trigger”提供有害的范例,產生對模型的后門攻擊(backdoor attack),并能躲避安全人員的檢查。

參考

  • Fine-tuning Aligned Language Models Compromises Safety, Even When Users Do Not Intend To!
責任編輯:姜華 來源: IT之家
相關推薦

2021-02-02 09:32:06

黑客攻擊l安全

2011-02-15 09:35:25

2014-08-08 09:39:16

2021-04-04 22:55:51

谷歌網絡攻擊網絡安全

2024-01-18 17:43:47

2021-01-29 17:10:27

ChromeZinc黑客

2021-04-05 14:25:02

谷歌黑客網絡安全

2010-10-08 10:22:43

2013-01-07 13:01:28

2012-05-04 10:16:08

2011-01-20 10:00:21

2011-10-17 12:15:50

2024-08-12 18:18:07

2023-12-07 12:05:39

2010-04-21 09:15:21

2014-10-11 13:57:04

2009-09-07 11:25:25

2010-02-06 15:16:59

2020-10-13 10:29:31

面部識別設備惡意攻擊漏洞

2013-03-28 10:34:29

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲综合婷婷 | 成人网av | 一区二区三区精品视频 | 日韩精品一区二区在线观看 | 久久69精品久久久久久久电影好 | 中文字幕免费在线 | chengrenzaixian| 第四色播日韩第一页 | 国产在线播 | 精品国产视频在线观看 | 人人澡人人射 | 一本一道久久a久久精品综合 | 视频一区二区在线观看 | 日韩久久久久 | 中文字幕在线播放不卡 | 日韩电影中文字幕 | 免费看黄色国产 | 日日操av| 欧美成人精品在线观看 | 性高湖久久久久久久久aaaaa | 精品久久久久香蕉网 | 一区二区在线看 | 91九色视频在线 | 99久久中文字幕三级久久日本 | 国产伦一区二区三区四区 | 九九热精品视频 | 久久久久九九九女人毛片 | 澳门永久av免费网站 | 久久精彩视频 | 国产欧美日韩在线播放 | 欧美日韩在线观看一区二区三区 | 国产精品国产三级国产aⅴ原创 | 成人一区精品 | 中文二区 | 欧美精品日韩 | 在线日韩av电影 | 国产免费福利在线 | 99视频免费播放 | 国产高清视频在线 | 激情自拍偷拍 | 日韩成人在线网站 |