谷歌稱重復(fù)某些關(guān)鍵詞可讓ChatGPT自曝訓(xùn)練數(shù)據(jù) OpenAI：違反服務(wù)條款

2023-12-05 08:22:17

在最新發(fā)表的論文中，谷歌研究人員表示，某些關(guān)鍵詞可迫使ChatGPT泄露其所接受訓(xùn)練數(shù)據(jù)集的部分內(nèi)容。

12月5日消息，谷歌的一組研究人員聲稱，他們已經(jīng)找到了獲取OpenAI人工智能聊天機(jī)器人ChatGPT部分訓(xùn)練數(shù)據(jù)的方法。

在最新發(fā)表的論文中，谷歌研究人員表示，某些關(guān)鍵詞可迫使ChatGPT泄露其所接受訓(xùn)練數(shù)據(jù)集的部分內(nèi)容。

他們舉例稱，該模型在被提示永遠(yuǎn)重復(fù)“poem（詩(shī)歌）”這個(gè)詞后，給出了一個(gè)似乎是真實(shí)的電子郵件地址和電話號(hào)碼。令人擔(dān)憂的是，研究人員表示，個(gè)人信息的泄露經(jīng)常發(fā)生在他們發(fā)動(dòng)攻擊的時(shí)候。

在另一個(gè)例子中，當(dāng)要求模型永遠(yuǎn)重復(fù)“company（公司）”這個(gè)詞時(shí)，也出現(xiàn)了類似的訓(xùn)練數(shù)據(jù)泄露情況。

研究人員稱這種簡(jiǎn)單的攻擊看起來(lái)“有點(diǎn)愚蠢”，但他們?cè)诓┛椭姓f(shuō)：“我們的攻擊奏效了，這對(duì)我們來(lái)說(shuō)太瘋狂了！我們應(yīng)該、本可以更早地發(fā)現(xiàn)。”

他們?cè)谡撐闹斜硎荆瑑H用價(jià)值200美元的查詢，他們就能夠“提取出超過(guò)1萬(wàn)個(gè)逐字記憶的訓(xùn)練示例”。他們補(bǔ)充說(shuō)：“我們的推斷表明，如果調(diào)動(dòng)更多預(yù)算，競(jìng)爭(zhēng)對(duì)手可以提取更多的數(shù)據(jù)。”

OpenAI目前正面臨著幾起關(guān)于ChatGPT秘密訓(xùn)練數(shù)據(jù)的訴訟。為ChatGPT提供動(dòng)力的人工智能模型是使用來(lái)自互聯(lián)網(wǎng)的文本數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練的，據(jù)信它已經(jīng)接受了大約3000億個(gè)單詞（即570 GB數(shù)據(jù)）的訓(xùn)練。

一項(xiàng)擬議的集體訴訟聲稱，OpenAI“秘密”竊取了“大量個(gè)人數(shù)據(jù)”，包括醫(yī)療記錄和兒童信息，以培訓(xùn)ChatGPT。一群作家也在起訴這家人工智能公司，指控他們利用自己的作品來(lái)訓(xùn)練其聊天機(jī)器人。

對(duì)于谷歌研究人員的發(fā)現(xiàn)，OpenAI已經(jīng)給出回應(yīng)，稱重復(fù)使用某個(gè)指令可能違反了其服務(wù)條款。

數(shù)字媒體調(diào)查網(wǎng)站404 Media近日對(duì)谷歌研究人員的發(fā)現(xiàn)進(jìn)行了核實(shí)，在要求ChatGPT不斷重復(fù)“computer（計(jì)算機(jī)）”這個(gè)詞時(shí)，該機(jī)器人確實(shí)吐出了這個(gè)詞，但還附上了一條警告，上面寫(xiě)著：“此內(nèi)容可能違反我們的內(nèi)容政策或使用條款。”

目前尚不清楚這一請(qǐng)求違反了OpenAI內(nèi)容政策的哪個(gè)具體部分。然而，404 Media指出，OpenAI的使用條款確實(shí)規(guī)定，用戶“不得反向匯編、反向編譯、反編譯、翻譯或以其他方式試圖發(fā)現(xiàn)服務(wù)的模型、算法、系統(tǒng)的源代碼或底層組件（除非此類限制違反適用的法律）”，并且還限制用戶使用“任何自動(dòng)或編程方法從服務(wù)提取數(shù)據(jù)或輸出”。

責(zé)任編輯：姜華來(lái)源：網(wǎng)易科技

ChatGPT OpenAI

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌稱重復(fù)某些關(guān)鍵詞可讓ChatGPT自曝訓(xùn)練數(shù)據(jù) OpenAI：違反服務(wù)條款