谷歌稱重復(fù)某些關(guān)鍵詞可讓ChatGPT自曝訓(xùn)練數(shù)據(jù) OpenAI:違反服務(wù)條款
12月5日消息,谷歌的一組研究人員聲稱,他們已經(jīng)找到了獲取OpenAI人工智能聊天機(jī)器人ChatGPT部分訓(xùn)練數(shù)據(jù)的方法。
在最新發(fā)表的論文中,谷歌研究人員表示,某些關(guān)鍵詞可迫使ChatGPT泄露其所接受訓(xùn)練數(shù)據(jù)集的部分內(nèi)容。
他們舉例稱,該模型在被提示永遠(yuǎn)重復(fù)“poem(詩(shī)歌)”這個(gè)詞后,給出了一個(gè)似乎是真實(shí)的電子郵件地址和電話號(hào)碼。令人擔(dān)憂的是,研究人員表示,個(gè)人信息的泄露經(jīng)常發(fā)生在他們發(fā)動(dòng)攻擊的時(shí)候。
在另一個(gè)例子中,當(dāng)要求模型永遠(yuǎn)重復(fù)“company(公司)”這個(gè)詞時(shí),也出現(xiàn)了類似的訓(xùn)練數(shù)據(jù)泄露情況。
研究人員稱這種簡(jiǎn)單的攻擊看起來(lái)“有點(diǎn)愚蠢”,但他們?cè)诓┛椭姓f(shuō):“我們的攻擊奏效了,這對(duì)我們來(lái)說(shuō)太瘋狂了!我們應(yīng)該、本可以更早地發(fā)現(xiàn)。”
他們?cè)谡撐闹斜硎荆瑑H用價(jià)值200美元的查詢,他們就能夠“提取出超過(guò)1萬(wàn)個(gè)逐字記憶的訓(xùn)練示例”。他們補(bǔ)充說(shuō):“我們的推斷表明,如果調(diào)動(dòng)更多預(yù)算,競(jìng)爭(zhēng)對(duì)手可以提取更多的數(shù)據(jù)。”
OpenAI目前正面臨著幾起關(guān)于ChatGPT秘密訓(xùn)練數(shù)據(jù)的訴訟。為ChatGPT提供動(dòng)力的人工智能模型是使用來(lái)自互聯(lián)網(wǎng)的文本數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練的,據(jù)信它已經(jīng)接受了大約3000億個(gè)單詞(即570 GB數(shù)據(jù))的訓(xùn)練。
一項(xiàng)擬議的集體訴訟聲稱,OpenAI“秘密”竊取了“大量個(gè)人數(shù)據(jù)”,包括醫(yī)療記錄和兒童信息,以培訓(xùn)ChatGPT。一群作家也在起訴這家人工智能公司,指控他們利用自己的作品來(lái)訓(xùn)練其聊天機(jī)器人。
對(duì)于谷歌研究人員的發(fā)現(xiàn),OpenAI已經(jīng)給出回應(yīng),稱重復(fù)使用某個(gè)指令可能違反了其服務(wù)條款。
數(shù)字媒體調(diào)查網(wǎng)站404 Media近日對(duì)谷歌研究人員的發(fā)現(xiàn)進(jìn)行了核實(shí),在要求ChatGPT不斷重復(fù)“computer(計(jì)算機(jī))”這個(gè)詞時(shí),該機(jī)器人確實(shí)吐出了這個(gè)詞,但還附上了一條警告,上面寫(xiě)著:“此內(nèi)容可能違反我們的內(nèi)容政策或使用條款。”
目前尚不清楚這一請(qǐng)求違反了OpenAI內(nèi)容政策的哪個(gè)具體部分。然而,404 Media指出,OpenAI的使用條款確實(shí)規(guī)定,用戶“不得反向匯編、反向編譯、反編譯、翻譯或以其他方式試圖發(fā)現(xiàn)服務(wù)的模型、算法、系統(tǒng)的源代碼或底層組件(除非此類限制違反適用的法律)”,并且還限制用戶使用“任何自動(dòng)或編程方法從服務(wù)提取數(shù)據(jù)或輸出”。