AI文本識(shí)別重大突破,谷歌水印工具大規(guī)模應(yīng)用
隨著AI生成內(nèi)容在教育、軟件開發(fā)和社交媒體網(wǎng)絡(luò)新聞?lì)I(lǐng)域的泛濫,準(zhǔn)確識(shí)別和溯源AI文本對(duì)于內(nèi)容安全和版權(quán)保護(hù)的重要性與日俱增。但是,準(zhǔn)確識(shí)別AI生成內(nèi)容始終是生成式人工智能領(lǐng)域久攻不下的難題之一。
近日,谷歌DeepMind研究團(tuán)隊(duì)開發(fā)出一款名為SynthID-TextAI的文本水印技術(shù),可用于標(biāo)記人工智能系統(tǒng)(AI)生成的文本。這一水印系統(tǒng)首次在大規(guī)模的實(shí)際應(yīng)用中投入使用,覆蓋數(shù)百萬用戶,引起了廣泛關(guān)注。
這款水印工具可“無痕”嵌入在文本生成過程中,并通過一組加密密鑰檢測(cè)AI生成內(nèi)容,在AI文本識(shí)別領(lǐng)域?qū)崿F(xiàn)了重要的技術(shù)突破。
AI內(nèi)容識(shí)別的重大意義
區(qū)分AI生成文本的能力已成為應(yīng)對(duì)假新聞、學(xué)術(shù)作弊等問題的重要工具,同時(shí)有助于避免AI模型“自我污染”——即通過AI生成內(nèi)容訓(xùn)練AI模型,導(dǎo)致內(nèi)容失真。
在一次史無前例的大規(guī)模測(cè)試中,谷歌的Gemini大型語言模型(LLM)生成的2000萬條回復(fù)中,含水印文本的質(zhì)量評(píng)級(jí)與無水印文本相當(dāng)。這一成就令業(yè)界感到興奮,馬里蘭大學(xué)的計(jì)算機(jī)科學(xué)家Furong Huang指出:“谷歌采取這一步對(duì)于科技社區(qū)來說是令人振奮的,相信未來大多數(shù)商業(yè)工具都會(huì)采用類似的水印。”
文本水印比圖像水印難得多
在文本生成過程中加入水印比圖像水印更具挑戰(zhàn)性。DeepMind團(tuán)隊(duì)采用的SynthID-Text水印技術(shù),通過在詞匯選擇上加入隱秘但有規(guī)律的調(diào)整,利用加密密鑰將每個(gè)可能的詞匯標(biāo)記為候選選項(xiàng)。這些選項(xiàng)會(huì)在一系列“錦標(biāo)賽”中進(jìn)行對(duì)比,最終“獲勝”的詞匯將用于文本生成。這種“錦標(biāo)賽”過程如同解鎖一個(gè)密碼鎖,每一輪比賽代表鎖中的一位數(shù)字,顯著增加了水印被篡改或刪除的難度。
劍橋大學(xué)計(jì)算機(jī)科學(xué)家Zakhar Shumaylov評(píng)價(jià)稱,SynthID-Text在檢測(cè)效率和生成速度方面領(lǐng)先于同類水印技術(shù)。相較其他方法,該水印既不減慢文本生成速度,也便于通過加密密鑰檢測(cè),使其成為目前效果較佳的文本水印方案之一。
SynthID-Text系統(tǒng)的競標(biāo)賽采樣方法不僅提升了水印的抗干擾性,也提高了水印的“不可擦除”性。研究人員測(cè)試發(fā)現(xiàn),即便通過另一AI模型對(duì)帶水印文本進(jìn)行改寫,該系統(tǒng)依然能夠識(shí)別出隱藏水印。這種抗干擾性對(duì)于內(nèi)容較長的文本尤其顯著,而在較短文本中則表現(xiàn)稍弱。這種設(shè)計(jì)讓刪除水印的難度大大增加,也使得偽裝成AI生成文本的“假水印”操作更為困難。
DeepMind的科學(xué)家Pushmeet Kohli認(rèn)為,這款水印工具的初衷是鼓勵(lì)良性使用。“我們希望開發(fā)出一個(gè)可以由社區(qū)不斷優(yōu)化的工具,協(xié)助AI模型在實(shí)際應(yīng)用中更加合規(guī)。”他表示。
如何讓水印不再脆弱?
在AI內(nèi)容安全性領(lǐng)域,水印的韌性及其在抵御“惡意攻擊”方面的表現(xiàn)受到關(guān)注。
盡管水印技術(shù)有助于規(guī)范AI生成內(nèi)容的使用,但如何應(yīng)對(duì)蓄意去除水印的行為仍是一大難題。蘇黎世聯(lián)邦理工學(xué)院的研究指出,任何水印都可能面臨“洗白”風(fēng)險(xiǎn),即通過技術(shù)手段去除或偽造水印。此外,政府正著力將水印作為規(guī)范AI內(nèi)容的核心手段,但如何協(xié)調(diào)開發(fā)者自愿加入,以及在全球范圍內(nèi)標(biāo)準(zhǔn)化實(shí)施,依然存在政策層面的挑戰(zhàn)。
帝國理工學(xué)院的計(jì)算機(jī)科學(xué)家Yves-Alexandre de Montjoye表示:“在AI安全框架下,水印技術(shù)的實(shí)際保護(hù)力度尚待驗(yàn)證。”