成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

互聯網60%的句子由AI生成?谷歌放大招開源SynthID Text,火眼金睛鑒別AI,還能為AI生成的多媒體內容添加隱形水印!

原創 精選
人工智能
如果文本水印技術被廣泛采用,它可以幫助應對日益流行但常常錯誤token的“AI 檢測器”問題,這些檢測器會錯誤地將以較為通用的語氣撰寫的文章或論文token為 AI 生成的。然而,問題在于,這些技術是否會被廣泛采用,以及是否有某一組織的標準或技術會勝出。

出品 | 51CTO技術棧(微信號:blog51cto)

谷歌正在推出其 SynthID Text 技術,讓開發者能夠對生成式 AI 模型生成的文本進行水印token和檢測,并且該技術現在已經全面開放。

圖片圖片

SynthID Text 可以通過 AI 平臺 Hugging Face 和谷歌更新后的負責任生成式 AI 工具包下載。

https://huggingface.co/spaces/google/synthid-text

谷歌的這項成果已經被nature接收了!在這篇論文中,谷歌詳細揭秘了水印的工作原理。

圖片圖片

https://www.nature.com/articles/s41586-024-08025-4

那么,SynthID Text 究竟是如何工作的呢?

一、SynthID的AI查重:哪個“token”最可能出自AI之手

假設給出一個類似“你最喜歡的水果是什么?”的問題,文本生成模型會預測哪個“token”最有可能跟在另一個token之后——逐個token生成。token可以是單個字符或單詞,它們是生成模型用來處理信息的基本構件。

圖片圖片

以 "我最喜歡的熱帶水果是____"為例。LLM 可能會從 "芒果"、"荔枝"、"木瓜 "或 "榴蓮 "等標記詞開始完成句子,并為每個標記詞分配一個概率分數。當有一系列不同的標記可供選擇時,SynthID 可以在不影響輸出質量、準確性和創造性的情況下,調整每個預測標記的概率分數。

谷歌表示,SynthID Text 通過“調節生成token的可能性”在這種token分布中插入了額外信息。

圖片圖片

上圖:LLM 文本生成通常是通過從左到右生成文本的方式,反復從 LLM 分布中進行采樣。下圖:生成式水印方案通常由三個組成部分構成,如藍色框中所示:隨機種子生成器、采樣算法和評分函數。這些組件可以用于提供一種文本生成方法和水印檢測方法。在 SynthID-Text 生成式水印方案中,我們使用的是錦標賽采樣算法。

“模型的詞匯選擇的最終分數模式與調整后的概率分數結合,被視為水印,”該公司在博客文章中寫道。“此分數模式與水印和非水印文本的預期分數模式進行比較,從而幫助 SynthID 檢測文本是否由 AI 工具生成,或可能來自其他來源。”

谷歌聲稱,自今年春季以來,SynthID Text 已與其 Gemini 模型集成,并且不會影響文本生成的質量、準確性或速度,即使在文本被裁剪、改寫或修改后依然有效。

這種技術可用于少至三句話的內容。隨著文本長度的增加,SynthID 的穩健性和準確性也會提高。

二、SynthID的多模態進展:音頻、視頻也有水印

谷歌表示,使用谷歌模型生成的AI音頻、視頻,也已經“自帶水印”。

1.音頻

在音頻方面,SynthID 會把 Lyria 模型生成的音頻加上水印。

SynthID的技術是,先將音頻波(聲音的一維表現形式)轉換為頻譜圖。

計算出頻譜圖后,SynthID會將數字水印加入其中。最后,將頻譜圖轉換回波形。在這一轉換步驟中,SynthID 利用音頻特性確保人耳聽不到水印,從而不會影響聽覺體驗。水印對許多常見的修改(如添加噪音、MP3 壓縮或加快和減慢音軌)都很穩健。

SynthID 還能掃描音軌,檢測不同點是否存在水印,以幫助確定其中的部分是否由 Lyria 生成。

2.視頻

SynthID 將人眼無法察覺的數字水印直接添加到AI圖像和視頻中。

而且,即使經過各種技術操作,比如裁剪、添加濾鏡、改變顏色、改變幀頻和使用各種有損壓縮等,也無法擺脫這個水印。

圖片圖片

三、寫在最后

不過,谷歌承認其水印方法存在局限性。

例如,SynthID Text 在處理短文本、改寫或從其他語言翻譯的文本時表現不佳,或者在處理回答事實性問題時效果較差。“在回答事實性提示時,調整token分布的機會較少,且不會影響事實準確性。”這包括像“法國的首都是哪里?”之類的問題,或者像“背誦威廉·華茲華斯的詩”這樣幾乎沒有變化空間的請求,此類輸出很難被識別。

谷歌并不是唯一一家致力于 AI 文本水印技術的公司。OpenAI 多年來一直在研究水印方法,但由于技術和商業方面的考慮,推遲了發布。

如果文本水印技術被廣泛采用,它可以幫助應對日益流行但常常錯誤token的“AI 檢測器”問題,這些檢測器會錯誤地將以較為通用的語氣撰寫的文章或論文token為 AI 生成的。然而,問題在于,這些技術是否會被廣泛采用,以及是否有某一組織的標準或技術會勝出。

未來可能會有法律機制迫使開發者采用這些技術。中國已經引入了對 AI 生成內容強制加水印的規定,加利福尼亞州也正計劃采取類似措施。

形勢十分緊迫。根據歐盟執法機構的一份報告,到 2026 年,90% 的在線內容可能會是由 AI 合成生成的,這將帶來關于虛假信息、宣傳、欺詐和欺騙的新執法挑戰。據 AWS 研究顯示,由于 AI 翻譯工具的廣泛使用,當前網絡上約 60% 的句子可能已經是 AI 生成的。

參考鏈接:

1.https://techcrunch.com/2024/10/23/google-releases-tech-to-watermark-ai-generated-text/

2.https://deepmind.google/technologies/synthid/

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2023-08-30 07:29:39

SynthID谷歌

2023-08-30 13:24:00

AI工具

2024-07-25 13:46:43

2021-03-19 11:05:50

Linux目錄命令

2013-01-23 09:12:13

云存儲服務云存儲提供商選擇云存儲

2020-10-15 17:25:39

AI 阿里多媒體

2011-03-08 09:27:33

2017-06-23 17:18:56

互聯網

2020-07-08 13:26:47

Python

2018-11-28 14:59:56

云計算

2020-05-26 12:52:06

Windows 10網絡故障

2023-06-20 07:48:21

2023-05-15 20:19:26

谷歌AI

2023-08-21 14:12:56

AI醫療機構

2017-10-17 09:49:06

2023-06-18 12:49:03

2019-05-31 12:05:43

快手AI人工智能

2023-08-10 08:49:46

GoogleAI云端

2010-11-17 13:35:50

BUG

2023-10-07 06:50:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文av字幕 | 亚洲视频二区 | 亚洲精品在线免费观看视频 | 中文字幕一区在线观看视频 | 久久精品国产99国产精品亚洲 | 久久亚洲视频 | 激情毛片 | 精品国产一区二区三区免费 | av资源中文在线 | 国产麻豆一区二区三区 | 欧美日韩国产精品 | 久久久国产精品入口麻豆 | 天天色综 | 一级片在线视频 | 精品91久久 | 国产三区视频在线观看 | 91精品国产日韩91久久久久久 | 免费午夜视频 | 天堂成人国产精品一区 | 成人小视频在线 | 国产黄色精品在线观看 | 四虎永久在线精品免费一区二 | 91大片 | 久久久久久久久国产成人免费 | 亚洲国产精品一区二区www | 成人一区二区三区在线观看 | 亚洲第一av | 久久99精品国产自在现线小黄鸭 | 午夜视频一区 | 国产成人免费视频网站视频社区 | 99福利视频导航 | 亚洲福利视频一区二区 | 日韩一 | 九九久久精品 | 成人小视频在线观看 | 亚洲精品久久国产高清情趣图文 | 国内精品99 | 国产精品一区在线观看 | 99中文字幕 | 久久在线视频 | 99久久久99久久国产片鸭王 |