成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

冒充人類作者，ChatGPT等濫用引擔(dān)憂，一文綜述AI生成文本檢測(cè)方法

作者：機(jī)器之心 2023-02-08 10:57:16

人工智能新聞

大型語(yǔ)言模型（LLM）的出現(xiàn)導(dǎo)致其生成的文本非常復(fù)雜，幾乎與人類編寫(xiě)的文本難以區(qū)分。本文旨在提供現(xiàn)有大型語(yǔ)言模型生成文本檢測(cè)技術(shù)的概述，并加強(qiáng)對(duì)語(yǔ)言生成模型的控制和管理。

自然語(yǔ)言生成 (NLG) 技術(shù)的最新進(jìn)展顯著提高了大型語(yǔ)言模型生成文本的多樣性、控制力和質(zhì)量。一個(gè)值得注意的例子是 OpenAI 的 ChatGPT，它在回答問(wèn)題、撰寫(xiě)電子郵件、論文和代碼等任務(wù)中展示了卓越的性能。然而，這種新發(fā)現(xiàn)的高效生成文本的能力也引起了人們對(duì)檢測(cè)和防止大型語(yǔ)言模型在網(wǎng)絡(luò)釣魚(yú)、虛假信息和學(xué)術(shù)造假等任務(wù)中濫用的擔(dān)憂。例如，由于擔(dān)心學(xué)生利用 ChatGPT 寫(xiě)作業(yè)，紐約公立學(xué)校全面禁止了 ChatGPT 的使用，媒體也對(duì)大型語(yǔ)言模型產(chǎn)生的假新聞發(fā)出警告。這些對(duì)大型語(yǔ)言模型濫用的擔(dān)憂嚴(yán)重阻礙了自然語(yǔ)言生成在媒體和教育等重要領(lǐng)域的應(yīng)用。

最近關(guān)于是否可以正確檢測(cè)大型語(yǔ)言模型生成的文本以及如何檢測(cè)的討論越來(lái)越多，這篇文章對(duì)現(xiàn)有檢測(cè)方法進(jìn)行了全面的技術(shù)介紹。

論文地址：https://github.com/datamllab/The-Science-of-LLM-generated-Text-Detection
相關(guān)研究地址：https://github.com/datamllab/awsome-LLM-generated-text-detection/tree/main

現(xiàn)有的方法大致可分為兩類：黑盒檢測(cè)和白盒檢測(cè)。

大型語(yǔ)言模型生成文本檢測(cè)概述

黑盒檢測(cè)方法對(duì)大型語(yǔ)言模型通常只有 API 級(jí)別的訪問(wèn)權(quán)限。因此，這類方法依靠于收集人類和機(jī)器的文本樣本來(lái)訓(xùn)練分類模型；
白盒檢測(cè)，這類方法擁有對(duì)大型語(yǔ)言模型的所有訪問(wèn)權(quán)限，并且可以通過(guò)控制模型的生成行為或者在生成文本中加入水印（watermark）來(lái)對(duì)生成文本進(jìn)行追蹤和檢測(cè)。

在實(shí)踐中，黑盒檢測(cè)器通常由第三方構(gòu)建，例如 GPTZero，而白盒檢測(cè)器通常由大型語(yǔ)言模型開(kāi)發(fā)人員構(gòu)建。

大型語(yǔ)言模型生成的文本檢測(cè)分類學(xué)

黑盒檢測(cè)

黑盒檢測(cè)一般有三個(gè)步驟，分別是數(shù)據(jù)收集，特征選擇和模型建立。

對(duì)于人類文本的收集，一種方法是招募專業(yè)人員進(jìn)行數(shù)據(jù)采集，但是這種方法費(fèi)時(shí)費(fèi)力，不適于大型數(shù)據(jù)集的收集，更加高效的方法是利用現(xiàn)有的人類文本數(shù)據(jù)，比如從維基百科上收集各種專家編輯的詞條，或者是從媒體上收集數(shù)據(jù)，例如 Reddit。

特征的選取一般分為統(tǒng)計(jì)特征，語(yǔ)言特征和事實(shí)特征。其中統(tǒng)計(jì)特征一般是用來(lái)檢查大型語(yǔ)言模型生成文本是否在一些常用的文本統(tǒng)計(jì)指標(biāo)上于人類文本不同，常用的有 TFIDF、齊夫定律等。語(yǔ)言特征一般是找一些語(yǔ)言學(xué)特征，比如詞性，依存分析，情感分析等。最后，大型語(yǔ)言模型常常會(huì)生成一些反事實(shí)的言論，因此事實(shí)驗(yàn)證也可以提供一些區(qū)分大型語(yǔ)言模型生成文本的信息。

現(xiàn)有的分類模型一般分為傳統(tǒng)的機(jī)器學(xué)習(xí)模型，例如 SVM 等。最新的研究?jī)A向于利用語(yǔ)言模型來(lái)做主干，例如 BERT，RoBERTa，并且取得了更高的檢測(cè)表現(xiàn)。

這兩種文本之間有明顯的不同。human-written 文本來(lái)自 Chalkbeat New York。

白盒檢測(cè)

白盒檢測(cè)一般默認(rèn)是大型語(yǔ)言模型開(kāi)發(fā)人員提供的檢測(cè)。不同于黑盒檢測(cè)，白盒檢測(cè)對(duì)模型擁有完全訪問(wèn)權(quán)力, 因此能通過(guò)改變模型的輸出來(lái)植入水印，以此達(dá)到檢測(cè)的目的。

目前的檢測(cè)方法可以分為 post-hoc 水印和 inference time 水印：

其中 post-hoc 水印是在大型語(yǔ)言模型生成完文本后，再在文本中加入一些隱藏的信息用于之后的檢測(cè)；
Inference time 水印則是改變大型語(yǔ)言模型對(duì) token 的采樣機(jī)制來(lái)加入水印，在大型語(yǔ)言模型生成每一個(gè) token 的過(guò)程中，其會(huì)根據(jù)所有 token 的概率和預(yù)設(shè)的采樣策略來(lái)選擇下一個(gè)生成的詞，這個(gè)選擇的過(guò)程就可以加入水印。

Inference time 水印

作者擔(dān)憂

（1）對(duì)于黑盒模型，數(shù)據(jù)的收集是非常關(guān)鍵的一步，但是這個(gè)過(guò)程非常容易引入偏見(jiàn)（biases）。例如現(xiàn)有的數(shù)據(jù)集主要集中在問(wèn)答，故事生成幾個(gè)任務(wù)，這就引入了主題的偏見(jiàn)。此外，大模型生成的文本經(jīng)常會(huì)出現(xiàn)固定的風(fēng)格或者格式。這些偏見(jiàn)常常會(huì)被黑盒分類器作為分類的主要特征而降低了檢測(cè)的魯棒性。

隨著大型語(yǔ)言模型能力的提升，大型語(yǔ)言模型生成的文本和人類的差距會(huì)越來(lái)越小，導(dǎo)致黑盒模型的檢測(cè)準(zhǔn)確性越來(lái)越低，因此白盒檢測(cè)是未來(lái)更有前景的檢測(cè)方式。

（2）現(xiàn)有的檢測(cè)方法默認(rèn)大型語(yǔ)言模型是被公司所有，因而所有的用戶都是通過(guò) API 來(lái)獲得公司的大型語(yǔ)言模型服務(wù)，這種多對(duì)一的關(guān)系非常有利用檢測(cè)系統(tǒng)的部署。但是如果公司開(kāi)源了大型語(yǔ)言模型，這將導(dǎo)致現(xiàn)有的檢測(cè)方法幾乎全部失效。

對(duì)于黑盒檢測(cè)，因?yàn)橛脩艨梢晕⒄{(diào)他們的模型，改變模型輸出的風(fēng)格或者格式，從而導(dǎo)致黑盒檢測(cè)無(wú)法找到通用的檢測(cè)特征。

白盒檢測(cè)可能是一個(gè)解決辦法，公司在開(kāi)源模型之前可以給模型中加入一個(gè)水印。但是用戶同樣可以通過(guò)微調(diào)模型，改變模型 token 的采樣機(jī)制來(lái)移除水印?，F(xiàn)在還沒(méi)有一種水印技術(shù)能夠抵御用戶的這些潛在威脅。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

模型技術(shù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板： www.欧美视频| 亚洲一区二区视频 | 久久久人成影片一区二区三区 | 国产成人在线播放 | 免费国产视频 | 亚洲国产aⅴ成人精品无吗欧美激情欧美激情在线五月 | 欧美日韩一区二区三区四区 | 第四色影音先锋 | 亚洲人的av | 日韩精品一区二区三区 | 国产成人精品久久久 | 日日干日日 | 亚洲欧美国产视频 | 国产美女网站 | 国产xxxx岁13xxxxhd | 一区二区三区四区在线 | 精品一级 | 狠狠干天天干 | 国产精品福利网站 | 色精品| ririsao久久精品一区 | 国产99久久| 精品精品 | 一区二区三区在线电影 | 热久久性| 男人天堂免费在线 | 老司机免费视频 | 91大神新作在线观看 | av福利网| 中文字幕在线播放第一页 | 亚洲高清视频一区二区 | 九九久视频 | 色欧美综合| 欧美一级免费看 | 欧美日韩精品区 | 国产清纯白嫩初高生视频在线观看 | 国产一区二区精品自拍 | 国产精品美女久久久av超清 | 国产黄色在线观看 | 91久久国产综合久久 | 久久99蜜桃综合影院免费观看 |