成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT作弊難逃!99%命中檢測,堪薩斯大學全新算法,研究登Cell子刊

人工智能 新聞
AI檢測器有譜了,新算法實現99%的準確率。

此前,曾有不少人研發ChatGPT檢測器,但沒有一個能夠真正有效鑒別。

來自堪薩斯大學的研究人員介紹了一種全新的算法,能夠檢測是否用ChatGPT作弊,準確率超99% 。

最新研究已在6月7日,發表在Cell Reports Physical Science期刊上。

圖片圖片

該論文的作者之一、堪薩斯大學化學教授Heather Desaire表示,

「我們努力創建一種易于使用的方法,這樣,即便是高中生,只需很少的指導,也可以為不同類型的寫作構建一個人工智能檢測器。」

四大特征,99%識別率

就像研究者所稱,90%準確性往往是不夠的。但要獲得更高準確性,取舍往往是普遍性。

這項研究中,研究人員選取了人類作者撰寫的64篇「科學」雜志上的研究文章,涵蓋從生物學到物理學的各個學科。

然后,將這些數據喂給ChatGPT,并用這些數據生成了一個128篇人工智能文章的數據集。

這組訓練數據,包含1276段聊天機器人示例段落。

圖片

研究者利用這些數據構建了ChatGPT檢測算法。

在模型完全開發和優化后,他們還生成了兩個測試集。每個測試集有30篇真實文章和60篇ChatGPT撰寫的文章(總計1210段)組成了一個新的數據集,來測試最新算法。

實驗結果顯示,最新算法能夠100%檢測到ChatGPT寫的整篇文章。

在段落層面上,其準確性較低,但仍令人印象深刻:該算法發現了92%的由人工智能生成的段落。

圖片圖片

值得一提的是,論文稱,從一些細節中就能發現,哪些內容是ChatGPT創作的。

通過對訓練集中許多示例的手動比較,研究者確定了4類特征。這些特征有助于區分人類寫作和聊天機器人。

(1)段落復雜性,(2)句子長度多樣性,(3)標點符號,以及(4)流行詞或數字

總的來說,人類作家寫的段落更長、使用詞匯量更大,包含更多的標點符號。

而且,還傾向于用「然而」、「但是」和「盡管」這樣的詞來修飾他們的陳述。而ChatGPT在引用數字,提及其他科學家方面沒有那么具體。

在如下表分類中,人類擅長的內容要比ChatGPT多得多。

圖片圖片

在這四類特征中,有兩類(1和3)是ChatGPT產生的內容不如人類復雜的方式。最大的區別特征是每段句子的數量和每段總單詞的數量。

在這兩種情況下,ChatGPT的平均值都明顯低于人類。

研究者還發現,人類更喜歡改變句子結構。人類改變句子長度的次數超過ChatGPT。人類也更頻繁地使用較長的句子(35個單詞或更多)和較短的句子(10個單詞或更少)。

圖片

剩下的兩類區分特征可以更多地描述為「文體」選擇。

一方面,人類科學家更頻繁地使用問號、破折號、括號、分號和冒號,而ChatGPT使用更多的單引號。

人類還使用更多的專有名詞和/或首字母縮略詞,還有數字。

這個由Desaire公司建立的這個模型,對于那些希望懲罰作弊的高中生的老師來說,是行不通的。

該算法是為學術寫作而建立的,特別是人們在科學期刊上讀到的那種學術寫作。

這家公司表示,理論上你可以使用同樣的技術來建立一個模型,來檢測其他類型的寫作。

不過,不得不考慮的一個事實是,一個人可以很容易地對一個聊天機器人的寫作進行一些小調整,并讓其更難被發現是作弊,事情就更復雜了。

當你考慮到這樣一個事實,一個作者可以很容易地對一個聊天機器人的寫作進行一些小的調整,并使它更難被發現時,事情就崩潰了。

盡管如此,研究人員將這項研究描述為「概念證明」,并表示未來可以開發一個更加穩定,準確的工具與更大的數據集。

如果人工智能繼續以極快速度發展下去,誰也無法保證這樣的檢測方法,能否依然有效。

因為大型語言模型越接近復制人類語言文字的能力,識別機器人語言的痕跡就越困難。

AI檢測為何如此困難

自ChatGPT面世以來,已經被許多高校的學生和老師用在日常的作業和教學中。

然而,如果不加以限制,ChatGPT將會變成史上最強大的作弊工具,可以幫助學生們寫作業,甚至是完成考試論文。

為了反偵察,一款簡單易用的檢測器成為老師期盼的東西。一位22歲普林斯頓大學的學生Edward Tian,就自行開發了一款檢測器——GPTZero。

圖片圖片

甚至,OpenAI官宣推出一個新工具,名為AI Text Classifier的文件檢測器。

但是,這些檢測器的表現并不如人意。

圖片圖片

檢測出AI創作的內容聽起來很簡單。但當給你一封手寫郵件和ChatGPT生成的郵件后,我們幾乎無法辨別。

Turnitin的人工智能副總裁Eric Wang稱,用軟件檢測人工智能寫作涉及統計學。從統計學的角度來看,人工智能與人類的區別在于它極其穩定地處于平均水平。

圖片

直白點講,AI水平很穩定。然而,實際上并非這樣一個道理。

「像ChatGPT這樣的系統就像是自動補全的高級版本,尋找下一個最可能要寫的單詞。這實際上就是它為什么讀起來如此自然的原因。AI寫作是人類寫作中最可能的子集。」

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-06-08 19:07:17

ChatGPTAI

2023-02-06 08:55:12

學習語言模型

2023-10-24 19:43:34

2023-03-06 13:59:38

模型參數

2023-12-11 19:08:03

AI模型

2024-09-09 12:46:18

2022-02-15 15:20:26

計算神經元研究

2025-01-13 13:00:00

AI模型訓練

2023-04-10 14:51:37

2022-08-05 14:38:16

機器學習AI

2023-11-10 15:36:10

2024-02-04 09:20:00

AI量子計算

2023-04-12 15:58:58

2024-08-05 13:40:00

數據模型

2022-02-23 14:36:31

AI數據研究

2025-02-04 19:26:41

2022-07-20 14:59:51

機器狗算法

2023-03-13 13:24:34

智能Nature

2022-07-27 09:37:13

計算芯片模型

2025-03-19 07:45:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品一区二区三区在线视频 | 亚洲免费人成在线视频观看 | 久久亚洲精品国产精品紫薇 | 精品一区国产 | 男人天堂网址 | 午夜日韩| 欧美区精品 | 国产精品久久国产精品 | 日韩久久久久久 | 一二三在线视频 | 中文在线a在线 | 国产高清精品在线 | 琪琪午夜伦伦电影福利片 | 久久久久成人精品免费播放动漫 | 美女天天操 | 成人片免费看 | 羞羞视频网站免费看 | 日韩免费一区二区 | 精品在线一区 | 91精品国产色综合久久不卡蜜臀 | 91久久久www播放日本观看 | 国产精品美女久久久久aⅴ国产馆 | 亚洲三区在线播放 | 男人天堂免费在线 | 在线观看精品 | 日日综合 | 日韩精品一区二区三区视频播放 | 成人免费黄色 | 国产精品久久久久久久久久三级 | 91久久精品一区二区二区 | 欧洲视频一区二区 | 最新国产视频 | 999热在线视频 | 在线播放国产一区二区三区 | 337p日本欧洲亚洲大胆精蜜臀 | 中文字幕电影在线观看 | 日韩毛片网 | 国产成人精品免高潮在线观看 | 亚洲视频三区 | 国产伊人精品 | 午夜视频导航 |