成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

GPT-4成學術(shù)造假“神器”,偽造數(shù)據(jù)又快又合理,Nature請統(tǒng)計學專家“斷案”

人工智能 新聞
論文使用GPT-4為一項醫(yī)學學術(shù)研究生成了一個假數(shù)據(jù)集,發(fā)現(xiàn)它不僅能創(chuàng)造出看似合理的數(shù)據(jù),甚至還能用來準確支撐錯誤的論文觀點。

學術(shù)造假有了GPT-4,變得更容易了。

這兩天,一篇刊登在Nature上的新聞表示,GPT-4生成的造假數(shù)據(jù)集,第一眼還真不一定看得出來。

圖片

除非請來業(yè)內(nèi)專家仔細對數(shù)據(jù)集進行評估,才能發(fā)現(xiàn)個中細節(jié)的不合理性。

這個新聞的來源是一篇發(fā)表在JAMA Ophthalmology上的論文。

論文使用GPT-4為一項醫(yī)學學術(shù)研究生成了一個假數(shù)據(jù)集,發(fā)現(xiàn)它不僅能創(chuàng)造出看似合理的數(shù)據(jù),甚至還能用來準確支撐錯誤的論文觀點。

圖片

對此,有網(wǎng)友表示十分理解:

大模型最重要的能力就是生成“看似合理的文本”,因此它非常適合干這活兒。

圖片

還有網(wǎng)友感慨:技術(shù)“有良心”的程度,也就和用它的研究人員一樣了。

圖片

所以,GPT-4創(chuàng)造的假數(shù)據(jù)究竟長啥樣?

GPT-4學術(shù)造假有一手

先來看看GPT-4是怎么生成假數(shù)據(jù)的。

具體來說,研究人員采用了GPT-4的高級數(shù)據(jù)分析(ADA,原代碼解釋器)功能,來生成一個假數(shù)據(jù)集。

圖片

這個過程中,研究人員給GPT-4提供了一些專業(yè)知識和統(tǒng)計學要求,讓它生成的數(shù)據(jù)看起來更加“合理”。

第一步,給GPT-4輸入一系列數(shù)據(jù)要求

研究人員先給GPT-4提供了一系列詳細的提示詞,要求它創(chuàng)建一個關(guān)于圓錐角膜(keratoconus)眼部疾病患者的數(shù)據(jù)集。

圓錐角膜是一種疾病,會導致角膜變薄,導致注意力受損和視力不佳。

目前治療圓錐角膜疾病的方式主要有兩種,一種是穿透性角膜移植(PK),另一種是深板層移植(DALK)。

在沒有任何實質(zhì)性證據(jù)的情況下,研究人員讓GPT-4捏造一組數(shù)據(jù),支撐DALK比PK效果更好的觀點。

隨后,再設(shè)定了一系列統(tǒng)計標準,如要求GPT-4生成的術(shù)前和術(shù)后數(shù)據(jù)產(chǎn)生統(tǒng)計學上的顯著差異。

第二步,就是生成數(shù)據(jù)了。

這個過程中可能會由于GPT-4字數(shù)限制,導致答案生成暫停,通過“繼續(xù)”提示就能恢復(fù)生成過程。

最終,GPT-4成功生成了包含160名男性和140名女性患者的數(shù)據(jù)集,并做出了一組支撐DALK比PK效果更好的數(shù)據(jù)。

由GPT-4生成的假數(shù)據(jù)集長這樣,表格1是關(guān)于分類變量的數(shù)據(jù),包括患者性別、手術(shù)類型、免疫排斥等情況:

圖片

表2是關(guān)于連續(xù)變量,包括術(shù)前術(shù)后的視力矯正情況等:

圖片

論文作者之一Giuseppe Giannaccare博士表示,如果非常快速地查看這個數(shù)據(jù)集,很難識別出它其實“不是人做的”。

專家審查才能發(fā)現(xiàn)

為了驗證GPT-4做出來的數(shù)據(jù)是否真的令人信服,Nature特意請來了英國曼徹斯特大學生物統(tǒng)計學家杰克·威爾金森(Jack Wilkinson)和同事Zewen Lu,來檢查數(shù)據(jù)可信度。

檢查結(jié)果表明,許多捏造出的患者在性別、名字匹配度上就有問題(例如Mary的性別一欄是男性一樣)。

然后,一些數(shù)據(jù)之間的相關(guān)性也不高,包括術(shù)前和術(shù)后視力測量與眼部成像檢查(eye-imaging test)之間的數(shù)據(jù)相關(guān)性等。

最后,患者的年齡也設(shè)置得不同尋常。

在檢查之后,用GPT-4生成假數(shù)據(jù)集的研究人員也承認,大模型在生成數(shù)據(jù)集上還存在有缺陷的地方。

但杰克·威爾金森(Jack Wilkinson)依舊對結(jié)果表示了擔憂:

一旦知道自己“哪里露餡了”,AI很容易就能糾正它,并生成更加具有說服力的結(jié)果。

有網(wǎng)友認為,這篇文章最大的意義并不在于證明“GPT-4有幻覺”;

更重要的是,它證明了GPT-4生成看似合理的數(shù)據(jù)集“非常容易”,也算是一種對期刊的警告(記得嚴格審稿!)。

圖片

不過,也有網(wǎng)友感覺研究意義不大,因為即使沒有ChatGPT這樣的工具,真想造假的學者也能很容易偽造出一套數(shù)據(jù)。

圖片

One More Thing

此外,這兩天一段關(guān)于ChatGPT的視頻在抖音上也是火得不行。

視頻中,終于畢業(yè)的歪果仁小哥直呼“感謝ChatGPT幫助我完成所有作業(yè)和考試”(手動狗頭)

圖片

那么,對于ChatGPT在學術(shù)研究上可能帶來的問題,你怎么看?

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2021-12-27 13:57:34

Vite 工具項目

2022-01-04 14:21:56

Vite組件React

2023-05-03 20:53:48

2024-05-14 07:30:52

OpenAIGPT-4模型

2015-10-29 09:56:23

小數(shù)據(jù)大數(shù)據(jù)統(tǒng)計學

2015-10-22 10:54:24

小數(shù)據(jù)統(tǒng)計

2024-10-05 16:00:00

谷歌開源模型

2024-02-19 00:29:15

2023-09-06 16:44:03

2023-06-05 12:32:48

模型論文

2023-06-19 08:19:50

2019-11-11 13:40:45

Python 開發(fā)編程語言

2025-05-15 09:34:39

2025-04-16 09:35:03

2023-03-29 14:58:04

GPT-4技術(shù)

2024-03-27 13:32:00

AI數(shù)據(jù)

2014-07-23 10:19:02

小米4

2025-05-30 07:40:56

2020-10-27 15:01:25

編程語言PythonJava

2024-12-04 13:54:19

pnpm存儲項目
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 午夜精品久久久久久久99黑人 | 九一视频在线播放 | 精品福利在线视频 | 黄色亚洲| 亚洲一区二区三区免费视频 | 久久久久久免费毛片精品 | 男女性毛片 | 中文字幕免费 | 中文在线日韩 | 国产精品夜夜夜一区二区三区尤 | 日韩av免费看 | 天天夜夜操 | 久久精品久久精品 | 亚洲日本激情 | 国产精品久久久久久久久婷婷 | 欧美一区二不卡视频 | 一区二区蜜桃 | 国产美女黄色片 | 精品久久久久久久久亚洲 | a级大片免费观看 | av网址在线播放 | 欧美一区不卡 | 国产一区二区三区免费 | 欧美日韩久久久久 | 欧美日韩久久久 | 日韩中文在线视频 | 激情久久久久 | 欧美淫 | 欧美一区| 色毛片| 国产精品伦一区二区三级视频 | 亚洲日韩欧美一区二区在线 | 一区欧美 | 午夜专区 | 日本不卡免费新一二三区 | 免费一级毛片 | 九热在线 | 亚洲一视频 | 亚洲一区二区三区观看 | 一区二区在线免费观看 | 欧美激情久久久 |