成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT 和 Stack Overflow,誰的解答更勝一籌?

人工智能
只有當 ChatGPT 答案中的錯誤非常明顯時,用戶才能意識到。但當錯誤不易驗證或需要外部 IDE 或文檔時,用戶往往會無法識別錯誤或者會低估答案的錯誤程度。“禮貌用語、清晰的教科書式風格的答案、全面性以及答案的關聯性會使得完全錯誤的答案顯得正確。”

美國普渡大學最新發布的一份 “誰的回答更好?深入分析 ChatGPT 和 Stack Overflow 對軟件工程問題的回答” 研究報告指出,ChatGPT 在回答軟件編程問題時,錯誤率高達一半以上。

研究團隊共分析了 ChatGPT 對 517 個 Stack Overflow 問題的回答,以評估 ChatGPT 回答的正確性、一致性、全面性和簡潔性。同時還就這些答案進行了大規模的語言分析和用戶研究,以便從語言和人性化方面了解 ChatGPT 答案的特點。

結果表明,52% 的 ChatGPT 答案是錯誤的,77% 的回答過于冗長。但盡管如此,鑒于其全面性和清晰的語言風格,仍有 39.34% 的人選擇 ChatGPT 的回答。

且深入的人工分析結果得出,ChatGPT 答案中存在大量概念和邏輯錯誤;“由于 ChatGPT 無法理解所提出問題的基本語境,許多答案都是不正確的”。語言分析結果則指出 ChatGPT 的回答非常正式,很少描繪負面情緒或風險;“我們多次觀察到 ChatGPT 插入了諸如‘我當然能幫你’、‘這肯定能解決’等語句。”

“我們的結果表明,有必要對 ChatGPT 中的錯誤進行仔細檢查和糾正,同時讓用戶意識到看似正確的 ChatGPT 答案所帶來的風險。”

研究人員觀察到,只有當 ChatGPT 答案中的錯誤非常明顯時,用戶才能意識到。但當錯誤不易驗證或需要外部 IDE 或文檔時,用戶往往會無法識別錯誤或者會低估答案的錯誤程度。“禮貌用語、清晰的教科書式風格的答案、全面性以及答案的關聯性會使得完全錯誤的答案顯得正確。”

普渡大學博士生、該論文的作者之一 Samia Kabir 向 The Register 表示,與 Stack Overflow 的答案相比,受訪者更偏向不正確且冗長的 ChatGPT 答案。造成這一現象的原因有多種:

其中一個主要原因是 ChatGPT 的回答非常詳細。在很多情況下,如果參與者從冗長而詳細的答案中獲得有用的信息,他們并不會介意答案的長度。此外,積極的情緒和答案的禮貌性也是另外兩個因素。

當參與者發現 ChatGPT 的答案很有見地時,他們就會忽略錯誤。ChatGPT 自信地傳達有洞察力的信息(即使信息不正確)的方式贏得了用戶的信任,這使他們更喜歡錯誤的答案。

研究人員對 ChatGPT 答案和 Stack Overflow 答案的語言分析表明,機器人的反應 “更正式,表達了更多分析思維,表達了更多的分析性思維,展示了更多為實現目標所做的努力,并表現出較少的負面情緒”。情感分析得出的結論是,ChatGPT 的答案比 Stack Overflow 的答案表達了 “更積極的情緒”。

“根據我們的發現和這項研究的觀察,我們建議 Stack Overflow 可以采用有效的方法來檢測評論和答案中的毒性和負面情緒,以改善情感和禮貌。我們還認為 Stack Overflow 可能希望提高答案的可發現性,以幫助找到有用的答案。此外,Stack Overflow 可能希望提供更具體的指南來幫助回答者構建答案,例如:以循序漸進、注重細節的方式。”

此外論文指出,這項研究工作還旨在鼓勵進一步研究如何識別和減少不同類型的概念和事實錯誤。“我們希望這項工作能促進更多關于機器生成答案中不正確性的透明度和交流的研究,尤其是在 SE 的背景下。”

責任編輯:武曉燕 來源: OSCHINA
相關推薦

2024-07-31 09:39:33

2020-03-06 09:21:28

PWA原生應用Web

2010-05-28 11:21:17

2020-02-02 15:42:22

PythonC++編程語言

2014-03-06 15:07:41

青橙小米

2018-06-12 10:09:41

編程語言PythonJava

2022-07-20 08:16:54

Lombokjava工具

2017-01-11 14:38:39

編程語言Java

2010-07-27 14:36:31

Flex Array

2020-01-18 14:55:03

架構運維技術

2010-05-21 16:36:09

GoogleCode

2024-04-25 08:57:04

2019-01-04 09:59:14

KafkaRabbitMQMQ

2018-10-12 13:54:26

2025-01-03 09:27:14

2017-11-13 15:38:03

VMwareOpenStack混合云

2013-02-19 13:13:33

SurfaceiPad

2023-08-23 15:14:13

Web開發Javascript編程語言

2023-04-26 07:34:38

Java并發編程

2017-06-08 15:38:41

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品久久久久一区二区国产 | 欧美成人猛片aaaaaaa | 精品人伦一区二区三区蜜桃网站 | 久久久久久久一区二区三区 | 亚洲综合一区二区三区 | 国产在视频一区二区三区吞精 | 久久69精品久久久久久久电影好 | 欧美成人免费在线视频 | 五月天婷婷综合 | 亚洲国产精品一区二区三区 | 成人在线视频看看 | 欧美综合网 | 狠狠做六月爱婷婷综合aⅴ 国产精品视频网 | 精国产品一区二区三区四季综 | 国产成人91| 美女露尿口视频 | 日韩在线免费视频 | 天天夜夜操 | 91色网站 | 国产专区视频 | 欧美电影免费观看高清 | 国产欧美一级二级三级在线视频 | av色站| 最新国产精品 | 一级毛片视频在线 | 免费看a | 午夜爽爽男女免费观看hd | 亚洲男人天堂 | 国产美女自拍视频 | 一级黄色毛片免费 | 天天色综 | 亚洲免费在线视频 | 精品九九九 | 欧美极品一区二区 | 亚洲看片网站 | 91视频进入 | 国产一区二区在线免费观看 | 成年精品 | 一二区成人影院电影网 | 综合激情av | 韩日有码|