成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

聊天機器人正在消化互聯(lián)網(wǎng),而互聯(lián)網(wǎng)希望拿到回報

人工智能
谷歌的Bard、OpenAI的ChatGPT、微軟的新版必應(yīng)以及其他初創(chuàng)公司提供的類似工具,都整合了人工智能語言模型。但如果沒有互聯(lián)網(wǎng)上免費獲取的海量文本,這些聰明的機器人作家將無法問世。

人工智能公司正在利用無數(shù)人在互聯(lián)網(wǎng)上創(chuàng)作的內(nèi)容,但沒有征得他們的同意,也沒有給予任何報酬。如今,越來越多的科技和媒體公司開始要求支付費用,希望從聊天機器人的熱潮中分一杯羹。

以下是翻譯內(nèi)容:

如果你曾在博客上發(fā)表過文章、在Reddit上發(fā)布過帖子,或在開放網(wǎng)絡(luò)上分享過任何內(nèi)容,那么你就有可能為最新一代人工智能的誕生做出了貢獻。

谷歌的Bard、OpenAI的ChatGPT、微軟的新版必應(yīng)以及其他初創(chuàng)公司提供的類似工具,都整合了人工智能語言模型。但如果沒有互聯(lián)網(wǎng)上免費獲取的海量文本,這些聰明的機器人作家將無法問世。

如今,網(wǎng)頁內(nèi)容再次成為爭奪的焦點。這種情況自早期搜索引擎之爭以來就沒有出現(xiàn)過。科技巨頭試圖將這個不可替代的、富含全新價值的信息源劃分為自己的領(lǐng)地。

原本不知情的科技和媒體公司正在意識到,這些數(shù)據(jù)對于培養(yǎng)新一代基于語言的人工智能至關(guān)重要。Reddit是OpenAI寶貴的培訓(xùn)資源之一,但最近前者宣布會向人工智能公司收取數(shù)據(jù)訪問的費用。OpenAI拒絕就此發(fā)表評論。

最近,推特也開始對數(shù)據(jù)訪問服務(wù)收費,這一變化影響了推特業(yè)務(wù)的許多方面,包括人工智能公司對數(shù)據(jù)的使用。代表出版商的新聞媒體聯(lián)盟本月在一篇論文中宣布,當(dāng)公司利用其成員制作的作品對人工智能進行培訓(xùn)時,它們應(yīng)該支付許可費。

程序員問答網(wǎng)站Stack Overflow的首席執(zhí)行官普拉尚思·錢德拉塞卡(Prashanth Chandrasekar)表示:“對我們來說,真正重要的是信息的歸屬。”對于大型人工智能公司訪問網(wǎng)站上的用戶創(chuàng)作內(nèi)容,這家公司計劃開始收取費用,“Stack Overflow社區(qū)在過去15年中花了那么多精力回答問題,我們真的想確保努力得到回報。”

以前曾出現(xiàn)許多人工智能服務(wù),如OpenAI的Dall-E 2,它們可以通過學(xué)習(xí)來生成圖像,但卻被指控大規(guī)模竊取知識產(chǎn)權(quán)。創(chuàng)建這些系統(tǒng)的公司目前正卷入針對這些指控的訴訟。而人工智能生成的文本之爭可能會更大,不僅涉及到補償和信用問題,還涉及到隱私問題。

但華盛頓大學(xué)計算語言學(xué)家艾米麗·本德爾(Emily M. Bender)認(rèn)為,根據(jù)現(xiàn)行法律,人工智能機構(gòu)不必對其行為負(fù)責(zé)。

這場爭端的起因在于人工智能聊天機器人的開發(fā)方式。這些機器人的核心算法被稱為“大型語言模型算法”,需要通過吸納和處理大量現(xiàn)有的語言文本數(shù)據(jù),以模仿人類說話的內(nèi)容和方式。這類數(shù)據(jù)與我們在互聯(lián)網(wǎng)上所習(xí)慣的服務(wù)不同,比如Facebook母公司Meta Platforms等用于定向廣告的行為和個人信息。

這些數(shù)據(jù)是由人類用戶使用各種服務(wù)所創(chuàng)造的,比如Reddit用戶發(fā)布的數(shù)億條帖子。只有在網(wǎng)絡(luò)上,你才能找到足夠大的人工生成詞庫。如果沒有它,今天所有基于聊天方式的人工智能和相關(guān)技術(shù)都不會成功。

非營利組織艾倫人工智能研究所的研究科學(xué)家杰西·道奇(Jesse Dodge)在2021年發(fā)表的一篇論文中發(fā)現(xiàn),維基百科和無數(shù)來自大大小小媒體機構(gòu)、受版權(quán)保護的新聞文章,都存在于最常用的網(wǎng)絡(luò)爬蟲數(shù)據(jù)庫中。谷歌和Facebook都使用這個數(shù)據(jù)集來訓(xùn)練大型語言模型,OpenAI也使用了類似的數(shù)據(jù)庫。

OpenAI不再公開其數(shù)據(jù)來源,但據(jù)該公司2020年發(fā)表的一篇論文,其大型語言模型使用從Reddit抓取的帖子來過濾和改進用于訓(xùn)練其人工智能的數(shù)據(jù)。

Reddit的發(fā)言人蒂姆·拉斯施密特(Tim Rathschmidt)表示,目前還不確定向訪問其數(shù)據(jù)的公司收取費用會帶來多少收入,但相信他們所擁有的數(shù)據(jù)可以幫助改進當(dāng)今最先進的大型語言模型。

報道稱,出版業(yè)高管們一直在調(diào)查:他們的內(nèi)容在多大程度上被用來培訓(xùn)ChatGPT和其他人工智能工具?他們認(rèn)為應(yīng)該如何獲得補償?以及他們可以用哪些法律來捍衛(wèi)自己的權(quán)利?不過,該組織的總法律顧問丹妮爾·科菲(Danielle Coffey)表示,到目前為止,還沒有與任何大型人工智能聊天引擎的所有者(如谷歌、OpenAI、微軟等)達成任何協(xié)議,讓他們?yōu)樽ト∽孕侣劽襟w聯(lián)盟成員的部分訓(xùn)練數(shù)據(jù)付費。

推特沒有回復(fù)置評請求。微軟拒絕置評。谷歌的一位發(fā)言人表示:“長期以來,我們一直在幫助創(chuàng)作者和出版商將其內(nèi)容貨幣化,并加強與受眾的關(guān)系。按照我們的人工智能原則,我們將繼續(xù)以負(fù)責(zé)任的、合乎道德的方式進行創(chuàng)新。”該發(fā)言人還說,“現(xiàn)在仍處于早期階段”,對于如何構(gòu)建有利于開放網(wǎng)絡(luò)的人工智能,谷歌正在征求有關(guān)意見。

法律和道德泥潭

在某些情況下,復(fù)制開放網(wǎng)絡(luò)上可用的數(shù)據(jù)(也被稱為抓取)是合法的,盡管公司仍在就如何以及在何時被允許這么做的細(xì)節(jié)上爭論不休。

大多數(shù)公司和組織愿意將他們的數(shù)據(jù)放在網(wǎng)上,是因為他們希望這些數(shù)據(jù)被搜索引擎發(fā)現(xiàn)并編制索引,這樣便于人們找到這些內(nèi)容。然而,復(fù)制這些數(shù)據(jù)來訓(xùn)練人工智能,以取代尋找原始來源的需要,這是完全不同的。

計算語言學(xué)家本德爾表示,那些從網(wǎng)絡(luò)上收集信息來培訓(xùn)人工智能的科技公司的運營原則是:“我們可以接受它,因此它是我們的”。將文本(包括書籍、雜志文章、個人博客上的隨筆、專利、科學(xué)論文以及維基百科內(nèi)容)轉(zhuǎn)化為聊天機器人的答案會去除材料的來源鏈接。這也會讓用戶更難核實機器人告訴他們的內(nèi)容。對于經(jīng)常說謊的系統(tǒng)來說,這是一個大問題。

這些大規(guī)模信息抓取還會竊取我們的個人信息。Common Crawl是一個非營利性組織,十多年來一直在抓取開放網(wǎng)絡(luò)上的大量內(nèi)容,并將其數(shù)據(jù)庫免費提供給研究人員。Common Crawl的數(shù)據(jù)庫也被用作希望培訓(xùn)人工智能的公司的起點,包括谷歌、Meta、OpenAI和其他公司。

塞巴斯蒂安·內(nèi)格爾(Sebastian Nagel)是Common Crawl的數(shù)據(jù)科學(xué)家和工程師,他表示,你幾年前寫的一篇博客文章,雖然后來被刪除,但可能仍然存在于OpenAI使用的訓(xùn)練數(shù)據(jù)中,該公司使用多年前的網(wǎng)絡(luò)內(nèi)容來訓(xùn)練其人工智能。

本德爾表示,與谷歌和微軟擁有的搜索索引不同,從訓(xùn)練有素的人工智能中刪除個人信息需要對整個模型進行重新培訓(xùn)。道奇也稱,由于重新訓(xùn)練一個大型語言模型的成本可能非常高,即使用戶能夠證明個人數(shù)據(jù)被用來訓(xùn)練人工智能,公司也不太可能這樣做。由于所需的巨大計算能力,這類模型的訓(xùn)練成本高達數(shù)千萬美元。

但道奇補充說,在大多數(shù)情況下,也很難讓接受過包括個人信息數(shù)據(jù)集訓(xùn)練的人工智能反芻這些信息。OpenAI表示,它已經(jīng)調(diào)整了基于聊天的系統(tǒng),以拒絕提供個人信息的請求。歐盟和美國政府正在考慮監(jiān)管這類人工智能的新法律法規(guī)。

問責(zé)制和利潤分享

有些人工智能的支持者認(rèn)為,人工智能應(yīng)該獲得他們的工程師可以獲得的所有數(shù)據(jù),因為這是人類學(xué)習(xí)的方式。從邏輯上講,為什么機器不應(yīng)該這樣做呢?

本德爾表示,拋開人工智能目前和人類還不一樣這一點,上述觀點存在一個問題,即根據(jù)現(xiàn)行法律,人工智能不能為自己的行為負(fù)責(zé)。抄襲他人作品的人,或試圖將錯誤信息重新包裝為真相的人,可能會面臨嚴(yán)重后果,但機器和它的創(chuàng)造者則不承擔(dān)同樣的責(zé)任。

當(dāng)然,情況可能并非總是如此。就像版權(quán)所有者Getty起訴使用他們的知識產(chǎn)權(quán)作為訓(xùn)練數(shù)據(jù)的圖像生成人工智能公司一樣,如果企業(yè)和其他組織未經(jīng)授權(quán)使用他們的內(nèi)容,他們很可能會最終將基于聊天的人工智能制造商告上法庭,除非他們同意獲得授權(quán)。

無數(shù)人寫的那些個人隨筆,以及在默默無聞的論壇和已經(jīng)消失的社交網(wǎng)絡(luò)上發(fā)布的帖子,還有其他各種各樣的東西,真的能讓現(xiàn)今的聊天機器人變得寫作能力一樣好嗎?這些內(nèi)容的創(chuàng)造者能從中獲得的唯一好處,也許只是他們在使用語言方面為培養(yǎng)聊天機器人做出了一些貢獻。

責(zé)任編輯:姜華 來源: 網(wǎng)易科技
相關(guān)推薦

2015-06-24 15:35:54

2021-09-08 18:08:52

惡意機器人流量網(wǎng)絡(luò)爬蟲

2013-01-25 10:31:02

互聯(lián)網(wǎng)公司移動互聯(lián)網(wǎng)船票

2015-11-18 14:12:15

軟件媒體互聯(lián)網(wǎng)

2015-05-28 16:11:07

互聯(lián)網(wǎng)+

2014-01-15 14:35:35

云計算

2015-10-08 15:20:34

互聯(lián)網(wǎng)物聯(lián)網(wǎng)

2024-07-25 13:46:43

2015-06-17 11:01:36

互聯(lián)網(wǎng)成長變壞

2015-10-30 17:50:18

互聯(lián)網(wǎng)金融

2018-08-15 09:02:59

產(chǎn)業(yè)互聯(lián)網(wǎng)工業(yè)互聯(lián)網(wǎng)物聯(lián)網(wǎng)

2015-09-22 09:17:33

互聯(lián)網(wǎng)發(fā)展史

2019-12-11 15:05:27

互聯(lián)網(wǎng)IT云計算

2015-03-25 18:31:20

互聯(lián)網(wǎng)+

2017-08-03 16:37:35

互聯(lián)網(wǎng)法院司法

2012-08-30 09:55:15

移動互聯(lián)網(wǎng)公司賺錢

2023-06-18 12:49:03

2014-12-04 11:10:27

2011-12-19 16:45:22

2016-12-05 13:22:15

互聯(lián)網(wǎng)移動互聯(lián)網(wǎng)物聯(lián)網(wǎng)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 99成人在线视频 | 成人九色| 国产精品久久久久久久久久久久久 | 99在线资源 | 刘亦菲国产毛片bd | 一区二区三区精品 | 国产免费看 | 最新一级毛片 | 国产成人jvid在线播放 | 成人影院在线观看 | 激情一区二区三区 | 日本成人三级电影 | 亚洲成av人影片在线观看 | 亚洲成人毛片 | 国产精品成av人在线视午夜片 | 精品久久久久一区二区国产 | 超碰导航| 日韩综合一区 | 在线免费黄色小视频 | 国产成人在线免费 | jav成人av免费播放 | 日韩精品在线视频免费观看 | 日韩免费一区二区 | 国产精品亚洲成在人线 | 日本三级全黄三级a | 亚洲精品一区中文字幕乱码 | 中文字幕在线播放第一页 | 久久久精品一区二区三区 | 综合天天久久 | 欧美一区二区三区四区视频 | 亚洲另类春色偷拍在线观看 | 狠狠涩| 亚洲欧洲一区二区 | 免费黄色的视频 | 久热免费 | 亚洲毛片在线观看 | 精精国产xxxx视频在线播放7 | 成人黄色在线 | 黑人巨大精品 | 97国产在线观看 | 青青草这里只有精品 |