成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI、谷歌雙標玩得溜:訓練大模型用他人數據,卻決不允許自身數據外流

人工智能 新聞
你的就是我的,我的還是我的。

在生成式 AI 盛行的全新時代,大型科技公司在使用在線內容時正在奉行「照我說的做,而不是做我所做的」策略。在一定程度上,這種策略可以說是一種雙標以及話語權的濫用。

同時,隨著大語言模型(LLM)成為 AI 發展的主流趨勢,無論是大型還是初創公司,都在不遺余力地開發自己的大模型。其中訓練數據是大模型能力好壞的重要前提。

近日,根據 Insider 的報道,微軟支持的 OpenAI、谷歌及其支持的 Anthropic 多年來一直在使用其他網站或公司的在線內容來訓練他們的生成式 AI 模型。這些都是在沒有征求具體許可的情況下完成的,并將構成一場醞釀中的法律斗爭的一部分,決定了網絡的未來以及版權法在這一新時代的應用方式。

圖片

這些大型科技公司可能會爭辯說他們是合理使用,是否真的如此有待商榷。但是他們卻不會讓自己的內容被用來訓練其他 AI 模型。所以不禁要問,為什么這些大型科技公司卻能在訓練大模型時使用其他公司的在線內容呢?

這些公司很聰明,但也非常虛偽

大型科技公司使用他人在線內容卻不允許他人使用自己的,這種說法是否有確切證據,這可以從他們一些產品的服務和使用條款中看出端倪。

首先來看 Claude,它是 Anthropic 推出的類似于 ChatGPT 的 AI 助手。該系統可以完成摘要總結、搜索、協助創作、問答、編碼等任務。前段時間再次升級,將上下文 token 擴展到了 100k,處理速度大大加快。

圖片

Claude 的服務條款是這樣的。你不得以下列方式(這里列舉出部分)訪問或使用本服務,如果這些限制的任何一項與可接受使用政策不一致或不明確,則以后者依從為先:

  • 開發與我們的服務競爭的任何產品或服務,包括開發或訓練任何 AI 或機器學習算法或模型
  • 未經條款允許,從我們的服務中抓取、爬取或以任何其他方式獲取數據或信息

Claude 服務條款地址:https://vault.pactsafe.io/s/9f502c93-cb5c-4571-b205-1e479da61794/legal.html#terms

同樣地,谷歌的生成式 AI 使用條款也是如此,「你不得使用本服務來開發機器學習模型或相關技術。」

圖片

谷歌生成式 AI 使用條款地址:https://policies.google.com/terms/generative-ai

OpenAI 的使用條款又怎樣呢?與谷歌類似,「你不得使用本服務的輸出來開發與 OpenAI 競爭的模型。」

圖片

OpenAI 使用條款地址:https://openai.com/policies/terms-of-use

這些公司很聰明,他們知道高質量的內容對于訓練新的 AI 模型至關重要,所以不允許別人用這樣的方式使用他們的輸出也是合情合理的。但他們卻無所顧忌地利用他人數據來訓練自己的模型,這又該如何解釋呢?

目前,OpenAI、谷歌和 Anthropic 拒絕了 Insider 的置評請求,并且沒有做出任何回應。

Reddit、推特和其他公司:受夠了

實際上,其他公司意識到正在發生的事情時并不高興。今年 4 月,多年來一直被用于 AI 模型訓練的 Reddit 計劃開始對其數據的訪問收費。

Reddit 首席執行官 Steve Huffman 表示,「Reddit 的數據語料庫非常有價值,因此我們不能把這些價值免費提供給世界上最大的公司。」

同樣今年 4 月,馬斯克指責 OpenAI 的主要支持者微軟非法使用 Twitter 的數據來訓練 AI 模型。「訴訟時間到」,他在推特上寫道。

圖片

不過在回復 Insider 的置評時,微軟表示「這個前提有太多的錯誤,我甚至不知道從何說起。」

OpenAI 首席執行官 Sam Altman 試圖通過探索尊重版權的全新 AI 模型來深化這個問題。據 Axios 報道,他于近期表示,「我們正在嘗試開發新的模式,如果 AI 系統使用了你的內容,或者使用了你的風格,你就會因此獲得報酬。」

圖片

Sam Altman

出版商(包括 Insider)都會是既得利益獲得者。此外,包括美國新聞集團在內的一些出版商已經在推動科技公司付費使用其內容訓練 AI 模型。

目前 AI 模型的訓練方式「打破」了網絡

有前微軟高管表示這一定有問題。微軟老將、著名軟件開發者 Steven Sinofsky 認為,目前 AI 模型的訓練方式「打破」了網絡。

圖片

Steven Sinofsky

他在推特上寫道,「過去,爬取數據是用來換取點擊率的。但現在只是用來訓練一個模型,沒有給創作者、版權所有者帶來任何價值。」

也許,隨著更多公司的覺醒,生成式 AI 時代這一不均衡的數據使用方式會很快被改變。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2018-06-13 10:08:05

蘋果數據開發者

2022-05-31 11:17:14

單元化異地雙活

2023-08-22 20:43:09

HashMap單線程null

2023-08-08 09:44:01

OpenAIGPT 模型

2010-11-02 15:08:40

設置db2主鍵

2022-05-08 18:18:40

JDKValueHashMap

2023-12-09 14:30:50

2014-06-30 14:53:49

Android定制google

2020-08-20 11:12:14

iOS 13.6蘋果降級

2023-03-31 08:11:04

2011-04-22 10:15:56

Novell專利

2023-03-06 15:24:54

谷歌人才

2010-06-01 16:12:00

2022-01-27 07:02:52

JavaHashMap單線程

2009-06-18 10:47:44

java接口定義變量

2011-03-01 14:12:12

FreebsdProftpd

2017-04-13 15:30:09

大數據動向

2010-05-20 13:03:52

IIS父路徑

2024-07-26 09:29:38

2009-10-22 08:46:35

Windows 7中文版包裝
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 麻豆av一区二区三区久久 | 精品国产欧美一区二区三区不卡 | 亚洲成人福利 | 亚洲欧美在线视频 | 日韩av看片| 中文字幕电影在线观看 | 欧美精品91| 欧美久久一区二区三区 | 国产黄色精品在线观看 | 亚洲免费在线观看 | 中文字幕av亚洲精品一部二部 | 国内自拍视频在线观看 | 福利视频一区 | 亚洲一区二区三区在线视频 | 97精品视频在线 | 精品视频在线观看 | 国产自产c区 | 亚洲一区二区日韩 | 欧美高清一级片 | 超碰97人人人人人蜜桃 | 91文字幕巨乱亚洲香蕉 | 欧美激情综合 | 欧美精品一区在线 | 99pao成人国产永久免费视频 | 中文字幕一区二区三区乱码在线 | 在线色网址 | 色天天综合 | 草久久 | 日本不卡免费新一二三区 | 羞羞涩涩在线观看 | 国产免费色 | 国产精品一区一区三区 | 成人二区| 五月天国产 | 久久大陆 | 免费久久精品视频 | 91香蕉嫩草 | 亚洲天堂免费 | 成人伊人| 狠狠干av | 国产精品一区二区在线免费观看 |