配合OpenAI搞數(shù)據(jù)壟斷,排擠Anthropic?Reddit撕破臉:賠錢!網(wǎng)友:互聯(lián)網(wǎng)還沒(méi)死! 原創(chuàng)
編輯 | 云昭
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
6月5日凌晨,就在WindSurf被Claude“斷供”的消息傳出來(lái)的第二天,Anthropic后院著火了。
這次的主角是大家熟悉的社交討論平臺(tái)Reddit。
Reddit在正式起訴Anthropic的文件中稱,后者其在未經(jīng)許可的情況下,大規(guī)模抓取Reddit公共內(nèi)容,涉嫌侵犯版權(quán)。
消息一經(jīng)傳開(kāi),在全球AI圈、Reddit社區(qū)和X平臺(tái)上引發(fā)了激烈討論,一場(chǎng)關(guān)于“誰(shuí)能用你的數(shù)據(jù)”“大模型究竟靠什么喂養(yǎng)”的輿論地震,正在蔓延。
拋開(kāi) Reddit 能否勝訴另說(shuō),但受消息影響,Reddit 股價(jià)剛剛的收盤上漲超過(guò)了 6%。
Reddit的憤怒:曾主動(dòng)接洽對(duì)方無(wú)權(quán)抓取
訴狀稱,Anthropic在未征得用戶同意的情況下,利用Reddit用戶的個(gè)人數(shù)據(jù)訓(xùn)練其AI模型,Reddit因此遭受損害。
訴狀的開(kāi)頭先是來(lái)了一段“欲抑先揚(yáng)”——將 Anthropic 形容為“姍姍來(lái)遲的AI公司”,自詡是“AI行業(yè)的白衣騎士”,但 Reddit 直言:“事實(shí)遠(yuǎn)非如此。”
“盡管其對(duì)外營(yíng)銷材料冠冕堂皇,Anthropic根本無(wú)視Reddit的規(guī)則和用戶權(quán)益,自認(rèn)為有權(quán)任意攫取任何內(nèi)容,隨意使用,無(wú)需承擔(dān)后果。”
訴狀文件還稱,Reddit稱其曾主動(dòng)與Anthropic接洽,明確告知對(duì)方無(wú)權(quán)抓取或使用Reddit內(nèi)容,但Anthropic“拒絕配合”。此外,Reddit還指控Anthropic的爬蟲(chóng)機(jī)器人無(wú)視網(wǎng)站標(biāo)準(zhǔn)的robots.txt協(xié)議(用于告知自動(dòng)化程序禁止爬取的頁(yè)面),甚至在2024年聲稱已屏蔽相關(guān)爬蟲(chóng)后,Anthropic的機(jī)器人依然對(duì)Reddit進(jìn)行了超10萬(wàn)次數(shù)據(jù)抓取。
Reddit首席法務(wù)官Ben Lee在發(fā)給外媒TechCrunch的一份聲明中表示:“我們絕不容忍像Anthropic這樣的逐利公司,肆意將Reddit社區(qū)的內(nèi)容用于商業(yè)變現(xiàn),賺取數(shù)十億美元,卻不給予用戶任何回報(bào),也不尊重用戶隱私。”
這次到底吵什么?表面上看是版權(quán),實(shí)際上是數(shù)據(jù)壟斷?
太陽(yáng)底下無(wú)新事,此次訴訟的核心矛盾還是在于,Reddit認(rèn)為自身平臺(tái)內(nèi)容被商業(yè)化利用,卻未獲得任何回報(bào)。
根據(jù)外媒報(bào)道,Reddit起訴Anthropic的核心是:未經(jīng)許可,Anthropic擅自抓取Reddit內(nèi)容,涉嫌侵權(quán)。而OpenAI和Google則早已和Reddit簽訂了內(nèi)容授權(quán)協(xié)議。
這份內(nèi)容授權(quán)協(xié)議的主要內(nèi)容便是,允許它們?cè)谔囟l款下,使用Reddit數(shù)據(jù)訓(xùn)練AI模型,并將Reddit內(nèi)容整合進(jìn)自家AI聊天產(chǎn)品的回答中。但Reddit強(qiáng)調(diào),這些合作都需遵守保障用戶權(quán)益與隱私的條款。
Reddit官方聲明:
“其他AI巨頭理解并尊重Reddit的規(guī)則。”點(diǎn)名OpenAI、Google是“遵守許可”使用數(shù)據(jù)的典范。
但Anthropic顯然沒(méi)跟進(jìn),也沒(méi)付錢。
這樣看來(lái),Reddit的訴訟沒(méi)毛病。但貓膩之處就在于,大家可能沒(méi)有注意到一個(gè)背景信息,即:
OpenAI CEO Sam Altman目前持有Reddit 8.7%的股份,是該公司第三大股東,并曾任Reddit董事會(huì)成員。
圖片
這就讓這場(chǎng)糾紛變得復(fù)雜了起來(lái),表面上看是版權(quán)官司,但本質(zhì)卻是AI行業(yè)“數(shù)據(jù)壟斷”的冰山一角:誰(shuí)擁有足夠多、足夠豐富的高質(zhì)量人類數(shù)據(jù),誰(shuí)就能讓AI模型“更像人”,更具市場(chǎng)優(yōu)勢(shì)。
為什么AI大模型廠商繞不開(kāi)Reddit?
做大模型,數(shù)據(jù)就是最寶貴的石油。而Reddit、Quora、Stack Overflow這類社區(qū)是天然的人類思維、觀點(diǎn)、情感、沖突、吐槽的寶庫(kù),堪稱“石油中的精品汽油”。
GPT系列能從死板的機(jī)器邏輯,進(jìn)化成現(xiàn)在“像人”的對(duì)話能力,靠的就是大量社交問(wèn)答類文本。
正如一位X用戶說(shuō),Reddit是AI的“底層人性訓(xùn)練場(chǎng)”。
“大家都愛(ài)罵Reddit數(shù)據(jù)被用來(lái)訓(xùn)練AI,但你得承認(rèn),這是做出人味AI唯一有效的方法。”
圖片
為什么谷歌和OpenAI愿意付費(fèi)?而Anthropic拒絕
正如前文所述,OpenAI和Google選擇付費(fèi),讓Reddit授權(quán)使用其數(shù)據(jù)來(lái)進(jìn)行模型訓(xùn)練,而Anthropic卻遲遲不愿付費(fèi),為什么?
其實(shí)原因很直接。先來(lái)看OpenAI和Google。
首先,他們需要合法化大模型訓(xùn)練的數(shù)據(jù)來(lái)源。現(xiàn)在AI圈最怕的就是版權(quán)風(fēng)險(xiǎn),一旦被法院判定模型用了未授權(quán)內(nèi)容,整套產(chǎn)品、商業(yè)化和融資都會(huì)遭殃。
OpenAI、Google體量太大,不可能冒這個(gè)險(xiǎn),一旦出事,損失是以百億美金計(jì)。而且這倆公司AI的核心業(yè)務(wù)就在美國(guó),得按美國(guó)法律玩。
所以,和Reddit簽個(gè)授權(quán)協(xié)議,既能繼續(xù)用,又規(guī)避法律風(fēng)險(xiǎn),還能給監(jiān)管和投資方一個(gè)交代,這叫合法續(xù)命。
再有一個(gè)內(nèi)幕,就是,Sam Altman本身是Reddit第三大股東。你看懂這層關(guān)系就明白了:
Reddit賣數(shù)據(jù),OpenAI花錢,但錢其實(shí)等于給自己投資的公司回血。這種“左手倒右手”的操作,最適合鞏固雙方利益綁定,也便于排擠競(jìng)爭(zhēng)對(duì)手。
那為什么Anthropic不掏錢?
首先,Anthropic本來(lái)就跟OpenAI“撕破臉”了。眾所周知,Anthropic是當(dāng)年OpenAI離職高管創(chuàng)立的,他們走的是“更安全、更透明”AI路線,和OpenAI是直接競(jìng)品。
而Reddit跟OpenAI綁得死死的,Anthropic自然不愿意給“敵對(duì)陣營(yíng)”送錢,掏錢等于給對(duì)手養(yǎng)生意,用網(wǎng)友的話說(shuō);“死都不甘心”。
其次,Anthropic的模式更偏開(kāi)源社群路線。Anthropic做Claude系列,比較倚重Common Crawl、維基百科、開(kāi)源數(shù)據(jù),社區(qū)氛圍里就有種“我們不用付費(fèi)平臺(tái)數(shù)據(jù),也能造好模型”的心氣,所以他們一直游走在“公共內(nèi)容”和“灰色數(shù)據(jù)”邊緣,能白嫖就不花錢,抱著“公共互聯(lián)網(wǎng)就該開(kāi)放”的理想主義色彩。
最后,Reddit這份授權(quán)協(xié)議太貴。早在去年2月,就有消息報(bào)道,Reddit跟OpenAI、Google簽的數(shù)據(jù)協(xié)議,年費(fèi)在6000萬(wàn)美元以上。而Anthropic現(xiàn)階段融資遠(yuǎn)不如OpenAI,支撐不起這個(gè)開(kāi)支。而且甚至正如網(wǎng)友所言,“你Reddit又不是獨(dú)家數(shù)據(jù)源,我能從別的地方搞”,更是減少了簽這份協(xié)議的必要性。
所以不難想象,Anthropic干脆就硬著頭皮抓了,結(jié)果就在剛剛跟被OpenAI收購(gòu)的WindSurd撕破臉,后腳就疑似被OpenAI通過(guò)Reddit反將了一軍。
兩相對(duì)比之下,你就會(huì)發(fā)現(xiàn)這事情變得有意思了,多少成了AI圈的利益分贓。OpenAI、Google之所以愿意付錢,是因?yàn)椋?/p>
- 買穩(wěn)定、買合法、買關(guān)系網(wǎng)
- 鞏固數(shù)據(jù)壟斷,不給對(duì)手喘息機(jī)會(huì)
而Anthropic不愿意,是因?yàn)椋?/p>
- 拼不過(guò)資本、但要爭(zhēng)活路
- 理想主義+節(jié)流生存戰(zhàn)略
這其實(shí)也是AI圈現(xiàn)階段最真實(shí)的競(jìng)爭(zhēng)格局:老牌資本巨頭買斷數(shù)據(jù),擠壓后來(lái)者,開(kāi)源派孤軍奮戰(zhàn)。
不難想象的是,這場(chǎng)Reddit官司,背后真正有所指的、甚至搞垮的,可能不單單是Anthropic,而是整個(gè)“開(kāi)源AI社區(qū)”。
很快 Anthropic 官方就予以了回?fù)簟nthropic發(fā)言人在致TechCrunch的郵件聲明中表示:“我們不同意Reddit的指控,并將積極應(yīng)訴。”
網(wǎng)友:互聯(lián)網(wǎng)還沒(méi)死!配合OpenAI,排擠Anthropic
這個(gè)事情一早就在Reddit和X上炸鍋了,小編整體看下來(lái),其實(shí)站隊(duì)還是很明顯的,一隊(duì)支持Reddit維權(quán),另一隊(duì)認(rèn)為Reddit的數(shù)據(jù)活該被抓取。
一位Reddit網(wǎng)友表示:Claude才不會(huì)承認(rèn)自己用了Reddit數(shù)據(jù),大公司才是最壞的人。
圖片
“Claude(Anthropic的AI助手)肯定說(shuō)自己沒(méi)用Reddit數(shù)據(jù):‘我才不偷數(shù)據(jù)呢,大公司才最壞,UBI萬(wàn)歲,Bernie還能贏!’”
另一網(wǎng)友緊隨其后回復(fù)道:等這場(chǎng)破事敲定了結(jié)果,AGI估計(jì)也快了。謝謝你證明了“互聯(lián)網(wǎng)已死”是錯(cuò)的。
等這場(chǎng)破事塵埃落定,AGI 估計(jì)也快了。謝謝你證明了“互聯(lián)網(wǎng)已死論”是錯(cuò)的,現(xiàn)在只有人類才會(huì)寫出這種神奇的字面沙拉。
甚至一位網(wǎng)友對(duì)于這種版權(quán)訴訟表示無(wú)力吐槽:等官司打完,這案子早沒(méi)意義了。
而Rddit真正值得做的,則應(yīng)該是如何防止AI數(shù)據(jù)池的污染。并建議道:未來(lái)“Human Made”標(biāo)簽會(huì)成大事。Reddit要想活,就該做“真人原創(chuàng)信息庫(kù)”,不然都被AI自動(dòng)生成內(nèi)容淹沒(méi)。
LLM 發(fā)展太快了,等官司打完,這案子早沒(méi)意義了。OpenAI、DeepMind 這些年都在用看到啥就抓啥。OpenAI和Reddit、News Corp、華盛頓郵報(bào)的合作,不過(guò)是哄哄快變廢柴的媒體公司。Reddit 真要做的是,把自己定位成人類原創(chuàng)信息庫(kù),減少合成內(nèi)容或者給人類內(nèi)容上個(gè)數(shù)字水印。未來(lái)“Human Made” 標(biāo)簽會(huì)成大事,因?yàn)?AI 普及會(huì)讓輿論徹底對(duì)立。
圖片
當(dāng)然,小編發(fā)現(xiàn),不少網(wǎng)友則是批評(píng)Reddit的做派,比如一位網(wǎng)友諷刺道:
“Reddit自己從用戶身上賺了幾千萬(wàn)美金,卻一分不給用戶。現(xiàn)在還裝模作樣搞維權(quán)。”
甚至眼尖的觀眾早已看穿了這場(chǎng)訴訟的本質(zhì):配合OpenIAI排擠Anthropic。
“OpenAI、DeepMind這些年啥內(nèi)容都抓,Reddit現(xiàn)在搞這事就是為了配合OpenAI排擠Anthropic。”
整體看下來(lái),Reddit不是反AI,是要錢+壟斷數(shù)據(jù),也順便幫OpenAI卡競(jìng)爭(zhēng)對(duì)手。
大模型廠商的數(shù)據(jù)大戰(zhàn)全面打響
很明顯,Reddit 這波訴訟其實(shí)遠(yuǎn)沒(méi)有版權(quán)呢之爭(zhēng)那么簡(jiǎn)單。跟 OpenAI、Google 簽獨(dú)家協(xié)議,看著是賣數(shù)據(jù),實(shí)際上也鎖住了核心輿論數(shù)據(jù)源。而高昂的協(xié)議年費(fèi),幾乎只有有錢有背景的企業(yè)才能負(fù)擔(dān)得起,開(kāi)源、公益性AI團(tuán)隊(duì)都會(huì)在無(wú)形之中被排擠出局。
AI廠商之間數(shù)據(jù)大戰(zhàn)全面打響。OpenAI靠股權(quán)控制Reddit,Google付費(fèi),Anthropic挨告,其他廠商下一步將會(huì)采取怎樣的措施?而以后開(kāi)源模型的“數(shù)據(jù)來(lái)源”問(wèn)題會(huì)越來(lái)越敏感。
進(jìn)一步設(shè)想,想象下未來(lái)新聞、社交、法律、招聘、信用評(píng)分,全部跑在AGI之上,而這些AGI訓(xùn)練數(shù)據(jù)是由這幾家公司壟斷的,相當(dāng)于未來(lái)的AI記憶和語(yǔ)言模型世界,只掌握在少數(shù)幾家大公司手里。
尤其在 AGI 誕生之后,說(shuō)什么是“真相”、什么是“謠言”、什么是“主流價(jià)值觀”,都由這些模型決定。
那我們其實(shí)就進(jìn)入了數(shù)據(jù)獨(dú)裁時(shí)代。
硅谷投資圈盛傳OpenAI的AGI數(shù)據(jù)獨(dú)裁的內(nèi)幕故事
在這個(gè)數(shù)據(jù)獨(dú)裁的AGI時(shí)代中:
OpenAI 和 Sam Altman:手握 AGI 最大話語(yǔ)權(quán),又是 Reddit 第三大股東,自己簽協(xié)議,自己拿錢,順便排擠競(jìng)爭(zhēng)對(duì)手。而且別忘了,Sam 一直對(duì) AGI 世界統(tǒng)治有濃厚興趣,OpenAI 內(nèi)部流傳的「AGI Governance Proposal」文件,明確寫過(guò):未來(lái) AGI 應(yīng)該由“負(fù)責(zé)任的大型公司聯(lián)合治理”。聽(tīng)著像好事,實(shí)際上就是自己做裁判+運(yùn)動(dòng)員。
Google DeepMind:傳統(tǒng)科技巨頭,算是明著玩,不摻這些復(fù)雜利益結(jié)構(gòu)但也一樣砸錢買數(shù)據(jù),怕自己掉隊(duì)。
Anthropic:則成了理想主義孤膽英雄,號(hào)稱要做“安全、負(fù)責(zé)任、開(kāi)源可控的 AGI”,但資金和資源都捉襟見(jiàn)肘。
講到這里,小編想到了此前AI圈里盛傳的一個(gè)內(nèi)幕故事:OpenAI 的「失控版 AGI 提案」。去年有一次 OpenAI 內(nèi)部爆料,一個(gè)叫Q*的項(xiàng)目,目標(biāo)是:
- 用私有社交數(shù)據(jù)+搜索數(shù)據(jù)+新聞評(píng)論區(qū)內(nèi)容,訓(xùn)練一個(gè)可以預(yù)測(cè)輿論走向、操縱情緒波動(dòng)的語(yǔ)言模型
- 初步試點(diǎn)就在 Reddit、Twitter(X) 和 YouTube 評(píng)論區(qū)里跑了測(cè)試
- 后來(lái)因?yàn)閮?nèi)部人員擔(dān)憂“Q* 具備大規(guī)模操控能力”,才有 Anthropic 那批人集體出走
這事后來(lái) OpenAI 沒(méi)公開(kāi),但不少硅谷投資圈、媒體圈私下流傳。
所以現(xiàn)在看 Reddit 這波起訴 Anthropic,更像是就是清理不聽(tīng)話的“反骨AI公司”,方便自己繼續(xù)把控?cái)?shù)據(jù)源和話語(yǔ)權(quán)。
寫在最后:你的帖子值多少錢
別被表面版權(quán)官司迷惑了,所有社交平臺(tái),都是AI煉丹爐。
誰(shuí)能掌握最大、最獨(dú)家的“人類數(shù)據(jù)池”,誰(shuí)就能把AGI時(shí)代的主動(dòng)權(quán)攥在手里。OpenAI早已動(dòng)手,Google在跟進(jìn),Reddit轉(zhuǎn)型“數(shù)據(jù)礦場(chǎng)”,未來(lái)Twitter、YouTube、知乎、小紅書(shū)也絕不會(huì)例外。
誰(shuí)掌握數(shù)據(jù),誰(shuí)就能定義未來(lái)的AI話語(yǔ)權(quán)。
而普通內(nèi)容創(chuàng)作者,將越來(lái)越邊緣化。這也是一種危險(xiǎn)信號(hào)。
AI廠商和平臺(tái)高層打著用戶的幌子進(jìn)行利益聯(lián)動(dòng),正以“公開(kāi)合作+背地封殺”雙軌并行。
最后,問(wèn)題又回到了我們這些用戶身上:你的帖子,值多少錢?
你愿不愿意看著自己的帖子、評(píng)論、吐槽,被訓(xùn)練成AI的一部分,成就別人的利潤(rùn)和專利?
參考鏈接:??https://www.cnbc.com/2025/06/04/reddit-anthropic-lawsuit-ai.html??
