配合OpenAI搞數(shù)據(jù)壟斷,排擠Anthropic?Reddit撕破臉:賠錢!網(wǎng)友:互聯(lián)網(wǎng)還沒死!AGI太快這官司打完早沒意義了
原創(chuàng) 精選編輯 | 云昭
出品 | 51CTO技術棧(微信號:blog51cto)
6月5日凌晨,就在WindSurf被Claude“斷供”的消息傳出來的第二天,Anthropic后院著火了。
這次的主角是大家熟悉的社交討論平臺Reddit。
Reddit在正式起訴Anthropic的文件中稱,后者其在未經(jīng)許可的情況下,大規(guī)模抓取Reddit公共內容,涉嫌侵犯版權。
消息一經(jīng)傳開,在全球AI圈、Reddit社區(qū)和X平臺上引發(fā)了激烈討論,一場關于“誰能用你的數(shù)據(jù)”“大模型究竟靠什么喂養(yǎng)”的輿論地震,正在蔓延。
拋開 Reddit 能否勝訴另說,但受消息影響,Reddit 股價剛剛的收盤上漲超過了 6%。
Reddit的憤怒:曾主動接洽對方無權抓取
訴狀稱,Anthropic在未征得用戶同意的情況下,利用Reddit用戶的個人數(shù)據(jù)訓練其AI模型,Reddit因此遭受損害。
訴狀的開頭先是來了一段“欲抑先揚”——將 Anthropic 形容為“姍姍來遲的AI公司”,自詡是“AI行業(yè)的白衣騎士”,但 Reddit 直言:“事實遠非如此。”
“盡管其對外營銷材料冠冕堂皇,Anthropic根本無視Reddit的規(guī)則和用戶權益,自認為有權任意攫取任何內容,隨意使用,無需承擔后果。”
訴狀文件還稱,Reddit稱其曾主動與Anthropic接洽,明確告知對方無權抓取或使用Reddit內容,但Anthropic“拒絕配合”。此外,Reddit還指控Anthropic的爬蟲機器人無視網(wǎng)站標準的robots.txt協(xié)議(用于告知自動化程序禁止爬取的頁面),甚至在2024年聲稱已屏蔽相關爬蟲后,Anthropic的機器人依然對Reddit進行了超10萬次數(shù)據(jù)抓取。
Reddit首席法務官Ben Lee在發(fā)給外媒TechCrunch的一份聲明中表示:“我們絕不容忍像Anthropic這樣的逐利公司,肆意將Reddit社區(qū)的內容用于商業(yè)變現(xiàn),賺取數(shù)十億美元,卻不給予用戶任何回報,也不尊重用戶隱私。”
這次到底吵什么?表面上看是版權,實際上是數(shù)據(jù)壟斷?
太陽底下無新事,此次訴訟的核心矛盾還是在于,Reddit認為自身平臺內容被商業(yè)化利用,卻未獲得任何回報。
根據(jù)外媒報道,Reddit起訴Anthropic的核心是:未經(jīng)許可,Anthropic擅自抓取Reddit內容,涉嫌侵權。而OpenAI和Google則早已和Reddit簽訂了內容授權協(xié)議。
這份內容授權協(xié)議的主要內容便是,允許它們在特定條款下,使用Reddit數(shù)據(jù)訓練AI模型,并將Reddit內容整合進自家AI聊天產品的回答中。但Reddit強調,這些合作都需遵守保障用戶權益與隱私的條款。
Reddit官方聲明:
“其他AI巨頭理解并尊重Reddit的規(guī)則。”點名OpenAI、Google是“遵守許可”使用數(shù)據(jù)的典范。
但Anthropic顯然沒跟進,也沒付錢。
這樣看來,Reddit的訴訟沒毛病。但貓膩之處就在于,大家可能沒有注意到一個背景信息,即:
OpenAI CEO Sam Altman目前持有Reddit 8.7%的股份,是該公司第三大股東,并曾任Reddit董事會成員。
圖片
這就讓這場糾紛變得復雜了起來,表面上看是版權官司,但本質卻是AI行業(yè)“數(shù)據(jù)壟斷”的冰山一角:誰擁有足夠多、足夠豐富的高質量人類數(shù)據(jù),誰就能讓AI模型“更像人”,更具市場優(yōu)勢。
為什么AI大模型廠商繞不開Reddit?
做大模型,數(shù)據(jù)就是最寶貴的石油。而Reddit、Quora、Stack Overflow這類社區(qū)是天然的人類思維、觀點、情感、沖突、吐槽的寶庫,堪稱“石油中的精品汽油”。
GPT系列能從死板的機器邏輯,進化成現(xiàn)在“像人”的對話能力,靠的就是大量社交問答類文本。
正如一位X用戶說,Reddit是AI的“底層人性訓練場”。
“大家都愛罵Reddit數(shù)據(jù)被用來訓練AI,但你得承認,這是做出人味AI唯一有效的方法。”
圖片
為什么谷歌和OpenAI愿意付費?而Anthropic拒絕
正如前文所述,OpenAI和Google選擇付費,讓Reddit授權使用其數(shù)據(jù)來進行模型訓練,而Anthropic卻遲遲不愿付費,為什么?
其實原因很直接。先來看OpenAI和Google。
首先,他們需要合法化大模型訓練的數(shù)據(jù)來源。現(xiàn)在AI圈最怕的就是版權風險,一旦被法院判定模型用了未授權內容,整套產品、商業(yè)化和融資都會遭殃。
OpenAI、Google體量太大,不可能冒這個險,一旦出事,損失是以百億美金計。而且這倆公司AI的核心業(yè)務就在美國,得按美國法律玩。
所以,和Reddit簽個授權協(xié)議,既能繼續(xù)用,又規(guī)避法律風險,還能給監(jiān)管和投資方一個交代,這叫合法續(xù)命。
再有一個內幕,就是,Sam Altman本身是Reddit第三大股東。你看懂這層關系就明白了:
Reddit賣數(shù)據(jù),OpenAI花錢,但錢其實等于給自己投資的公司回血。這種“左手倒右手”的操作,最適合鞏固雙方利益綁定,也便于排擠競爭對手。
那為什么Anthropic不掏錢?
首先,Anthropic本來就跟OpenAI“撕破臉”了。眾所周知,Anthropic是當年OpenAI離職高管創(chuàng)立的,他們走的是“更安全、更透明”AI路線,和OpenAI是直接競品。
而Reddit跟OpenAI綁得死死的,Anthropic自然不愿意給“敵對陣營”送錢,掏錢等于給對手養(yǎng)生意,用網(wǎng)友的話說;“死都不甘心”。
其次,Anthropic的模式更偏開源社群路線。Anthropic做Claude系列,比較倚重Common Crawl、維基百科、開源數(shù)據(jù),社區(qū)氛圍里就有種“我們不用付費平臺數(shù)據(jù),也能造好模型”的心氣,所以他們一直游走在“公共內容”和“灰色數(shù)據(jù)”邊緣,能白嫖就不花錢,抱著“公共互聯(lián)網(wǎng)就該開放”的理想主義色彩。
最后,Reddit這份授權協(xié)議太貴。早在去年2月,就有消息報道,Reddit跟OpenAI、Google簽的數(shù)據(jù)協(xié)議,年費在6000萬美元以上。而Anthropic現(xiàn)階段融資遠不如OpenAI,支撐不起這個開支。而且甚至正如網(wǎng)友所言,“你Reddit又不是獨家數(shù)據(jù)源,我能從別的地方搞”,更是減少了簽這份協(xié)議的必要性。
所以不難想象,Anthropic干脆就硬著頭皮抓了,結果就在剛剛跟被OpenAI收購的WindSurd撕破臉,后腳就疑似被OpenAI通過Reddit反將了一軍。
兩相對比之下,你就會發(fā)現(xiàn)這事情變得有意思了,多少成了AI圈的利益分贓。OpenAI、Google之所以愿意付錢,是因為:
- 買穩(wěn)定、買合法、買關系網(wǎng)
- 鞏固數(shù)據(jù)壟斷,不給對手喘息機會
而Anthropic不愿意,是因為:
- 拼不過資本、但要爭活路
- 理想主義+節(jié)流生存戰(zhàn)略
這其實也是AI圈現(xiàn)階段最真實的競爭格局:老牌資本巨頭買斷數(shù)據(jù),擠壓后來者,開源派孤軍奮戰(zhàn)。
不難想象的是,這場Reddit官司,背后真正有所指的、甚至搞垮的,可能不單單是Anthropic,而是整個“開源AI社區(qū)”。
很快 Anthropic 官方就予以了回擊。Anthropic發(fā)言人在致TechCrunch的郵件聲明中表示:“我們不同意Reddit的指控,并將積極應訴。”
網(wǎng)友:互聯(lián)網(wǎng)還沒死!配合OpenAI,排擠Anthropic
這個事情一早就在Reddit和X上炸鍋了,小編整體看下來,其實站隊還是很明顯的,一隊支持Reddit維權,另一隊認為Reddit的數(shù)據(jù)活該被抓取。
一位Reddit網(wǎng)友表示:Claude才不會承認自己用了Reddit數(shù)據(jù),大公司才是最壞的人。
圖片
“Claude(Anthropic的AI助手)肯定說自己沒用Reddit數(shù)據(jù):‘我才不偷數(shù)據(jù)呢,大公司才最壞,UBI萬歲,Bernie還能贏!’”
另一網(wǎng)友緊隨其后回復道:等這場破事敲定了結果,AGI估計也快了。謝謝你證明了“互聯(lián)網(wǎng)已死”是錯的。
等這場破事塵埃落定,AGI 估計也快了。謝謝你證明了“互聯(lián)網(wǎng)已死論”是錯的,現(xiàn)在只有人類才會寫出這種神奇的字面沙拉。
甚至一位網(wǎng)友對于這種版權訴訟表示無力吐槽:等官司打完,這案子早沒意義了。
而Rddit真正值得做的,則應該是如何防止AI數(shù)據(jù)池的污染。并建議道:未來“Human Made”標簽會成大事。Reddit要想活,就該做“真人原創(chuàng)信息庫”,不然都被AI自動生成內容淹沒。
LLM 發(fā)展太快了,等官司打完,這案子早沒意義了。OpenAI、DeepMind 這些年都在用看到啥就抓啥。OpenAI和Reddit、News Corp、華盛頓郵報的合作,不過是哄哄快變廢柴的媒體公司。Reddit 真要做的是,把自己定位成人類原創(chuàng)信息庫,減少合成內容或者給人類內容上個數(shù)字水印。未來“Human Made” 標簽會成大事,因為 AI 普及會讓輿論徹底對立。
圖片
當然,小編發(fā)現(xiàn),不少網(wǎng)友則是批評Reddit的做派,比如一位網(wǎng)友諷刺道:
“Reddit自己從用戶身上賺了幾千萬美金,卻一分不給用戶。現(xiàn)在還裝模作樣搞維權。”
甚至眼尖的觀眾早已看穿了這場訴訟的本質:配合OpenIAI排擠Anthropic。
“OpenAI、DeepMind這些年啥內容都抓,Reddit現(xiàn)在搞這事就是為了配合OpenAI排擠Anthropic。”
整體看下來,Reddit不是反AI,是要錢+壟斷數(shù)據(jù),也順便幫OpenAI卡競爭對手。
大模型廠商的數(shù)據(jù)大戰(zhàn)全面打響
很明顯,Reddit 這波訴訟其實遠沒有版權呢之爭那么簡單。跟 OpenAI、Google 簽獨家協(xié)議,看著是賣數(shù)據(jù),實際上也鎖住了核心輿論數(shù)據(jù)源。而高昂的協(xié)議年費,幾乎只有有錢有背景的企業(yè)才能負擔得起,開源、公益性AI團隊都會在無形之中被排擠出局。
AI廠商之間數(shù)據(jù)大戰(zhàn)全面打響。OpenAI靠股權控制Reddit,Google付費,Anthropic挨告,其他廠商下一步將會采取怎樣的措施?而以后開源模型的“數(shù)據(jù)來源”問題會越來越敏感。
進一步設想,想象下未來新聞、社交、法律、招聘、信用評分,全部跑在AGI之上,而這些AGI訓練數(shù)據(jù)是由這幾家公司壟斷的,相當于未來的AI記憶和語言模型世界,只掌握在少數(shù)幾家大公司手里。
尤其在 AGI 誕生之后,說什么是“真相”、什么是“謠言”、什么是“主流價值觀”,都由這些模型決定。
那我們其實就進入了數(shù)據(jù)獨裁時代。
硅谷投資圈盛傳OpenAI的AGI數(shù)據(jù)獨裁的內幕故事
在這個數(shù)據(jù)獨裁的AGI時代中:
OpenAI 和 Sam Altman:手握 AGI 最大話語權,又是 Reddit 第三大股東,自己簽協(xié)議,自己拿錢,順便排擠競爭對手。而且別忘了,Sam 一直對 AGI 世界統(tǒng)治有濃厚興趣,OpenAI 內部流傳的「AGI Governance Proposal」文件,明確寫過:未來 AGI 應該由“負責任的大型公司聯(lián)合治理”。聽著像好事,實際上就是自己做裁判+運動員。
Google DeepMind:傳統(tǒng)科技巨頭,算是明著玩,不摻這些復雜利益結構但也一樣砸錢買數(shù)據(jù),怕自己掉隊。
Anthropic:則成了理想主義孤膽英雄,號稱要做“安全、負責任、開源可控的 AGI”,但資金和資源都捉襟見肘。
講到這里,小編想到了此前AI圈里盛傳的一個內幕故事:OpenAI 的「失控版 AGI 提案」。去年有一次 OpenAI 內部爆料,一個叫Q*的項目,目標是:
- 用私有社交數(shù)據(jù)+搜索數(shù)據(jù)+新聞評論區(qū)內容,訓練一個可以預測輿論走向、操縱情緒波動的語言模型
- 初步試點就在 Reddit、Twitter(X) 和 YouTube 評論區(qū)里跑了測試
- 后來因為內部人員擔憂“Q* 具備大規(guī)模操控能力”,才有 Anthropic 那批人集體出走
這事后來 OpenAI 沒公開,但不少硅谷投資圈、媒體圈私下流傳。
所以現(xiàn)在看 Reddit 這波起訴 Anthropic,更像是就是清理不聽話的“反骨AI公司”,方便自己繼續(xù)把控數(shù)據(jù)源和話語權。
寫在最后:你的帖子值多少錢
別被表面版權官司迷惑了,所有社交平臺,都是AI煉丹爐。
誰能掌握最大、最獨家的“人類數(shù)據(jù)池”,誰就能把AGI時代的主動權攥在手里。OpenAI早已動手,Google在跟進,Reddit轉型“數(shù)據(jù)礦場”,未來Twitter、YouTube、知乎、小紅書也絕不會例外。
誰掌握數(shù)據(jù),誰就能定義未來的AI話語權。
而普通內容創(chuàng)作者,將越來越邊緣化。這也是一種危險信號。
AI廠商和平臺高層打著用戶的幌子進行利益聯(lián)動,正以“公開合作+背地封殺”雙軌并行。
最后,問題又回到了我們這些用戶身上:你的帖子,值多少錢?
你愿不愿意看著自己的帖子、評論、吐槽,被訓練成AI的一部分,成就別人的利潤和專利?
參考鏈接:https://www.cnbc.com/2025/06/04/reddit-anthropic-lawsuit-ai.html