OpenAI 阿爾特曼回應被《紐約時報》起訴:AI 不用新聞出版商提供訓練數據
1 月 17 日消息,據彭博社報道,在當地時間周二的達沃斯世界經濟論壇年會上,OpenAI 首席執行官薩姆?阿爾特曼在回應有關其公司盜用版權材料的指控時表示,AI 并不需要《紐約時報》等新聞出版商提供大量的訓練數據。
有些人認為,“你需要我所有的數據進行訓練,我的數據非常有價值。”事實上,情況一般并非如此,例如我們并不想利用《紐約時報》的數據進行訓練。
阿爾特曼還表示,公司的很多研究都是如何從少量、高質的數據中學習到更多東西。
在《紐約時報》起訴 OpenAI 和微軟之后,OpenAI 正在大力推動新聞內容的訪問許可。彭博社上周曾援引知情人士消息稱,OpenAI 正在與包括 CNN、福克斯公司和時代周刊在內的出版商洽談新聞內容授權事宜。該公司的知識產權和內容主管此前告訴彭博社,公司正在進行數十項潛在的授權交易。
阿爾特曼這次透露了自己仍希望與出版商合作的意愿:“如果出版商愿意的話,我們希望能跟他們合作。例如當我們的用戶詢問‘今天達沃斯發生了什么’的時候,我們(的應用)就可以說,這是來自彭博社的一篇文章,這是來自《紐約時報》的一篇文章。有人愿意與我們合作,但有人不愿意。”
IT之家附前情提要:
去年 12 月 27 日,《紐約時報》在曼哈頓聯邦地區法院對 OpenAI 和微軟發起訴訟,聲稱對方公司“未經授權而使用了數百萬”文章來訓練其 AI 模型,導致其 AI 生成的內容現在會與《紐約時報》的內容“直接競爭”。
紐約時報聲稱,為 ChatGPT 提供技術支持的大語言模型 (LLM)“可以生成逐字背誦的《紐約時報》內容,對其進行總結并模仿其表達風格進行輸出”,這“破壞了”它與讀者之間的關系,同時也剝奪了其“訂閱、許可、廣告和附屬收入”。