ChatGPT被起訴索賠30億!OpenAI接連“吃官司”
隨著ChatGPT風靡全球,其開發商OpenAI就接連不斷地面臨著越來越多的質疑與批評。近日,OpenAI就陷入了接連“吃官司”的狀態之中。
6月29日,有16 名匿名人士向美國加利福尼亞州舊金山聯邦法院提起訴訟,稱 ChatGPT 在沒有充分通知用戶或獲得同意的情況下收集和泄露了他們的個人信息,據此他們要求微軟和 OpenAI 索賠 30 億美元。
訴訟中指出,盡管制定了購買和使用個人信息的協議,但是OpenAI和微軟系統性地從互聯網中竊取了3000億個單詞,包括數百萬未經同意獲取的個人信息。
原告指控兩家公司通過其 AI 產品“收集、存儲、跟蹤、共享和披露”數百萬人的個人信息,包括產品詳細信息、賬戶信息、姓名、聯系方式、登錄憑據、電子郵件、支付信息、交易記錄、瀏覽器數據、社交媒體信息、聊天日志、cookie、搜索記錄和其他在線活動。
訴狀還稱:就個人身份信息而言,被告未能充分地將其從學習模型中過濾掉,使數百萬人面臨著個人信息立即或以其他方式向世界各地的陌生人披露的風險。
訴訟還指控OpenAI違背了其初心,即以“最有可能造福整個人類的方式推進人工智能”。截至目前,不論是OpenAI官方還是微軟官方都還未對該指控進行回復。
不過,該訴訟已經在全球引起了廣泛關注,同時引發了廣大網友對隱私、人工智能倫理和企業處理個人信息的擔憂。
隨后,在短短的一周內,OpenAI又接到兩位作家Paul Tremblay和Mona Awad提起的訴訟,指控他們的受版權保護的著作被用來訓練ChatGPT。
1689059153_64acff51092e55a2cfbce.png!small?1689059154040
Paul Tremblay和Mona Awad稱,ChatGPT 能為他們的書生成“非常準確”的摘要。所以他們堅稱,只有在ChatGPT接受了他們著作的訓練后,才有可能出現這么準確的摘要,而這個操作顯然違反了版權法。
起訴書中預估,OpenAI 的訓練數據中至少包含 30 萬本書,其中很多來自侵權網站。
比如 OpenAI 在披露 GPT-3 訓練數據情況時,就表示其中包含兩個互聯網圖書語料庫,大概占比為 15%。起訴作者認為這些數據就是來自影子圖書館網站的,比如 Library Genesis、Sci-Hub 等。
OpenAI已多次陷入數據風波
雖然目前的這些指控仍是原告方的“一面之詞”。但這已經不是這家公司第一次陷入數據安全、個人信息泄露相關的指控了。
去年6月下旬,微軟發布了一種可以自動生成計算機代碼的新型人工智能技術。
該工具名為 Copilot,旨在讓專業程序員更快地工作。當他們工作時,Copilot會給出代碼建議,程序員可以直接將copilot展示的建議的代碼塊直接添加到自己的代碼中,快速完成工作,這一工具也因此被很多媒體譽為“讓程序員早下班的工具”。
然后去年 11 月,這款名為Copilot的代碼助手,就被程序員們告上了法庭。
原告們認為Copilot嫌違反開源許可,使用他們貢獻的代碼訓練 GitHub Copilot 和 OpenAI 的 Codex 機器學習模型,侵犯了眾多原創代碼作者的版權,同時還泄露了用戶隱私,因此向法院提起訴訟,索賠達90億美元。
這些案例無疑為隱私安全敲響了警鐘,不僅是OpenAI,全球公司都必須對數據收集和使用持有負責任的態度。
如今,人工智能技術的快速發展讓個人隱私問題面臨著更加艱深的挑戰,特別是在數據收集和使用方面。隨著越來越多的個人數據被用于訓練AI模型,如何切實做到確保數據的合法和透明使用變得至關重要。
企業在保護個人隱私方面扮演著關鍵角色。因此各企業在收集和使用個人數據時,都必須遵守隱私法規,并提供透明的數據使用方式,以確保人工智能技術的發展與個人權益的保護相平衡。