GitHub被起訴,版權問題再引熱議,網友類比谷歌圖書:畢竟谷歌沒拿用戶內容寫小說
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
GitHub在去年11月遭到集體訴訟。
現在,關于其背后的知識共享問題被翻出來,美國版權清理中心(CCC)的常務董事Roy Kaufman特地撰文指出:
GitHub給的代碼通常沒有署名,違反了著作權授權許可協議CC BY 4.0。
此文一出,GitHub再度被推到風口浪尖,引起熱烈討論。
這場起訴的導火索是GitHub與OpenAI共同研發的“敲代碼神器”:Copilot。
當時,正式發布不到5個月的Copilot已惹怒了一眾程序員,主要問題可以概括為“侵權”二字。
知識共享問題再度引熱議
美國版權清理中心的Roy在文中寫道,其實CC BY 4.0的規定已經算相當寬松了:
只要有合理的署名,就可以在沒有額外許可的情況下,把用戶上傳的內容用于文本數據挖掘、機器學習,以及AI訓練(可統稱為Text Data Mining,TDM)。
巴特,GitHub Copilot給出的代碼連這點都做不到——因為它往往沒有標注作者署名。
誠然,GitHub主要是個用于分享開源代碼的平臺,但官方這樣隨意挪用用戶上傳的內容,依然涉嫌違反許多法律和協議。
有網友指出:
(根據相關法律),不可以通過修改主機服務商的使用條款,隨意挪用用戶上傳的內容。
還有人把Copilot和谷歌圖書(Google Books)作比較,后者用于搜索谷歌掃描的書籍、雜志全文,并可通過光學字符識別(OCR)轉換為文本。該網友指出:
二者有一個明顯的不同之處:谷歌圖書一次只允許你訪問2頁內容。
若要獲取一本書的全部內容,必須搜索很多次——也就是說,他人不能一下子就獲得這本書的完整電子版,這樣就不存在“版權清洗”。
事實上,谷歌圖書也曾被作家協會起訴,但人家谷歌最后勝訴了。
因為法院在權衡版權侵權問題時,會考慮“實用性 ”以及“充分改造性”等問題。
有吃瓜網友補充調侃道,雖然谷歌很有可能把這些電子版書籍的內容上傳到自家的云上了,但是:
畢竟人家沒用這些東西來搞AI寫小說。
言外之意,就是假如谷歌來搞類似Copilot的事情,那他們可能也要面臨大麻煩。
違反多項法律和協議
至于GitHub Copilot違反了哪些協議,原告表示,其中包括美國的數字千年版權法(Digital Millennium Copyright Act,DMCA)。
DMCA主要有以下部分:
- 版權技術措施法案(Copyright Technical Measures Act):規定在數字領域中可使用的技術保護措施,防止未經許可被挪用。
- 網絡服務提供商責任限制法案(Online Copyright Infringement Liability Limitation Act):規定網絡服務提供商(如網站或云服務)在用戶侵權行為方面的責任。
- 對解除加密技術的刑事處罰條例(Criminal Penalties for Circumvention of Encryption Measures):解開加密技術,可能構成刑事犯罪。
- 版權投訴通知制度(Copyright Complaint Notification System):規定版權所有者如何投訴侵權行為,以及網絡服務提供商應對投訴的責任和義務。
據其中的“網絡服務提供商責任限制法案”,如果服務商希望使用用戶上傳內容,需征得用戶同意,并且在使用時給予適當的署名。(嗯,又是署名...)
除了DMCA,Copilot還涉嫌違反了加州消費者隱私法等,以及前文提到的CC BY 4.0。
總而言之,GitHub和Copilot涉嫌違反的法律和規定相當錯綜復雜。
目前,本案尚處于早期階段,不管最終判決結果如何,都還有很長的路要走。
值得一提的是,訴訟發起者,干了20多年的老程序員Matthew Butterrick已激活了自己的律師資格證,特地來細究這些問題。