GitHub深陷“抄襲門”,拿公開源碼訓練AI,遭大量程序員聲討
GitHub Copilot是GitHub新出的一款“人工智能結對編程工具”,開發人員只需要在編輯器內輸入想要的邏輯的注釋,這個工具便能立即寫出代碼。

Copilot一經發布就引起了不小轟動。
有人認為,這是一款劃時代的AI產品。在未來,程序員這一職業,很有可能因為AI編程工具的產生,而大幅提高生產效率。
然而,在Copilot還沒有加冕為王時,GitHub的一封郵件卻將這個工具打入了十八層地獄。
7月7日,一位名叫“Nora Tindall”的外國網友,曬出了一封GitHub的回復郵件。
郵件中,Nora質問GitHub,自己的GitHub賬戶中的代碼是否被用于Copilot的訓練。
GitHub明確表示,所有的GitHub公開代碼都被用于Copilot的訓練,GitHub不會區分開源協議的類型。
針對這樣無視版權的行為,Nora諷刺道:“這是官方規定,遵守版權只適用于平民和無產階級,富人和大公司可以為所欲為。”
GitHub不區分開源協議的類型,意味著什么?
意味著不管你的代碼使用了哪一種開源協議,都將被GitHub無情地拿來訓練Copilot,開源協議蕩然無存。
例如我們熟悉的GPL協議,它規定開源代碼可以免費使用和引用,也可以修改和衍生代碼,但不允許修改后的代碼,以及衍生的代碼作為閉源商業軟件發布和銷售。
假如Copilot遵循GPL,意味著它必須開源!
如果Copilot未來收費,變成了一種商品,這毫無疑問是一種侵權行為。
Copilot還有另外一個問題。官方聲稱Copilot通常不會精確復制代碼塊。
但很多開發者使用Copilot后表示,這一說法并不準確。
一名網友上傳了一段視頻。視頻中,這名網友在編輯器中打出“Fast Inverse Square Root”(平方根倒數速算法)后,Copilot將《雷神之錘3》里那段經典的算法寫在了編輯器上。
甚至連那句wtf的經典注釋都沒有放過。
事件還在不斷地發酵,甚至已經有科技公司表示,嚴謹員工使用Copilot。因為它很有可能使用遵循GPL協議的源代碼,使公司面臨侵權風險。
在今年的世界人工智能大會開幕式上,AI應用、AI倫理、AI安全被多次提及,但鮮有人提及AI涉及版權的問題。
AI所使用的訓練數據,該不該獲得作者的授權?或者說,開發人員所公開的代碼,不希望被機器學習納入訓練數據,該怎么辦?
像GitHub此次的“抄襲門”,如果自己在GitHub公開的源碼不希望被抄襲,是完全沒有辦法的。而GitHub使用這些源碼,也沒有經過開發者們的同意,未來如果Copilot閉源,必將引起軒然大波。
今年的315晚會上,曝光率人臉識別攝像頭被濫用的現象,一些門店為了精準營銷,未經客戶同意采集和使用人臉信息,這也是AI發展道路上,必須解決的問題。