AI抄襲了我的書,還放在亞馬遜上售賣?!
大數據文摘出品
來源:theguardian
對于每一個文字工作者來說,抄襲或許可以稱得上是最令人無法容忍的事情之一了。
尤其是對于出書的作家而言。
前BBC技術記者Rory Cellan-Jones對于自己寫的那本回憶錄十分上心,“和大多數作家一樣,我經常在亞馬遜上查看銷售情況”。
然后這本書就出現了。
這天他照常關注著書的銷售情況,然后發現在亞馬遜搜索出來了Cellan-Jones的傳記,封面設計得很幼稚,而作者,他從未聽說過這個人。
“我當時想,這也太奇怪了——誰在寫我的傳記?Cellan-Jones告訴《觀察家報》。我沒有自欺欺人。我賣關于自己的書就已經很困難了,(更不用說)讓其他人賣關于我的書了。”
圖片
但是,看了一會兒就會發現,Cellan-Jones成了有人企圖借他的回憶錄大做文章的犧牲品。因為書中的文字顯然是由人工智能生成的,這是自ChatGPT出現以來大量人工智能中的一種,它使快速生成幾頁文字,而無需人們費心去寫。
AI抄襲并出版了書,亞馬遜推薦給了被抄襲者
Cellan-Jones的著作Ruskin Park: Sylvia, Me and the BBC,描述了他如何發現母親寫給他的一鞋盒信件,信中詳細描述了母親與他父親的戀情。父親是英國廣播公司的電視導演,他母親在23歲時與他相識,這本書“講述了一個單身母親和一個不在身邊的父親的成長故事”。
但Cellan-Jones表示,這本堪比一本家庭偵探小說的書“完全是虛構的”,他的父親是一位學者,母親是一名教師。
圖片
隨后,然后亞馬遜給他發了一封郵件,說“你可能會喜歡這本書”。他們的算法認為這是他想要的一本書,而不是去推薦他辛辛苦苦寫了很久的書。
亞馬遜實際上是在允許垃圾書的存在,并推薦給最討厭它的人。
沒過幾天,亞馬遜刪除了這本假冒作者的傳記和其他作品,但還有很多作品通過了旨在剔除低質量圖書的過濾器。
利用亞馬遜的Kindle Direct Publishing(KDP)系統,一些“作者”在一天內發布數十本圖書。
比如一個名為Steven Walryn的人出版了30多本書,其中大部分是關于如何使用相機品牌的無意義且重復的指南,以及幾本奇幻浪漫小說,其中15本書是在5月的同一天出版的。目前已被亞馬遜刪除。
人工智能正在“威脅”創作者
亞馬遜拒絕透露有多少本書被阻止出版或有多少書被下架。
“隨著人工智能生成的產品涌入其商店,亞馬遜顯然面臨著重大挑戰,而且它似乎正在迎頭趕上。”作家協會(SoA)首席執行官Nicola Solomon表示。
幾周前,該公司表示,KDP新出版物的出版商需要聲明是否包含人工智能生成的內容,并且每天僅限出版三本書,此舉受到Solomon的歡迎。
“但這些小修復似乎比讀者和人類作者更有利于亞馬遜的流程。”她補充道。SoA希望亞馬遜將產品明確標記為人工智能生成,并允許讀者過濾掉人工智能標題。
這個問題與音樂家遇到的問題類似,他們面臨著向流媒體服務上傳白噪音的人爭奪Spotify版稅的競爭。
瑪格麗特·阿特伍德 (Margaret Atwood)、越南阮 (Viet Thanh Nguyen) 和菲利普·普爾曼 (Philip Pullman) 等作者也擔心,他們的工作成果在未經他們同意、或任何補償或信用的情況下被用于大型語言模型來訓練人工智能。
特許IT機構BCS集團首席執行官Rashik Parmar表示,部長們需要制定立法,確保人工智能生成的材料包含數字水印,以便輕松追蹤。
帕爾瑪表示:“如果立法能夠幫助英國IT專業人員展現更高的道德標準,那么英國在成為負責任計算的發源地方面具有得天獨厚的優勢。”
“‘英國編碼’會成為某種特殊事物的綽號嗎?”
亞馬遜發言人表示,所有出版商都必須遵守其內容指南。“我們投入大量時間和資源來確保遵循我們的指南,并刪除不遵守這些指南的書籍……雖然我們允許人工智能生成的內容,但我們不允許人工智能生成的內容違反我們的內容指南,包括創建令人失望的客戶體驗。”
相關報道:
https://www.theguardian.com/technology/2023/sep/30/authors-shocked-to-find-ai-ripoffs-of-their-books-being-sold-on-amazon