實(shí)力打臉！Adobe用競(jìng)品Midjourney圖片訓(xùn)練Firefly。內(nèi)部員工批評(píng)不斷終爆料。用戶：賺了但很慚愧，我上傳了數(shù)千張

作者：言征 2024-04-15 09:20:50

AI生成的內(nèi)容之所以會(huì)進(jìn)入Firefly的訓(xùn)練集，是因?yàn)閯?chuàng)作者被允許將數(shù)百萬(wàn)張使用其他公司技術(shù)的圖像提交到Adobe Stock市場(chǎng)。

撰稿｜言征

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

AIGC圈太魔幻了，啪啪打臉的時(shí)刻總是在路上！

開(kāi)源的模型會(huì)變閉源，比如被認(rèn)為是開(kāi)源獨(dú)角獸的Mistral，開(kāi)始考慮“使命與商業(yè)利益之間的平衡”，推出閉源的旗艦大模型Large。當(dāng)然，上一次這么說(shuō)的還要數(shù)OpenAI。

不過(guò)在外界看來(lái)，理由就是四個(gè)字：我、要、賺、錢！

再比如，一開(kāi)始攻擊谷歌搜索廣告泛濫的AI搜索寵兒Perplexity AI也宣布了自己網(wǎng)站開(kāi)始賣起了廣告位，同樣一改對(duì)于“恰飯”廣告的態(tài)度：只要廣告足夠好，就不影響用戶體驗(yàn)。

今天同樣被網(wǎng)友們吃到“打臉”瓜的會(huì)是誰(shuí)呢？嗯，這次是Adobe。

1.質(zhì)疑Midjourney，理解Midjourney，成為Midjourney？

當(dāng)Adobe公司去年發(fā)布其圖像生成軟件Firefly時(shí)，該公司表示，這款人工智能模型主要是在Adobe Stock上訓(xùn)練的，其數(shù)據(jù)庫(kù)包含數(shù)億張授權(quán)圖像。Adobe公司稱，F(xiàn)irefly是一個(gè)“商業(yè)上安全”的替代方案，可以替代像Midjourney這樣的競(jìng)爭(zhēng)對(duì)手，后者是通過(guò)從互聯(lián)網(wǎng)上抓取圖片來(lái)學(xué)習(xí)的。

此外，Adobe公司曾就競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù)收集做法提出批評(píng)。該公司首席戰(zhàn)略官斯科特·貝爾斯基（Scott Belsky）去年表示，其他模型都是建立在“公開(kāi)抓取”的數(shù)據(jù)之上的。

Adobe公司在其網(wǎng)站上表示，F(xiàn)irefly比OpenAI的類似模型更勝一籌的原因之一是，它尊重創(chuàng)意社群，只使用有授權(quán)或可免費(fèi)獲取的數(shù)據(jù)進(jìn)行訓(xùn)練。而在去年3月的一篇題為《生成式人工智能時(shí)代的負(fù)責(zé)任創(chuàng)新》的博客文章中，法務(wù)總監(jiān)達(dá)娜·拉奧（Dana Rao）指出，生成式AI“的好壞取決于其訓(xùn)練數(shù)據(jù)的質(zhì)量”。

她寫道：“經(jīng)過(guò)精心策劃、多樣化的數(shù)據(jù)集訓(xùn)練，你的模型在商業(yè)安全和倫理結(jié)果方面自然具有競(jìng)爭(zhēng)優(yōu)勢(shì)。”同時(shí)，她指出Adobe公司對(duì)Firefly的訓(xùn)練是基于AdobeStock圖像、有授權(quán)的內(nèi)容和版權(quán)已過(guò)期的公有領(lǐng)域內(nèi)容。

Adobe公司高級(jí)副總裁阿什利·斯蒂爾（Ashley Still）在本月初的彭博情報(bào)活動(dòng)中表示：“當(dāng)我們發(fā)布Firefly時(shí)，我們的企業(yè)客戶找到我們說(shuō)，‘我們很喜歡你們?cè)谧龅氖虑椋覀冋娴暮芨屑つ銈儧](méi)有在開(kāi)放的互聯(lián)網(wǎng)上竊取我們所有的知識(shí)產(chǎn)權(quán)。”

然而，在多次演講和公開(kāi)文章中，Adobe從未明確表示其模型實(shí)際上使用了來(lái)自這些競(jìng)爭(zhēng)對(duì)手的一些圖像，來(lái)作為其比競(jìng)爭(zhēng)對(duì)手更安全的原因。

人設(shè)崩塌往往來(lái)自于內(nèi)部消息。根據(jù)最新的爆料，幕后情況是，Adobe也在一定程度上依賴AI生成的內(nèi)容來(lái)訓(xùn)練Firefly，包括從那些AI競(jìng)爭(zhēng)對(duì)手那里獲取的內(nèi)容。

圖片

彭博社報(bào)道：

Adobe’s 'Ethical' AI Tools Used Rival AI Images for Training

2.內(nèi)部員工實(shí)在看不下去，爆料使用競(jìng)品素材來(lái)訓(xùn)練

AI生成的內(nèi)容之所以會(huì)進(jìn)入Firefly的訓(xùn)練集，是因?yàn)閯?chuàng)作者被允許將數(shù)百萬(wàn)張使用其他公司技術(shù)的圖像提交到Adobe Stock市場(chǎng)。Adobe公司代表米歇爾·哈爾霍夫（Michelle Haarhoff）去年9月在為攝影師和藝術(shù)家設(shè)立的Discord群組中寫道：“Adobe Stock收藏中的生成式AI圖像是Firefly訓(xùn)練數(shù)據(jù)集的一小部分。”

Adobe公司表示，用于訓(xùn)練其AI工具的圖像中，只有相對(duì)較小的一部分（約5%）是由其他AI平臺(tái)生成的。公司發(fā)言人表示：“提交給Adobe Stock的每一張圖像，包括一小部分用AI生成的圖像，都會(huì)經(jīng) 過(guò)嚴(yán)格的審核過(guò)程，以確保其中不包含知識(shí)產(chǎn)權(quán)、商標(biāo)、可識(shí)別的角色或標(biāo)志，也不包含藝術(shù)家的名字。”

公司內(nèi)部對(duì)該做法的批評(píng)聲不斷：據(jù)多位熟悉Firefly開(kāi)發(fā)過(guò)程的員工（因討論是私密的，故要求匿名）表示，自從Firefly誕生之初，公司內(nèi)部就一直存在關(guān)于將AI生成的圖像納入模型的道德和視覺(jué)效果的爭(zhēng)議。有些人建議逐步減少系統(tǒng)對(duì)生成圖像的使用，但有知情人表示，目前尚無(wú)此類計(jì)劃。

Adobe Stock 添加了許多AI生成的圖像

然而，Adobe公司從未公開(kāi)明確表示，F(xiàn)irefly部分使用了競(jìng)爭(zhēng)對(duì)手工具中據(jù)稱不太道德的圖像進(jìn)行訓(xùn)練。不過(guò)，根據(jù)彭博社查看的消息，Adobe公司至少在兩個(gè)由公司運(yùn)營(yíng)的Discord在線討論組中披露了這些細(xì)節(jié)——一個(gè)用于Adobe Stock，另一個(gè)專門用于Firefly。

3.用戶實(shí)錘：慚愧，被用于訓(xùn)練的AI圖片的確獲得了獎(jiǎng)金

2023年3月，Adobe公司發(fā)布了Firefly的“測(cè)試版”產(chǎn)品。當(dāng)月，與Adobe Stock社群合作的勞爾·塞羅恩（Raúl Cerón）在Discord上發(fā)帖稱，公司不打算使用生成的圖像來(lái)訓(xùn)練即將發(fā)布的Firefly公開(kāi)版。

“一旦我們結(jié)束測(cè)試并正式上線，我們將為它建立一個(gè)新的訓(xùn)練數(shù)據(jù)庫(kù)，其中將不包含生成式AI的內(nèi)容。” 他在6月的一篇帖子中寫道。

當(dāng)Adobe于9月13日宣布Firefly公開(kāi)發(fā)布時(shí)，該公司還向“其內(nèi)容被用于訓(xùn)練首個(gè)商業(yè)版Firefly模型”的Adobe Stock貢獻(xiàn)者支付了特別的“Firefly獎(jiǎng)金”。根據(jù)與Adobe Stock社群合作的馬特·海沃德（Mat Hayward）在Discord上的一條消息，那些使用生成式AI的貢獻(xiàn)者也在獲得獎(jiǎng)金的人之列。

海沃德寫道，Adobe Stock中的AI生成圖像“增強(qiáng)了我們的數(shù)據(jù)集訓(xùn)練模型，我們決定在商業(yè)發(fā)布的Firefly版本中包含這些內(nèi)容。”

這一點(diǎn)，也被用戶實(shí)際證明了。一位用戶在Adobe上傳Midjourney圖像，結(jié)果反手就被用來(lái)訓(xùn)練，而且還收到了一筆獎(jiǎng)金。

布萊恩·彭尼（Brian Penny）是一位作家和stock圖像貢獻(xiàn)者，他向Adobe Stock提交了數(shù)千張AI生成的圖像——其中大多數(shù)是用Midjourney制作的。在收到獎(jiǎng)金時(shí)，他感到十分驚訝，因?yàn)樗J(rèn)為自己作為AI貢獻(xiàn)者是沒(méi)有資格獲得獎(jiǎng)金的。盡管獲得了經(jīng)濟(jì)收益，但彭尼認(rèn)為讓Firefly訓(xùn)練包含像他這樣貢獻(xiàn)的內(nèi)容是一個(gè)糟糕的決定，并表示公司應(yīng)該更加坦率地說(shuō)明它是如何訓(xùn)練這款圖像創(chuàng)建軟件的。

他說(shuō)：“他們需要秉持道德原則，需要更加透明，需要做得更多。”

自2022年底正式接受AI內(nèi)容以來(lái)，Adobe Stock的素材庫(kù)蓬勃發(fā)展。如今，大約有5700萬(wàn)張圖像，即總數(shù)的約14%，被標(biāo)記為AI生成的圖像。提交AI圖像的藝術(shù)家必須指明該作品是使用技術(shù)創(chuàng)建的，但他們不需要說(shuō)明使用的是哪種工具。為了喂養(yǎng)其AI訓(xùn)練集，Adobe還提出為貢獻(xiàn)者提供報(bào)酬，以提交大量用于AI訓(xùn)練的照片——例如香蕉或旗幟的圖像。

4.究竟什么是道德/負(fù)責(zé)任的AI？凌亂了

要訓(xùn)練支撐流行內(nèi)容創(chuàng)作產(chǎn)品的AI模型，需要海量的數(shù)據(jù)，同時(shí)，AI技術(shù)公司在此過(guò)程中使用版權(quán)材料的行為也受到了越來(lái)越多的審視。

Midjourney、Dall-E的制作者OpenAI以及Stable Diffusion的制作者Stability AI等公司都是利用從互聯(lián)網(wǎng)上抓取的圖片數(shù)據(jù)集來(lái)構(gòu)建他們的媒體生成模型，這種做法引發(fā)了眾多藝術(shù)家的憤怒和訴訟。

一位研究法律和倫理影響的助理教授認(rèn)為，“這顯示了負(fù)責(zé)任AI定義的模糊性，也說(shuō)明了擺脫生成內(nèi)容帶來(lái)的社會(huì)、文化和倫理問(wèn)題（如果不是法律問(wèn)題的話）的困難。”

Adobe公司決定使用公司擁有版權(quán)或?qū)儆诠差I(lǐng)域的內(nèi)容來(lái)構(gòu)建Firefly，很明顯，是為了在快速增長(zhǎng)的生成式人工智能市場(chǎng)中，使其AI圖像工具脫穎而出。

然而，該公司卻將其宣傳為更道德、更合法的選擇，適合那些希望通過(guò)少量詞匯生成圖像但又擔(dān)心潛在版權(quán)問(wèn)題的客戶。不過(guò)，Adobe公司還表示，它不會(huì)基于其他人的知識(shí)產(chǎn)權(quán)或品牌來(lái)生成內(nèi)容，也會(huì)避免產(chǎn)生有害圖像。

哈佛大學(xué)教授麗貝卡·塔什內(nèi)特（Rebecca Tushnet）專注于版權(quán)和廣告法領(lǐng)域。她表示，用AI生成的內(nèi)容進(jìn)行訓(xùn)練可能不會(huì)讓Adobe的Firefly圖像生成器在商業(yè)上變得不那么安全，只要公司不誤導(dǎo)消費(fèi)者，它就不需要說(shuō)明其訓(xùn)練內(nèi)容。但是，用像Midjourney創(chuàng)建的圖像這樣的AI圖像進(jìn)行訓(xùn)練，會(huì)破壞Firefly與競(jìng)爭(zhēng)對(duì)手服務(wù)不同的理念。

“Adobe基本上想將自己定位為更高級(jí)別的替代品，但它也想要非常便宜的輸入，而AI是一個(gè)獲取便宜輸入的非常好的方式，”她說(shuō)。

所以，到底什么才是道德的、負(fù)責(zé)任的AI，相信不少人都凌亂了。

想了解更多AIGC的內(nèi)容，請(qǐng)?jiān)L問(wèn)：

51CTO AI.x社區(qū)

http://www.ekrvqnd.cn/aigc/

責(zé)任編輯：武曉燕來(lái)源： 51CTO技術(shù)棧