實(shí)力打臉!Adobe用競(jìng)品Midjourney圖片訓(xùn)練Firefly。內(nèi)部員工批評(píng)不斷終爆料。用戶:賺了但很慚愧,我上傳了數(shù)千張
原創(chuàng) 精選撰稿 | 言征
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
AIGC圈太魔幻了,啪啪打臉的時(shí)刻總是在路上!
開(kāi)源的模型會(huì)變閉源,比如被認(rèn)為是開(kāi)源獨(dú)角獸的Mistral,開(kāi)始考慮“使命與商業(yè)利益之間的平衡”,推出閉源的旗艦大模型Large。當(dāng)然,上一次這么說(shuō)的還要數(shù)OpenAI。
不過(guò)在外界看來(lái),理由就是四個(gè)字:我、要、賺、錢!
再比如,一開(kāi)始攻擊谷歌搜索廣告泛濫的AI搜索寵兒Perplexity AI也宣布了自己網(wǎng)站開(kāi)始賣起了廣告位,同樣一改對(duì)于“恰飯”廣告的態(tài)度:只要廣告足夠好,就不影響用戶體驗(yàn)。
今天同樣被網(wǎng)友們吃到“打臉”瓜的會(huì)是誰(shuí)呢?嗯,這次是Adobe。
1.質(zhì)疑Midjourney,理解Midjourney,成為Midjourney?
當(dāng)Adobe公司去年發(fā)布其圖像生成軟件Firefly時(shí),該公司表示,這款人工智能模型主要是在Adobe Stock上訓(xùn)練的,其數(shù)據(jù)庫(kù)包含數(shù)億張授權(quán)圖像。Adobe公司稱,F(xiàn)irefly是一個(gè)“商業(yè)上安全”的替代方案,可以替代像Midjourney這樣的競(jìng)爭(zhēng)對(duì)手,后者是通過(guò)從互聯(lián)網(wǎng)上抓取圖片來(lái)學(xué)習(xí)的。
此外,Adobe公司曾就競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù)收集做法提出批評(píng)。該公司首席戰(zhàn)略官斯科特·貝爾斯基(Scott Belsky)去年表示,其他模型都是建立在“公開(kāi)抓取”的數(shù)據(jù)之上的。
Adobe公司在其網(wǎng)站上表示,F(xiàn)irefly比OpenAI的類似模型更勝一籌的原因之一是,它尊重創(chuàng)意社群,只使用有授權(quán)或可免費(fèi)獲取的數(shù)據(jù)進(jìn)行訓(xùn)練。而在去年3月的一篇題為《生成式人工智能時(shí)代的負(fù)責(zé)任創(chuàng)新》的博客文章中,法務(wù)總監(jiān)達(dá)娜·拉奧(Dana Rao)指出,生成式AI“的好壞取決于其訓(xùn)練數(shù)據(jù)的質(zhì)量”。
她寫道:“經(jīng)過(guò)精心策劃、多樣化的數(shù)據(jù)集訓(xùn)練,你的模型在商業(yè)安全和倫理結(jié)果方面自然具有競(jìng)爭(zhēng)優(yōu)勢(shì)。”同時(shí),她指出Adobe公司對(duì)Firefly的訓(xùn)練是基于AdobeStock圖像、有授權(quán)的內(nèi)容和版權(quán)已過(guò)期的公有領(lǐng)域內(nèi)容。
Adobe公司高級(jí)副總裁阿什利·斯蒂爾(Ashley Still)在本月初的彭博情報(bào)活動(dòng)中表示:“當(dāng)我們發(fā)布Firefly時(shí),我們的企業(yè)客戶找到我們說(shuō),‘我們很喜歡你們?cè)谧龅氖虑椋覀冋娴暮芨屑つ銈儧](méi)有在開(kāi)放的互聯(lián)網(wǎng)上竊取我們所有的知識(shí)產(chǎn)權(quán)。”
然而,在多次演講和公開(kāi)文章中,Adobe從未明確表示其模型實(shí)際上使用了來(lái)自這些競(jìng)爭(zhēng)對(duì)手的一些圖像,來(lái)作為其比競(jìng)爭(zhēng)對(duì)手更安全的原因。
人設(shè)崩塌往往來(lái)自于內(nèi)部消息。根據(jù)最新的爆料,幕后情況是,Adobe也在一定程度上依賴AI生成的內(nèi)容來(lái)訓(xùn)練Firefly,包括從那些AI競(jìng)爭(zhēng)對(duì)手那里獲取的內(nèi)容。
圖片
彭博社報(bào)道:
Adobe’s 'Ethical' AI Tools Used Rival AI Images for Training
2.內(nèi)部員工實(shí)在看不下去,爆料使用競(jìng)品素材來(lái)訓(xùn)練
AI生成的內(nèi)容之所以會(huì)進(jìn)入Firefly的訓(xùn)練集,是因?yàn)閯?chuàng)作者被允許將數(shù)百萬(wàn)張使用其他公司技術(shù)的圖像提交到Adobe Stock市場(chǎng)。Adobe公司代表米歇爾·哈爾霍夫(Michelle Haarhoff)去年9月在為攝影師和藝術(shù)家設(shè)立的Discord群組中寫道:“Adobe Stock收藏中的生成式AI圖像是Firefly訓(xùn)練數(shù)據(jù)集的一小部分。”
Adobe公司表示,用于訓(xùn)練其AI工具的圖像中,只有相對(duì)較小的一部分(約5%)是由其他AI平臺(tái)生成的。公司發(fā)言人表示:“提交給Adobe Stock的每一張圖像,包括一小部分用AI生成的圖像,都會(huì)經(jīng) 過(guò)嚴(yán)格的審核過(guò)程,以確保其中不包含知識(shí)產(chǎn)權(quán)、商標(biāo)、可識(shí)別的角色或標(biāo)志,也不包含藝術(shù)家的名字。”
公司內(nèi)部對(duì)該做法的批評(píng)聲不斷:據(jù)多位熟悉Firefly開(kāi)發(fā)過(guò)程的員工(因討論是私密的,故要求匿名)表示,自從Firefly誕生之初,公司內(nèi)部就一直存在關(guān)于將AI生成的圖像納入模型的道德和視覺(jué)效果的爭(zhēng)議。有些人建議逐步減少系統(tǒng)對(duì)生成圖像的使用,但有知情人表示,目前尚無(wú)此類計(jì)劃。
Adobe Stock 添加了許多AI生成的圖像
然而,Adobe公司從未公開(kāi)明確表示,F(xiàn)irefly部分使用了競(jìng)爭(zhēng)對(duì)手工具中據(jù)稱不太道德的圖像進(jìn)行訓(xùn)練。不過(guò),根據(jù)彭博社查看的消息,Adobe公司至少在兩個(gè)由公司運(yùn)營(yíng)的Discord在線討論組中披露了這些細(xì)節(jié)——一個(gè)用于Adobe Stock,另一個(gè)專門用于Firefly。
3.用戶實(shí)錘:慚愧,被用于訓(xùn)練的AI圖片的確獲得了獎(jiǎng)金
2023年3月,Adobe公司發(fā)布了Firefly的“測(cè)試版”產(chǎn)品。當(dāng)月,與Adobe Stock社群合作的勞爾·塞羅恩(Raúl Cerón)在Discord上發(fā)帖稱,公司不打算使用生成的圖像來(lái)訓(xùn)練即將發(fā)布的Firefly公開(kāi)版。
“一旦我們結(jié)束測(cè)試并正式上線,我們將為它建立一個(gè)新的訓(xùn)練數(shù)據(jù)庫(kù),其中將不包含生成式AI的內(nèi)容。” 他在6月的一篇帖子中寫道。
當(dāng)Adobe于9月13日宣布Firefly公開(kāi)發(fā)布時(shí),該公司還向“其內(nèi)容被用于訓(xùn)練首個(gè)商業(yè)版Firefly模型”的Adobe Stock貢獻(xiàn)者支付了特別的“Firefly獎(jiǎng)金”。根據(jù)與Adobe Stock社群合作的馬特·海沃德(Mat Hayward)在Discord上的一條消息,那些使用生成式AI的貢獻(xiàn)者也在獲得獎(jiǎng)金的人之列。
海沃德寫道,Adobe Stock中的AI生成圖像“增強(qiáng)了我們的數(shù)據(jù)集訓(xùn)練模型,我們決定在商業(yè)發(fā)布的Firefly版本中包含這些內(nèi)容。”
這一點(diǎn),也被用戶實(shí)際證明了。一位用戶在Adobe上傳Midjourney圖像,結(jié)果反手就被用來(lái)訓(xùn)練,而且還收到了一筆獎(jiǎng)金。
布萊恩·彭尼(Brian Penny)是一位作家和stock圖像貢獻(xiàn)者,他向Adobe Stock提交了數(shù)千張AI生成的圖像——其中大多數(shù)是用Midjourney制作的。在收到獎(jiǎng)金時(shí),他感到十分驚訝,因?yàn)樗J(rèn)為自己作為AI貢獻(xiàn)者是沒(méi)有資格獲得獎(jiǎng)金的。盡管獲得了經(jīng)濟(jì)收益,但彭尼認(rèn)為讓Firefly訓(xùn)練包含像他這樣貢獻(xiàn)的內(nèi)容是一個(gè)糟糕的決定,并表示公司應(yīng)該更加坦率地說(shuō)明它是如何訓(xùn)練這款圖像創(chuàng)建軟件的。
他說(shuō):“他們需要秉持道德原則,需要更加透明,需要做得更多。”
自2022年底正式接受AI內(nèi)容以來(lái),Adobe Stock的素材庫(kù)蓬勃發(fā)展。如今,大約有5700萬(wàn)張圖像,即總數(shù)的約14%,被標(biāo)記為AI生成的圖像。提交AI圖像的藝術(shù)家必須指明該作品是使用技術(shù)創(chuàng)建的,但他們不需要說(shuō)明使用的是哪種工具。為了喂養(yǎng)其AI訓(xùn)練集,Adobe還提出為貢獻(xiàn)者提供報(bào)酬,以提交大量用于AI訓(xùn)練的照片——例如香蕉或旗幟的圖像。
4.究竟什么是道德/負(fù)責(zé)任的AI?凌亂了
要訓(xùn)練支撐流行內(nèi)容創(chuàng)作產(chǎn)品的AI模型,需要海量的數(shù)據(jù),同時(shí),AI技術(shù)公司在此過(guò)程中使用版權(quán)材料的行為也受到了越來(lái)越多的審視。
Midjourney、Dall-E的制作者OpenAI以及Stable Diffusion的制作者Stability AI等公司都是利用從互聯(lián)網(wǎng)上抓取的圖片數(shù)據(jù)集來(lái)構(gòu)建他們的媒體生成模型,這種做法引發(fā)了眾多藝術(shù)家的憤怒和訴訟。
一位研究法律和倫理影響的助理教授認(rèn)為,“這顯示了負(fù)責(zé)任AI定義的模糊性,也說(shuō)明了擺脫生成內(nèi)容帶來(lái)的社會(huì)、文化和倫理問(wèn)題(如果不是法律問(wèn)題的話)的困難。”
Adobe公司決定使用公司擁有版權(quán)或?qū)儆诠差I(lǐng)域的內(nèi)容來(lái)構(gòu)建Firefly,很明顯,是為了在快速增長(zhǎng)的生成式人工智能市場(chǎng)中,使其AI圖像工具脫穎而出。
然而,該公司卻將其宣傳為更道德、更合法的選擇,適合那些希望通過(guò)少量詞匯生成圖像但又擔(dān)心潛在版權(quán)問(wèn)題的客戶。不過(guò),Adobe公司還表示,它不會(huì)基于其他人的知識(shí)產(chǎn)權(quán)或品牌來(lái)生成內(nèi)容,也會(huì)避免產(chǎn)生有害圖像。
哈佛大學(xué)教授麗貝卡·塔什內(nèi)特(Rebecca Tushnet)專注于版權(quán)和廣告法領(lǐng)域。她表示,用AI生成的內(nèi)容進(jìn)行訓(xùn)練可能不會(huì)讓Adobe的Firefly圖像生成器在商業(yè)上變得不那么安全,只要公司不誤導(dǎo)消費(fèi)者,它就不需要說(shuō)明其訓(xùn)練內(nèi)容。但是,用像Midjourney創(chuàng)建的圖像這樣的AI圖像進(jìn)行訓(xùn)練,會(huì)破壞Firefly與競(jìng)爭(zhēng)對(duì)手服務(wù)不同的理念。
“Adobe基本上想將自己定位為更高級(jí)別的替代品,但它也想要非常便宜的輸入,而AI是一個(gè)獲取便宜輸入的非常好的方式,”她說(shuō)。
所以,到底什么才是道德的、負(fù)責(zé)任的AI,相信不少人都凌亂了。