神秘模型“小熊貓”一夜刷屏:排名超F(xiàn)lux、Midjourney,網(wǎng)友:一看就中國的
一夜之間,名為“red_panda” (小熊貓)的神秘文生圖模型狠狠火了!!
登頂文生圖競技場,直接將Flux、Midjourney等一眾頂尖模型踩在腳下——
其ELO得分比Flux 1.1 Pro高出100多,勝率高達(dá)79%,每7秒就能生成一張圖像。生成效果be like:
啥概念呢?按網(wǎng)友的話說,這家伙擱這跳級呢!
這與從Flux 1 schnell到Flux 1.1 Pro的跳躍相同
除了強(qiáng)得可怕,red_panda由于無人認(rèn)領(lǐng),更是引發(fā)大家伙好奇心,各種猜測都有:
- 鑒于生成質(zhì)量過好,很可能是傳說中的Midjourney V7或中杯Stable Diffusion 3.5;
- 可能是OpenAI的DALL-E 4,因?yàn)锳nthropic前員工在圖片后綴里發(fā)現(xiàn)了OpenAI;
- 也可能是Mistral AI的新模型,理由是在未公布的測試版中發(fā)現(xiàn)了相似名稱“Pandragon”;
- 或者來自Recraft文生圖模型,因?yàn)樗鼈冊褂眯⌒茇垜?zhàn)士作為默認(rèn)矢量提示;
- ……
值得一提的是,有一些人猜測它可能出自中國廠商之手。
不過你還真別說,一看這既red又panda的名稱logo,中國味兒實(shí)在過于濃了。
眾說紛紜里,一位工程師小哥更是莫名被cue,網(wǎng)友:
@felix_red_panda,是你嗎?
笑死,誰讓你頭像名稱都很像~
競技場實(shí)測效果
red_panda真的有這么強(qiáng)嗎?量子位這就實(shí)測一下。
需要提醒的是,由于red_panda現(xiàn)身不久,因此目前只能在競技場進(jìn)行體驗(yàn)。
規(guī)則也很簡單,隨機(jī)兩個匿名模型pk,用戶只需選出最喜歡、覺得更符合提示詞的圖片就行。
下面我們直接展示捉到的red_panda,與其他模型的同題對比,直觀看看效果。
第1關(guān):SD 3 Medium(√) VS red_panda
A 3D render of an ancient artfact,intricately detailed and realistically textured,as if just unearthed.(一個古代文物的3D渲染圖,細(xì)節(jié)錯綜復(fù)雜,紋理逼真,仿佛剛剛出土。)
第2關(guān):red_panda VS SD 3.5 Large(√)
An elaborate Gothic cathedral with flying buttresses, stained glass windows, and a bell tower.(一幅精致的哥特式大教堂的圖像,擁有飛扶壁、彩色玻璃窗和鐘樓。)
第3關(guān):red_panda VS Flux.1 [dev](√)
An image of a financial advisor discussing investment strategies with a young couple in a modern office, emphasizing financial planning and long-term wealth management.(一張圖片,展示了一位金融顧問在現(xiàn)代辦公室里與一對年輕夫婦討論投資策略,強(qiáng)調(diào)財(cái)務(wù)規(guī)劃和長期財(cái)富管理。)
第4關(guān):red_panda(√) VS neptune_next
Antarctic cruise ship poster.(南極游輪海報(bào))
第5關(guān):red_panda(√) VS Flux.1 [schnell]
A vintage, art nouveau-inspired perfume bottle with an elegant, curved design and an ornate, floral label reading “Essence of Elegance”, created as a 3D product render.(一個復(fù)古風(fēng)格的、受新藝術(shù)運(yùn)動啟發(fā)的香水瓶,擁有優(yōu)雅的曲線設(shè)計(jì)和裝飾華麗的花卉標(biāo)簽,上面寫著“優(yōu)雅精華”,作為一個3D產(chǎn)品渲染圖被創(chuàng)造出來。)
試玩結(jié)束,單從5局結(jié)果來看,神秘模型red_panda倒是沒有想象中的壓倒性勝利。
不過也可能是個人審美原因:
感興趣的朋友也可以去試試,看誰運(yùn)氣好能隨機(jī)匹配上red_panda。(擴(kuò)大樣本招數(shù)有doge)
網(wǎng)友:中國造?
好的,現(xiàn)在問題同樣來了:red_panda哪來的??
大部分人第一反應(yīng)都是中國,理由也很直白:一是看起來就很china,二是國內(nèi)目前在視頻生成方面大有趕超之勢,順手做一個文生圖模型也很正常。
幾乎沒有什么比這個名字更中國的了……
點(diǎn)名快手、字節(jié)、Minimax等,當(dāng)你看到他們?nèi)绾谓y(tǒng)治AI視頻時,就知道它更有可能是一家在生成人工智能方面已經(jīng)擁有豐富經(jīng)驗(yàn)的公司的中國模型代號。
除了國內(nèi)大廠,另一呼聲來自Midjourney V7。
Midjourney于8月1日發(fā)布了v 6.1版本,且官方一直透露正在測試V7,所以很多人猜測Midjourney有偷偷提前測試的可能。(匿名競技場測試,很熟悉的配方了)
還有人猜測是中杯Stable Diffusion 3.5,這是Stability AI上周發(fā)布的模型型號之一,擁有25億參數(shù),采用改進(jìn)的MMDiT-X架構(gòu)和訓(xùn)練方法,能夠生成分辨率在0.25~2百萬像素之間的圖像。
難道是換個馬甲來競技場試試水?
除此之外,相對靠譜的猜測來自Anthropic前員工,“Dalle 4 = Red Panda”。
他提供的證據(jù)如下,一張由DALL-E生成的圖片命名中帶有相關(guān)字符串。
不過也有網(wǎng)友出來反駁了,也許panda只是出于索引原因隨機(jī)插入的?
更有人表示,OpenAI沒必要再搞DALL-E,GPT-4o已經(jīng)夠用了,而且命名風(fēng)格也和OpenAI不符~
除了OpenAI,法國開源模型公司Mistral AI也榜上有名,不過這個比較牽強(qiáng),只是因?yàn)槊Q相似。
本月早些時候,有消息稱該公司正在測試新模型“Pandragon”,可能具有圖像生成和網(wǎng)絡(luò)搜索功能。
所以,沒準(zhǔn)是這個還未現(xiàn)身的測試模型~
不過當(dāng)時也透露,Pandragon的圖像生成功能可能會由黑森林實(shí)驗(yàn)室的Flux提供支持。
由此也引出“red_panda”很可能來自Flux的傳聞:
好家伙,如果屬實(shí),這算是自己打敗自己嗎?(doge)
BTW,截至發(fā)稿前,雖然red_panda仍占據(jù)榜首,但它和后位選手的差距貌似正逐漸縮小。
且讓我等繼續(xù)觀望,順便等個認(rèn)領(lǐng)。
競技場地址:https://artificialanalysis.ai/text-to-image/arena?tab=Leaderboard