成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出自動匹配排名系統(tǒng)

人工智能 新聞
近日,卡內(nèi)基梅隆大學(xué)的助理教授朱俊彥等人首次提出了基于內(nèi)容的模型搜索算法,讓你能夠一鍵搜索出最匹配的深度圖像生成模型。

本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。

最近的生成式 AI 可謂十分火爆,新出的預(yù)訓(xùn)練圖像生成模型多到讓人目不暇接。無論是肖像、風(fēng)景,還是卡通漫畫、特定藝術(shù)家風(fēng)格元素等等,每個模型都有它擅長生成的內(nèi)容。

這么多模型里面,如何快速找到一個能滿足自己創(chuàng)作欲的最佳模型呢?

近日,卡內(nèi)基梅隆大學(xué)的助理教授朱俊彥等人首次提出了基于內(nèi)容的模型搜索算法,讓你能夠一鍵搜索出最匹配的深度圖像生成模型。

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

論文地址:https://arxiv.org/pdf/2210.03116.pdf

在團隊基于這套模型搜索算開發(fā)的在線模型共享和搜索平臺 Modelverse 上,你可以輸入文本、圖像、草圖和給定模型,來搜索出最匹配或相似的相關(guān)模型。

Modelverse 平臺地址:https://modelverse.cs.cmu.edu/

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:輸入文本(如“非洲動物”)、圖像(如一張風(fēng)景圖)、草圖(如一只站立的貓的草圖)或者一個給定模型,輸出排名靠前的相關(guān)模型(第二行、第三行)

比如,輸入文本“face”,得到結(jié)果如下:

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

輸入一只貓咪圖像:

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

輸入一匹馬的草圖:

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

基于內(nèi)容的模型搜索

和傳統(tǒng)的多媒體搜索一樣,模型搜索能夠幫助用戶找到最適合其特定需求的模型。但基于內(nèi)容的模型搜索任務(wù)有其特殊難點:

判斷模型是否可以生成特定圖像,這是一個比較難計算的問題,而且很多深度生成模型并沒有提供有效方法來估計密度,其本身也不支持評估跨模態(tài)相似性。而蒙特卡洛這種基于抽樣的方法又會使模型搜索過程變得非常緩慢。

為此,朱俊彥團隊提出了一種新的模型搜索系統(tǒng)。

每個生成模型都會產(chǎn)生一個圖像分布,所以作者將搜索問題處理為優(yōu)化,以最大化在給定模型的情況下生成與查詢匹配的概率。如下圖所示,該系統(tǒng)由預(yù)緩存階段(a,b)和推理階段(c)組成。

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:模型搜索方法概覽

給定一組模型,(a)首先為每個模型生成 50K 樣本;(b) 然后將圖像編碼為圖像特征并計算每個模型的一階和二階特征統(tǒng)計。統(tǒng)計數(shù)據(jù)緩存在系統(tǒng)中以提高效率;(c) 在推理階段,支持不同模態(tài)的查詢,包括圖像、草圖、文本描述、另一個生成模型或這些查詢類型的組合。作者在這里引入近似值,查詢被編碼為特征向量,通過評估查詢特征與每個模型統(tǒng)計數(shù)據(jù)之間的相似性,來檢索具有最佳相似性度量的模型。

模型搜索效果

作者對算法進行評估,對 133 個深度生成模型(包括 GAN、擴散模型和自回歸模型)進行了消融實驗分析。與蒙特卡洛基線相比,該方法可以實現(xiàn)更高效的搜索,速度在 0.08 毫秒內(nèi),提升 5 倍,同時還能保持高精度

通過對比模型檢索結(jié)果,我們也可以大致了解針對不同查詢輸入,哪些模型能生成質(zhì)量更高的圖像。比如下圖展示了模型檢索的結(jié)果對比。

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:模型檢索結(jié)果示例

最上面一行是圖像查詢,輸入靜物畫,檢索相關(guān)藝術(shù)風(fēng)格的模型,得到排名第一的 StyleGAN2 模型和排名最后的 Vision-aided GAN 模型。中間行是草圖查詢,輸入馬和教堂的草圖,得到 ADM、ProGAN 等模型。最下面一行是文本查詢,輸入“戴眼鏡的人”和“說話的鳥”,分別檢索得出排名第一的 GANSketch 模型和 Self-Distilled GAN 模型。

作者還發(fā)現(xiàn),不同網(wǎng)絡(luò)特征空間的模型性能存在差異。如下圖所示,在輸入圖像查詢時,結(jié)果顯示三個網(wǎng)絡(luò) CLIP、DINO 和 Inception 都具有相似的性能;而在輸入草圖查詢時,CLIP 效果明顯更好,而 DINO 和 Inception 則不太適合給定查詢,它們在藝術(shù)風(fēng)格的模型上表現(xiàn)更好。

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:不同網(wǎng)絡(luò)特征空間中基于圖像和草圖的模型檢索比較

另外,這項工作所提出的模型搜索算法還能支持多種應(yīng)用,包括多模態(tài)用戶查詢、相似模型查詢、真實圖像重構(gòu)和編輯等。

例如多模態(tài)查詢可以幫助細化模型搜索,在只有“Nicolas Cage”的圖像時,只能檢索到人臉模型;但當同時使用“Nicolas Cage”和“dog”作為輸入時,就可以檢索到能生成“Nicolas Cage dog”圖像的  StyleGAN-NADA 模型。(如下圖)

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:多模態(tài)用戶查詢

當輸入是一個人臉模型時,可以檢索到更多的人臉生成模型,并且類別保持相似。(如下圖)

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:相似模型查詢

給定真實人臉的查詢圖像,使用排名較高的模型能獲得更準確的圖像重建。下圖是使用不同排名模型的 CelebA-HQ 和 LSUN Church 圖像的圖像逆映射示例。

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:將真實圖像投射到檢索到的 StyleGAN2 模型。

在對真實圖像進行編輯的任務(wù)中,不同模型的表現(xiàn)也有高低之分。下圖中,使用基于圖像的模型檢索算法排名第一的模型來對真實圖像進行逆映射,然后使用 GANspace 進行編輯,從而將浮世繪圖像中的皺眉人臉變成笑臉。

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:編輯真實圖像?

這項研究已經(jīng)證明了模型搜索的可行性,而文本、音頻或其他內(nèi)容生成的模型搜索還有很大的研究空間。

但目前來看,這項工作所提出的方法還有一定的局限性。例如,在查詢特定的草圖時,有時會匹配出抽象形狀的模型;而有時進行多模態(tài)查詢時,只能檢索到單一的模型,系統(tǒng)可能會很難處理像一只狗的圖像 + “大象”這樣的多模態(tài)查詢。(如下圖)

AI 生成模型五花八門,誰好誰壞?CMU 朱俊彥團隊推出首個自動匹配排名系統(tǒng)

圖注:失敗案例

另外,在其模型搜索平臺上,對檢索出的模型列表并未根據(jù)其效果進行自動排序,如在生成圖像的分辨率、逼真度、匹配度等方面對不同模型進行評估并給出排名,這樣可更便于用戶檢索,也能幫助用戶更好地了解目前生成模型的優(yōu)劣情況,期待這方面的后續(xù)工作。

責(zé)任編輯:張燕妮 來源: 雷鋒網(wǎng)
相關(guān)推薦

2011-08-18 15:55:55

云計算

2009-10-26 10:06:46

寬帶接入技術(shù)

2009-02-20 10:15:54

面試應(yīng)聘

2022-10-11 09:00:18

MySQL監(jiān)控數(shù)據(jù)

2022-04-24 14:40:05

架構(gòu)大數(shù)據(jù)

2021-05-11 11:55:15

手機材質(zhì)后蓋

2015-09-07 13:32:06

2021-03-03 11:04:51

流量手機.5G

2018-05-31 06:52:03

2018-07-18 13:13:35

微軟Windows 7Windows 10

2025-03-11 13:39:08

2018-06-06 09:50:47

網(wǎng)絡(luò)安全防火墻動態(tài)安全

2019-07-30 07:30:56

編程語言PythonJava

2024-10-16 13:49:00

2024-04-18 11:53:59

通訊協(xié)議網(wǎng)絡(luò)

2018-02-06 08:36:02

簡歷程序員面試

2018-12-24 09:51:22

CPU天梯圖Inter

2013-01-05 10:15:27

UbuntuUbuntu手機

2024-03-21 13:59:06

圖像研究

2023-01-13 00:00:47

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 午夜a区| 国产精品视频网站 | 国产成人精品999在线观看 | 青青久草 | 亚洲人成一区二区三区性色 | 日本精品久久久一区二区三区 | 超碰人人91 | 日韩视频在线一区二区 | 蜜桃在线一区二区三区 | 天堂免费看片 | 最新免费视频 | 特黄小视频 | 99久久国产精| 男人天堂av网站 | 一区二区三区视频在线免费观看 | 91在线视频免费观看 | 国产高清在线观看 | 在线视频国产一区 | 一级a爱片久久毛片 | 在线免费激情视频 | 日韩视频免费看 | 亚洲综合小视频 | 成人免费看电影 | 一区二区国产在线 | 国产三区视频在线观看 | 丝袜天堂 | 国产高清视频在线观看 | 日韩精品一区二区三区在线观看 | 91精品久久久久 | 日本中文字幕一区 | h在线免费观看 | 国产精品一区二区在线播放 | 国产在线一区二区三区 | 伊人青青久久 | 男人天堂网址 | 日韩国产中文字幕 | 综合久久综合久久 | 色姑娘综合网 | 超碰97免费在线 | 草比网站| 久久成人国产 |