成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

新聞 人工智能
繼GauGAN2之后,英偉達(dá)推出了一個(gè)GAN的“超級(jí)縫合體”——PoE GAN。

[[440170]]

本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

繼GauGAN2之后,英偉達(dá)推出了一個(gè)GAN的“超級(jí)縫合體”——PoE GAN

PoE GAN可以接受多種模態(tài)的輸入,文字描述圖像分割草圖風(fēng)格都可以轉(zhuǎn)化為圖片。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

而且它可以同時(shí)接受以上幾種輸入模態(tài)的任意兩種組合,這便是PoE的含義。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

所謂PoE是Hinton在2002年提出的“專家乘積”(product of experts)概念,每個(gè)專家(單獨(dú)模型)被定義為輸入空間上的一個(gè)概率模型。

而每種單獨(dú)的輸入模態(tài)都是合成圖像必須滿足的約束條件,因此滿足所有約束的一組圖像是滿足每個(gè)約束集合的交集。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

假設(shè)每種約束的聯(lián)合條件概率分布都服從高斯分布,就用單條件概率分布的乘積來(lái)表述交集的分布。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

在此條件下,為了使乘積分布在一個(gè)區(qū)域具有高密度,每個(gè)單獨(dú)的分布需要在該區(qū)域具有高密度,從而滿足每個(gè)約束。

而PoE GAN的重點(diǎn)是如何將每種輸入混合在一起。

PoE GAN的設(shè)計(jì)

PoE GAN的生成器使用全局PoE-Net將不同類型輸入的變化混合起來(lái)。

我們將每個(gè)模態(tài)輸入編碼為特征向量,然后使用PoE匯總到全局PoE-Net中。解碼器不僅使用全局PoE-Net的輸出,還直接連接分割和草圖編碼器,以此來(lái)輸出圖像。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

全局PoE-Net的結(jié)構(gòu)如下,這里使用一個(gè)潛在的特征矢量z0作為樣本使用PoE,然后由MLP處理以輸出特征向量w。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

在鑒別器部分,作者提出了一種多模態(tài)投影鑒別器,將投影鑒別器推廣到處理多個(gè)條件輸入。

與計(jì)算圖像嵌入和條件嵌入之間單個(gè)內(nèi)積的標(biāo)準(zhǔn)投影鑒別器不同,這里要計(jì)算每個(gè)輸入模態(tài)的內(nèi)積,并將其相加以獲得最終損失。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

隨意變換輸入的GAN

PoE可以在單模態(tài)輸入、多模態(tài)輸入甚至無(wú)輸入時(shí)生成圖片。

當(dāng)使用單個(gè)輸入模態(tài)進(jìn)行測(cè)試時(shí),PoE-GAN的表現(xiàn)優(yōu)于之前專門為該模態(tài)設(shè)計(jì)的SOTA方法。

例如在分割輸入模態(tài)中,PoE-GAN優(yōu)于此前的SPADE和OASIS。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

在文本輸入模態(tài)中,PoE-GAN優(yōu)于文本到圖像模型DF-GAN、DM-GAN+CL。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

當(dāng)以模式的任意子集為條件時(shí),PoE-GAN可以生成不同的輸出圖像。下面展示了PoE-GAN的隨機(jī)樣本,條件是兩種模式(文本+分割、文本+草圖、分割+草圖)在景觀圖像數(shù)據(jù)集上。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

PoE-GAN甚至還能沒(méi)有輸入,此時(shí)PoE-GAN就會(huì)成為一個(gè)無(wú)條件的生成模型。以下是PoE-GAN無(wú)條件生成的樣本。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

團(tuán)隊(duì)介紹

論文通訊作者是英偉達(dá)著名工程師劉洺堉,他的研究重點(diǎn)是深度生成模型及其應(yīng)用。英偉達(dá)Canvas和GauGAN等有趣的產(chǎn)品均出自他手。

[[440173]]

論文一作是黃勛,北京航空航天大學(xué)本科畢業(yè),康奈爾大學(xué)博士,現(xiàn)在在英偉達(dá)工作。

英偉達(dá)推出GAN“超級(jí)縫合體”,輸入文字草圖都能生成逼真照片

論文地址:
https://arxiv.org/abs/2112.05130

PoE:
https://www.cs.toronto.edu/~hinton/absps/icann-99.pdf

投影鑒別器:
https://arxiv.org/abs/1802.05637

 

 

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-03-01 10:04:46

ChatGPTAI云服務(wù)

2021-12-06 09:35:38

英偉達(dá)人工智能軟件

2024-11-25 08:20:00

2012-07-09 09:53:24

超級(jí)計(jì)算機(jī)Tesla GPU

2024-11-19 19:33:49

2021-12-22 10:04:11

模型人工智能3D

2021-04-19 09:22:03

科技人工智能技術(shù)

2023-11-01 13:47:44

2023-12-08 08:16:24

2023-05-11 08:48:58

谷歌超級(jí)計(jì)算機(jī)

2018-05-02 16:00:47

人工智能圖像重現(xiàn)

2025-01-08 14:40:48

2021-10-12 15:03:18

模型人工智能深度學(xué)習(xí)

2024-08-29 14:48:42

2023-08-14 07:59:00

英偉達(dá)開(kāi)源

2021-11-16 15:34:30

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)

2023-05-29 18:36:31

英偉達(dá)元宇宙AI

2024-06-24 09:51:24

2023-08-28 13:06:48

英偉達(dá)DLSSAI

2024-12-18 13:00:00

生成式AI英偉達(dá)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 成人免费网站视频 | 久久精点视频 | 国产麻豆乱码精品一区二区三区 | 国产四区 | 国产一区二区三区在线 | 亚洲一区二区欧美 | 中文字幕二区三区 | 国产日韩欧美中文字幕 | 日韩在线视频精品 | 综合自拍 | 欧美成人黄色小说 | 人人干人人干人人干 | 欧美极品在线 | 久久久久久久久久久久91 | 日韩视频免费在线 | 亚洲精品国产成人 | 成人av高清| 国产剧情一区 | 日本欧美国产在线观看 | 久久久久一区二区三区四区 | 一区二区三区四区免费在线观看 | 91精品国产综合久久久动漫日韩 | 国产亚洲精品久久久久久豆腐 | 亚洲www | 成人免费看片 | 久久伊人影院 | 欧美不卡一区二区 | 中文字幕 国产精品 | 欧美日韩淫片 | 亚洲欧美网站 | 91精品久久久久久久久久入口 | 国产精品成人品 | 日韩www | 欧美一区二区三区 | 中文字幕在线一区 | 精品视频免费 | 久久精品99久久 | 成人自拍视频 | 婷婷久久网 | 国产丝袜一区二区三区免费视频 | 亚洲 中文 欧美 日韩 在线观看 |