成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

頂刊TPAMI 2023!生成式AI與圖像合成綜述發(fā)布!

人工智能 智能汽車
這些生成式AI方法是如何生成以假亂真的視覺效果?又是如何利用深度學習和神經(jīng)網(wǎng)絡技術(shù)來實現(xiàn)畫作、3D生成以及其他創(chuàng)造性任務的呢?我們的綜述論文將會給您提供這些問題的答案。

本文經(jīng)自動駕駛之心公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

生成式AI作為當前人工智能領(lǐng)域的前沿技術(shù),已被廣泛的應用于各類視覺合成任務。

隨著DALL-E2,Stable Diffusion和DreamFusion的發(fā)布,AI作畫和3D合成實現(xiàn)了令人驚嘆的視覺效果并且在全球范圍內(nèi)的爆炸式增長。這些生成式AI技術(shù)深刻地拓展了人們對于AI圖像生成能力的認識,那么這些生成式AI方法是如何生成以假亂真的視覺效果?又是如何利用深度學習和神經(jīng)網(wǎng)絡技術(shù)來實現(xiàn)畫作、3D生成以及其他創(chuàng)造性任務的呢?我們的綜述論文將會給您提供這些問題的答案。

圖片


論文:https://arxiv.org/abs/2112.13592

GitHub地址:

https://github.com/fnzhan/Generative-AI

項目地址:https://fnzhan.com/Generative-AI/

在第一章節(jié),該綜述描述了多模態(tài)圖像合成與編輯任務的意義和整體發(fā)展,以及本論文的貢獻與總體結(jié)構(gòu)。

在第二章節(jié),根據(jù)引導圖片合成與編輯的數(shù)據(jù)模態(tài),該綜述論文介紹了比較常用的視覺引導,文字引導,語音引導,還有近期DragGAN提出的控制點引導等,并且介紹了相應模態(tài)數(shù)據(jù)的處理方法。

圖片

在第三章節(jié),根據(jù)圖像合成與編輯的模型框架,該論文對目前的各種方法進行了分類,包括基于GAN的方法,擴散模型方法,自回歸方法,和神經(jīng)輻射場(NeRF)方法。

圖片

由于基于GAN的方法一般使用條件GAN和 GAN 反演,因此該論文進一步根據(jù) 控制條件的融合方式,模型的結(jié)構(gòu),損失函數(shù)設(shè)計,多模態(tài)對齊,和跨模態(tài)監(jiān)督進行了詳細描述。

圖片

近期,火熱的擴散模型也被廣泛應用于多模態(tài)合成與編輯任務。例如效果驚人的DALLE-2和Imagen都是基于擴散模型實現(xiàn)的。相比于GAN,擴散式生成模型擁有一些良好的性質(zhì),比如靜態(tài)的訓練目標和易擴展性。該論文依據(jù)條件擴散模型和預訓練擴散模型對現(xiàn)有方法進行了分類與詳細分析。

圖片

圖片

相比于基于GAN和擴散模型的方法,自回歸模型方法能夠更加自然的處理多模態(tài)數(shù)據(jù),以及利用目前流行的Transformer模型。自回歸方法一般先學習一個向量量化編碼器將圖片離散地表示為token序列,然后自回歸式地建模token的分布。由于文本和語音等數(shù)據(jù)都能表示為token并作為自回歸建模的條件,因此各種多模態(tài)圖片合成與編輯任務都能統(tǒng)一到一個框架當中。

圖片

以上方法主要聚焦于2D圖像的多模態(tài)合成與編輯。近期隨著神經(jīng)輻射場(NeRF)的迅速發(fā)展,3D感知的多模態(tài)合成與編輯也吸引了越來越多的關(guān)注。由于需要考慮多視角一致性,3D感知的多模態(tài)合成與編輯是更具挑戰(zhàn)性的任務。本文針對單場景優(yōu)化NeRF,生成式NeRF兩種方法對現(xiàn)有工作進行了分類與總結(jié)。

圖片

隨后,該綜述對以上四種模型方法的進行了比較和討論。總體而言,相比于GAN,目前最先進的模型更加偏愛自回歸模型和擴散模型。而NeRF在多模態(tài)合成與編輯任務的應用為這個領(lǐng)域的研究打開了一扇新的窗戶。

圖片

在第四章節(jié),該綜述匯集了多模態(tài)合成與編輯領(lǐng)域流行的數(shù)據(jù)集以及相應的模態(tài)標注,并且針對各模態(tài)典型任務(語義圖像合成,文字到圖像合成,語音引導圖像編輯)對當前方法進行了定量的比較。同時也對多種模態(tài)同時控制生成的結(jié)果進行了可視化。

圖片

在第五章節(jié),該綜述對此領(lǐng)域目前的挑戰(zhàn)和未來方向進行了探討和分析,包括大規(guī)模的多模態(tài)數(shù)據(jù)集,準確可靠的評估指標,高效的網(wǎng)絡架構(gòu),以及3D感知的發(fā)展方向。

在第六和第七章節(jié),該綜述分別闡述了此領(lǐng)域潛在的社會影響和總結(jié)了文章的內(nèi)容與貢獻。

原文鏈接:https://mp.weixin.qq.com/s/T8vFK2iRSLb_E1hJ6pzuGA

責任編輯:張燕妮 來源: 自動駕駛之心
相關(guān)推薦

2024-12-17 13:08:20

2024-09-26 10:04:20

2024-01-02 00:16:59

生成式AI人工智能

2023-08-10 07:37:53

NVIDIAAIOpenUSD

2023-11-29 08:00:00

人工智能機器學習

2023-03-22 11:06:32

2023-12-12 11:20:39

2023-09-27 09:47:51

SAPJoule

2025-04-15 08:35:00

網(wǎng)絡安全LLM威脅企業(yè)安全

2024-01-09 12:53:40

數(shù)據(jù)模型

2024-10-09 11:00:29

2023-08-30 13:24:00

AI工具

2023-06-09 15:24:40

AI版權(quán)侵權(quán)

2023-06-18 12:18:57

2023-08-14 11:52:32

AI工具機器學習

2024-03-11 09:55:51

2023-11-15 16:37:30

ChatGPT人工智能

2025-04-10 08:33:05

2024-07-30 13:05:21

OpenUSDNVIDIANIM微服務

2023-07-24 12:11:37

人工智能
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 黄色大片网站 | 大乳boobs巨大吃奶挤奶 | 国产精品入口久久 | 国产精品久久久久久久久 | 久久综合久久久 | 成人精品视频在线观看 | 国产黄色大片网站 | 成人影院网站ww555久久精品 | 欧美日韩国产一区二区三区 | 97视频精品| 久久久久久国产 | 一区二区三区四区不卡视频 | 国内精品一区二区三区 | 亚洲97 | 亚洲精品自在在线观看 | 国产日韩欧美 | 久久99精品久久久水蜜桃 | 精品久久久久久久久久久院品网 | 蜜臀久久 | 欧美一级大片免费观看 | 国产日韩久久 | 欧美日韩不卡在线 | 午夜一区二区三区在线观看 | 国产免费观看一区 | 老头搡老女人毛片视频在线看 | 成av在线| 婷婷久久网 | 亚洲欧美日韩精品久久亚洲区 | 福利视频一区二区三区 | 欧美xxxx做受欧美 | 人人人人干 | 午夜久久久久久久久久一区二区 | av在线播放一区二区 | 最新国产精品视频 | 日韩一区和二区 | 日本免费小视频 | 亚洲vs天堂 | 日韩欧美字幕 | 国产一区在线免费观看视频 | 国产高清在线精品 | 久久久久久久久久毛片 |