成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

六年、六屆學(xué)生接力,共鑄上交大圖像合成工具箱libcom

人工智能 新聞
該綜述介紹了圖像合成(image composition)領(lǐng)域需要解決的問題和應(yīng)運(yùn)而生的子任務(wù),總結(jié)了各個(gè)子任務(wù)的數(shù)據(jù)集、傳統(tǒng)方法、深度學(xué)習(xí)方法和實(shí)驗(yàn)現(xiàn)象,從鴻蒙初辟寫到塵埃落地。

如果你對(duì) arXiv 的版本號(hào)有所了解,你就知道這篇論文已經(jīng)更新了 4 次,現(xiàn)在已經(jīng)來到了第 5 個(gè)版本。實(shí)際上,這個(gè) arXiv 編號(hào)屬于上海交通大學(xué)牛力團(tuán)隊(duì)一篇持續(xù)更新了四年的綜述報(bào)告。 

該綜述介紹了圖像合成(image composition)領(lǐng)域需要解決的問題和應(yīng)運(yùn)而生的子任務(wù),總結(jié)了各個(gè)子任務(wù)的數(shù)據(jù)集、傳統(tǒng)方法、深度學(xué)習(xí)方法和實(shí)驗(yàn)現(xiàn)象,從鴻蒙初辟寫到塵埃落地。

圖片

  • 論文標(biāo)題:Making Images Real Again: A Comprehensive Survey on Deep Image Composition
  • 論文地址:https://arxiv.org/abs/2106.14490v5

除了持續(xù)更新這份關(guān)于圖像合成的綜述,牛力團(tuán)隊(duì)還在持之以恒地研發(fā)和迭代一個(gè)圖像合成工具箱:libcom。而這項(xiàng)工作更是已經(jīng)持續(xù)了六年!

該團(tuán)隊(duì)自 2018 年底就開始從事圖像合成領(lǐng)域的研究,從數(shù)據(jù)(10 + 原創(chuàng)數(shù)據(jù)集)到模型(30 + 原創(chuàng)模型)、論文(20 + 已發(fā)表論文),再到工具箱(libcom),歷時(shí)六年,耗資數(shù)百萬,由六屆學(xué)生接力完成。

其中,所有數(shù)據(jù)集的每張圖片都經(jīng)過 2~3 人檢查,以嚴(yán)格保證數(shù)據(jù)集的質(zhì)量。所有模型的代碼都經(jīng)過 2~3 人檢查,以確保沒有嚴(yán)重的 bug。該團(tuán)隊(duì)打趣地表示:「如果有嚴(yán)重的 bug 請(qǐng)盡快打臉。」

圖片

在多年研究積累的基礎(chǔ)上,該實(shí)驗(yàn)室于 2023 年底推出了盡量無需訓(xùn)練微調(diào)、對(duì)任意圖片開箱即用的圖像合成工具箱 libcom。并且牛力老師表示:「該工具箱的形式也是我們首創(chuàng)的,體現(xiàn)了我們對(duì) image composition 領(lǐng)域的理解。」

截至 2024 年 10 月,libcom 已被下載安裝了 1.2 萬次。

圖片


  • 項(xiàng)目地址:https://github.com/bcmi/libcom

可以看到,libcom 的 logo 是一個(gè)半人馬的形象,實(shí)際上這正是為了體現(xiàn)圖像合成的目標(biāo):融合不同的圖像元素。這個(gè)半人馬就是人和馬的融合,同時(shí) logo 中還添加了裝飾性的藍(lán)圈和黃圈的融合。另一個(gè)有趣的細(xì)節(jié)是,由于藍(lán)色和黃色的過渡色是綠色,因此半人馬系上了一條綠色的腰帶。

具體能力上,libcom 集成了十幾項(xiàng)圖像合成功能(每個(gè)功能都有一到兩個(gè)簡(jiǎn)單有效的方法),實(shí)現(xiàn)了對(duì)圖像合成的全方位覆蓋,并且每一個(gè)功能都有對(duì)應(yīng)的倉(cāng)庫(kù)。牛力老師謙虛地說:「經(jīng)過近一年的迭代,大多數(shù)功能的效果還湊合。」

另外值得一提的是,每個(gè)功能對(duì)應(yīng)的倉(cāng)庫(kù)中都有訓(xùn)練代碼。這是該團(tuán)隊(duì)專門為用戶微調(diào)準(zhǔn)備的:如果用戶發(fā)現(xiàn)某項(xiàng)功能在自己的數(shù)據(jù)集上表現(xiàn)欠佳,原因很可能是數(shù)據(jù)差異,因此用戶只需用自己收集的訓(xùn)練數(shù)據(jù)微調(diào)模型,替換掉原來的 checkpoint,就能讓這些功能發(fā)揮出自己的完整實(shí)力。

libcom 的功能

在介紹 libcom 的十幾項(xiàng)功能之前,我們首先要了解什么是圖像合成(image composition)。 

圖像合成是圖像編輯(image editing)技術(shù)的一種,而圖像編輯的原子操作包括增、刪、改。其中「增」這個(gè)研究方向就叫做圖像合成,指的是在圖像中添加元素。另外,「刪」是指從圖像中擦除元素,該研究方向叫做圖像填充(image inpainting)。「改」是指改變圖像中元素的屬性,該研究方向叫做屬性編輯(attribute manipulation)。其余復(fù)雜的圖像編輯操作皆可轉(zhuǎn)化為「增」、「刪」、「改」這三個(gè)原子操作的排列組合。 

因此,可以說圖像合成在圖像編輯的版圖中三分天下居其一,并且其在虛擬現(xiàn)實(shí)、藝術(shù)創(chuàng)作、電商廣告、數(shù)據(jù)增廣等領(lǐng)域有著廣泛應(yīng)用。

圖片

libcom 的十幾項(xiàng)功能涵蓋了圖像合成的方方面面,從評(píng)估合成圖的質(zhì)量到得到高質(zhì)量合成圖:

1. get_composite_image:通過剪切粘貼、alpha 融合和泊松融合混合前景背景,如下圖所示。這些是最簡(jiǎn)單的傳統(tǒng)圖像融合方法。

圖片

2. OPAScoreModel:輸入合成圖和前景掩碼,判斷前景物體的放置(位置、大小)是否合理。輸出的分?jǐn)?shù)介于 [0,1] 之間,1 表示合理,0 表示不合理。在下圖中,左邊的合成圖分?jǐn)?shù)為 1,右邊的合成圖分?jǐn)?shù)為 0。

圖片

3. FOPAHeatMapModel: 輸入一對(duì)背景圖片和前景物體,輸出該物體按照不同尺寸放在背景圖片不同位置得到的合成圖的合理性分?jǐn)?shù)。假設(shè)有 K 個(gè)離散的前景物體尺寸,背景圖片大小為 H*W, 則輸出 H*W*K 的熱力圖。熱力圖上的每個(gè)像素對(duì)應(yīng)一個(gè)放置的合理性分?jǐn)?shù),因此根據(jù)熱力圖可以獲取合理的前景物體放置框。下圖展示了單個(gè)前景物體尺寸的熱力圖以及根據(jù)熱力圖得到的前景物體放置框。

圖片

4. color_transfer: 傳統(tǒng)的顏色遷移方法,用于將背景的顏色遷移到前景,適用于簡(jiǎn)單場(chǎng)景的圖像和諧化。下圖是合成圖和顏色遷移后的結(jié)果。

圖片

5. ImageHarmonizationModel:輸入合成圖和前景掩碼,圖像和諧化模型調(diào)整前景的光照使其與背景和諧,輸出和諧化結(jié)果。

圖片

6. PainterlyHarmonizationModel:藝術(shù)圖像和諧化與圖像和諧化類似,區(qū)別在于背景是藝術(shù)圖片。輸入合成圖和前景掩碼,藝術(shù)圖像和諧化模型調(diào)整前景的風(fēng)格 (顏色、紋理、筆觸等) 使其與背景一致,輸出和諧化結(jié)果。

圖片

7. HarmonyScoreModel: 輸入合成圖和前景掩碼,判斷前景和背景的光照是否匹配,輸出前景與背景的和諧化分?jǐn)?shù)。分?jǐn)?shù)介于 [0,1] 之間,1 表示和諧,0 表示不和諧。在下圖中,左邊的合成圖分?jǐn)?shù)為 0.25,右邊的合成圖分?jǐn)?shù)為 0.72。

圖片

8. InharmoniousLocalizationModel: 輸入一張圖片,輸出該圖片不和諧區(qū)域的掩碼。下圖展示了合成圖和模型預(yù)測(cè)的不和諧區(qū)域。

圖片

9. FOSScoreModel: 輸入一張合成圖,預(yù)測(cè)前景和背景在幾何和語(yǔ)義上的適配性分?jǐn)?shù),包括前景和背景的透視角度是否一致、前景物體的語(yǔ)義上下文是否合理等等。輸出的適配性分?jǐn)?shù)介于 [0,1] 之間,1 表示適配,0 表示不適配。

圖片

10. ShadowGenerationModel: 輸入一張合成圖和前景掩碼,為前景物體在背景上生成合理的陰影。該功能不是很穩(wěn)定,通常每隨機(jī)生成 5 張會(huì)有 1~2 張的陰影形狀較好。下圖展示了隨機(jī)采樣 5 次生成的結(jié)果。

圖片

11. ControlComModel:輸入一對(duì)背景圖片和前景物體,把前景物體插入背景圖片指定位置(黃色邊界框),保持前景物體的姿態(tài)不變,做圖像融合或者圖像和諧化。兩者的區(qū)別在于圖像和諧化需要進(jìn)一步調(diào)整前景物體的光照使其與背景和諧。

圖片

12. MureObjectStitchModel: 輸入一對(duì)背景圖片和前景物體 (支持多張參考圖),把前景物體插入背景圖片指定位置(黃色邊界框),調(diào)整前景物體的姿態(tài)和光照,得到合理的合成圖。模型對(duì)于細(xì)節(jié)簡(jiǎn)單的物體和常見物體效果較好。對(duì)于細(xì)節(jié)復(fù)雜的物體,該團(tuán)隊(duì)建議用前景物體的 5~10 張圖片花 10 分鐘微調(diào)模型,這樣一來,該模型的細(xì)節(jié)保留能力會(huì)大幅提升。該團(tuán)隊(duì)也提供了微調(diào)模型的代碼。微調(diào)模型之后替換原來的 checkpoint 即可。

圖片

libcom 背后的技術(shù)

通常而言,圖像合成的用法是把一個(gè)前景物體插入到一張背景圖片中,得到一張合成圖。但是通過簡(jiǎn)單的剪切粘貼得到的合成圖會(huì)存在諸多問題,我們可以將這些問題都看作是前景和背景不一致問題,其中包括外觀不一致性幾何不一致性語(yǔ)義不一致性。三種不一致性又可進(jìn)一步分解成若干子問題(邊界、光照、陰影、放置、遮擋、視角等)。

為了解決這些子問題,研究社區(qū)又提出了很多子任務(wù)(如圖像融合、圖像和諧化、陰影生成、物體放置等)。在圖像合成中,不一致性(inconsistency)、子問題(issue)、子任務(wù)(sub-task)三者之間的關(guān)系如下圖所示。

圖片

上述這些子任務(wù)可以串行(sequential pipeline)或者并行(parallel pipeline)執(zhí)行,以解決前景和背景之間的不一致性,得到高質(zhì)量合成圖。

串行流程和并行流程如下圖所示,綠勾和紅叉表示是否執(zhí)行該子任務(wù)。

圖片

給定一對(duì)背景圖片和前景物體,串行流程是先在背景中尋找前景物體的合理放置,通過圖像混合解決邊界不自然的問題,通過圖像和諧化解決前背景光照不和諧的問題,通過陰影生成為前景物體在背景上生成合理的陰影。

而并行流程則是在一個(gè)模型中同時(shí)執(zhí)行多個(gè)子任務(wù),直接輸出最終的合成圖。并行流程也叫做生成式圖像合成,近兩年隨著擴(kuò)散模型的爆火而進(jìn)入大眾的視野。

libcom 的功能中有的基于串行流程,有的基于并行流程。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2020-08-18 07:46:42

編程底層 IT

2023-10-27 09:12:07

SAP鼎革獎(jiǎng)

2009-01-16 16:31:27

北大CIO班

2015-12-21 16:56:49

CIO時(shí)代網(wǎng)

2022-06-30 14:23:56

機(jī)器學(xué)習(xí)工具算法

2010-01-25 14:04:17

Android Wid

2015-10-29 13:14:57

CSTQB

2016-12-21 10:35:18

2013-05-07 16:04:56

2012-01-13 14:25:12

年度大典

2021-09-22 21:34:08

軟件成本

2013-08-21 14:22:25

國(guó)際信息通信展覽會(huì)

2015-09-30 11:49:14

信息安全大賽XDCTF

2011-07-01 13:17:24

第六屆敏捷中國(guó)大會(huì)敏捷中國(guó)大會(huì)北京

2011-09-13 15:02:00

第六屆敏捷中國(guó)大會(huì)

2011-10-25 10:53:42

云計(jì)算

2012-08-27 13:42:07

軟件測(cè)試

2009-01-16 17:38:15

CIO班
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产在线观 | 日本午夜免费福利视频 | 欧美精品首页 | 色综合视频 | 日韩精品av | 欧美性tv | 欧美精品一区二区三区在线四季 | 中文字幕欧美一区 | 日韩成人在线免费观看 | 国产成人精品一区二三区在线观看 | 亚洲a在线观看 | 91久久国产综合久久91精品网站 | 成人无遮挡毛片免费看 | 成人一区二区视频 | 在线看片网站 | 五月花丁香婷婷 | 狠狠色狠狠色综合系列 | 在线午夜 | 欧美天堂一区 | 欧美久久久久久 | 日韩精品一区二区三区视频播放 | 中文字幕视频在线观看 | 国产日韩欧美中文 | 日本一卡精品视频免费 | 久久精品黄色 | 亚洲综合色视频在线观看 | 亚洲国产欧美在线 | 欧美在线视频一区 | 国产精品久久久久久网站 | 久久久久网站 | 久久久久久国产精品免费免费 | 色视频网站 | 国产黄色小视频 | 久草在线 | 国产精品亚洲综合 | 性生生活大片免费看视频 | 亚洲精品www久久久久久广东 | 国产精品我不卡 | 91精品久久久久 | 青青草国产在线观看 | 欧美专区在线观看 |