AI生成3D一手實測:賣家秀vs買家秀,差一個宇宙 原創(chuàng)
伴隨著AI的爆火,用AI生成三維內(nèi)容(3D AIGC)作為AI的新玩法之一,從今年開始明顯受到越來越多的關(guān)注。
正是在這樣的背景下,??LGM??(即 Large Gaussian Model,大型多視角高斯模型)由北京大學(xué)、南洋理工大學(xué) S-Lab 和上海人工智能實驗室的研究者聯(lián)合提出,旨在依靠一張二維圖片,就可5秒生成同款3D物體。
官方給出的賣家秀
??LGM??現(xiàn)已上線appmall.ai,今天我們就對這款剛剛出品不久的3D AIGC應(yīng)用進(jìn)行實測,看看在實際使用中它能為我們帶來哪些好玩的體驗。
在哪體驗LGM?
現(xiàn)在訪問??appmall.ai??,即可通過首頁或搜索功能安裝LGM,低至2.3元/小時,按分鐘計費,無需安裝部署,即可一鍵在線體驗。
如何使用LGM?
??LGM??的操作面板非常簡單,左側(cè)功能區(qū)可以上傳參考圖片、輸入prompt、調(diào)節(jié)參數(shù),右側(cè)則直接展示AI基于參考圖,建構(gòu)出來的3D物品。
(1)是否要輸入prompt?
經(jīng)過實測,prompt是否輸入并不太影響生成結(jié)果。如果輸入prompt,那么根據(jù)官方給出的實例,也是只需要簡單化的內(nèi)容即可,比如furry fox head,mushroom house這種。
同時,negative prompt可以理解為保證結(jié)果水準(zhǔn)的外框和標(biāo)尺,目前默認(rèn)的設(shè)置就是去掉難看、不清晰、像素模糊、不自然色彩、糟糕光線等效果,這項參數(shù)保持默認(rèn)就可以。
(2)下方三項調(diào)節(jié)參數(shù),要調(diào)嗎?
? elevation(-90 到 90):表示仰角,用于確定觀察或生成三維物體的視角垂直方向角度。-90 度代表垂直向下看(俯視),0 度表示水平方向觀察(默認(rèn)值),90 度則是垂直向上看(仰視)。通過設(shè)置不同的仰角,可以從不同的垂直角度來生成或查看三維模型,從而滿足不同的視覺需求,比如模擬從地面仰望物體或從高空俯瞰物體等場景。
? inference steps(1 到 100):推理步驟數(shù),在生成三維物體的過程中,模型需要進(jìn)行一系列的計算和推理操作來逐步構(gòu)建出最終的結(jié)果。推理步驟數(shù)就是控制這個過程的迭代次數(shù)。一般來說,步驟數(shù)越多,模型有更多的機(jī)會對生成的結(jié)果進(jìn)行細(xì)化和優(yōu)化,可能會得到更精確、質(zhì)量更高的三維物體,但同時也會增加計算時間和資源消耗。如果步驟數(shù)太少,可能生成的結(jié)果不夠理想,存在細(xì)節(jié)缺失或不準(zhǔn)確的情況。
? random seed(0 到 100000):隨機(jī)種子,它是一個用于初始化隨機(jī)數(shù)生成器的值。通過設(shè)置固定的隨機(jī)種子,可以確保在相同的模型參數(shù)和輸入條件下,每次生成的結(jié)果具有一致性和可重復(fù)性。如果不設(shè)置隨機(jī)種子或者使用不同的隨機(jī)種子,那么每次運行模型時,由于隨機(jī)因素的影響,生成的三維物體可能會有所不同。這樣可以方便用戶在需要時獲取特定的生成結(jié)果,也有助于對模型的性能進(jìn)行評估和比較。
(3)易用性如何?AI小白可以用嗎?
界面簡單,保持默認(rèn)參數(shù)也能玩,另外在生成時間方面,“5秒出結(jié)果”誠不我欺,LGM實測的產(chǎn)出時間確實比其他AI應(yīng)用都要短。
所以,至少從便捷性、降低AI使用門檻的角度來說,LGM是完全可以達(dá)標(biāo)“易用性”“新手友好”等評價的。
(4)需要上傳什么樣的參考圖?
從實測來看,純平面圖(如二維插畫)、主體較多、主體元素較多、圖片非高清等情況下,基本上很難達(dá)到預(yù)期的效果。
純平面生成
多主體生成
復(fù)雜主體生成
(5)生成效果怎么樣?
從實測來看,生成效果“買家秀”與官方“賣家秀”的差距還是較大的。可能受制于默認(rèn)30 steps的限制,??LGM??的出品并不穩(wěn)定。
比如在面對毛絨玩具這種其訓(xùn)練過程中高頻接觸的物品種類時(官方給出的“賣家秀”里有對玩具熊的訓(xùn)練結(jié)果),它的表現(xiàn)就還可以。
但是如果換其他材質(zhì),在一些清晰化元素(比如五官)的處理上,存在變形。
畢竟LGM發(fā)布時間并不長,存在短板是非常正常的事情。我們既不應(yīng)該盲目追捧某種新生技術(shù),也沒有必要將初代水平等同于后續(xù)水平而一棒子打死,反而應(yīng)該客觀看待“賣家秀”和“買家秀”的差距、承認(rèn)可優(yōu)化空間,這樣才能更好地推動AI應(yīng)用行業(yè)的健康長遠(yuǎn)發(fā)展。
當(dāng)然,??LGM??完全支持通過調(diào)節(jié)參數(shù),如增加生成迭代步驟、上傳高清參考圖等方式,來優(yōu)化生成結(jié)果。這一步就留給廣大的AI愛好者去自行發(fā)掘吧。
每項3D內(nèi)容生成之后,LGM也支持將3D內(nèi)容通過視頻的格式進(jìn)行下載,方便用戶后期處理或使用,是不是也不失為一個有趣的AI小工具呢?還在等什么,快來appmall.ai一鍵體驗吧。
