成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<li id="u44so"></li>

<li id="u44so"></li>

<bdo id="u44so"><source id="u44so"></source></bdo>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻

發(fā)布于 2024-7-26 09:50

瀏覽

0收藏

Stability.ai開源了創(chuàng)新視頻模型Stable Video 4D（簡稱“SV4D”），可將一個視頻輕松創(chuàng)建8個角度的動態(tài)3D視頻。

使用方法也非常簡單，用戶只需要上傳視頻然后選擇3D 相機姿勢，經過大約40秒左右的推理就能完成視頻創(chuàng)建。相比SV3D、STAG4D等同類模型，SV4D的推理效率和生成質量都獲得了大幅度提升。

開源地址：https://huggingface.co/stabilityai/sv4d

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻-AI.x社區(qū)

以目前的技術，用單個視頻生成動態(tài)3D視頻面臨不少難題。因為這涉及同時推理對象在未見過的相機視角下的外觀和運動，同時對單個給定視頻可能有多種合理的動態(tài)解釋進一步加大了生成難度。

此外，訓練一個能推廣到不同對象類型和運動的強大生成模型面臨兩大技術挑戰(zhàn)：1）缺乏大規(guī)模的動態(tài)3D對象數(shù)據(jù)集來訓練穩(wěn)健的生成模型；2）問題的高維性質需要大量參數(shù)來表示對象的3D形狀、外觀和運動。

而SV4D與以往生成模型不同的是，以一個統(tǒng)一的擴散模型作為基礎，能夠同時處理視頻幀和視角的生成。這種架構解決了之前需要分別訓練視頻生成和新視角合成的模型，效率低下的問題，而且還保證生成內容的一致性。

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻-AI.x社區(qū)

在技術實現(xiàn)上，SV4D使用了Stability.ai之前開源的SVD和SV3D網(wǎng)絡結構，融合了視頻和多視角擴散模型的優(yōu)勢。這個網(wǎng)絡結構包含一個多層的UNet，每層由一個殘差塊和三個帶有注意力層的transformer塊組成。

這些注意力層包括空間注意力、視角注意力和幀注意力，協(xié)同生成以確保生成的視頻在空間和時間上都具有高度的一致性。

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻-AI.x社區(qū)

視角注意力的設計是為了對每個視頻幀中的多視角圖像進行對齊，以參考視頻中的第一視角為條件。這種設計允許模型在生成新視角時，能夠保持與原始視角的一致性，從而確保了多視角視頻的連貫性。

幀注意力則進一步確保了視頻在時間維度上的連貫性，通過對每個視角的多幀圖像進行對齊，以每個視角的第一幀為條件，模型能夠生成在時間上連續(xù)且一致的視頻序列。

在模型訓練階段，SV4D面臨的一個關鍵難題是需要同時生成V×F的圖像網(wǎng)格，對于較長的輸入視頻算力會呈指數(shù)級增長。為了解決這個問題，研究人員通過順序處理交錯的輸入幀子集，同時保持輸出圖像網(wǎng)格的一致性。

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻-AI.x社區(qū)

在訓練數(shù)據(jù)方面，由于目前還沒有大規(guī)模的動態(tài)3D對象訓練數(shù)據(jù)集，研究人員就從現(xiàn)有的Objaverse數(shù)據(jù)集中精心整理了一個新訓練數(shù)據(jù)集ObjaverseDy。

在整理數(shù)據(jù)集時，進行大量數(shù)據(jù)篩選然后去除動畫幀數(shù)過少的對象。為了進一步過濾出運動極小的對象，研究人員對每個視頻的關鍵幀進行子采樣，并對這些幀之間的最大L1距離應用簡單閾值作為運動測量。在渲染訓練新視角視頻時，可靈活選擇相機與對象的距離，并動態(tài)調整時間采樣步驟，以確保獲得高質量的動態(tài)3D對象集合和渲染的多視角視頻。

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻-AI.x社區(qū)

為了評估SV4D的性能，研究人員在ObjaverseDy、Consistent4D和真實世界視頻數(shù)據(jù)集DAVIS等進行了綜合測試，并與其他先進模型進行了比較。

在Consistent4D數(shù)據(jù)集上，SV4D在視頻幀一致性方面表現(xiàn)出色，同時保持了與其他方法相當?shù)膱D像質量。與SV3D和STAG4D相比，F(xiàn)VD - F分別降低了31.5%和21.4%。

開源視頻模型SV4D，一鍵創(chuàng)建8角度動態(tài)3D視頻-AI.x社區(qū)

在Objaverse數(shù)據(jù)集上，SV4D在視頻幀一致性和多視角一致性方面都有顯著優(yōu)勢，F(xiàn)VD - F更低，F(xiàn)VD - V更好，在FVD - Diag和FV4D方面也超過了先前的先進方法，證明合成的新視角視頻在視頻幀和多視角一致性方面更好。

本文轉自 AIGC開放社區(qū) ，作者：AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/ErIOZExah6vU-4RbfHG-xg??

標簽

贊

收藏

回復

舉報

回復

相關推薦

如何在淘寶人生2一鍵定制你的專屬3D數(shù)字人

pangguiyu ? 5530瀏覽 ? 0回復
CVPR 2024 | 文本一鍵轉3D數(shù)字人骨骼動畫，阿爾伯塔大學提出MoMask框架

輕薄滴假象 ? 3379瀏覽 ? 0回復
DiT架構大一統(tǒng)：一個框架集成圖像、視頻、音頻和3D生成，可編輯、能試玩

輕薄滴假象 ? 3033瀏覽 ? 0回復
3D生成競技場來了！比拼360°環(huán)繞視頻，最強模型由你pick

Crystalcxt ? 2862瀏覽 ? 0回復
2D頭像生成3D虛擬人開視頻會，谷歌新作讓人難繃

輕薄滴假象 ? 2435瀏覽 ? 0回復
DreamTech聯(lián)合南大和牛津發(fā)布最強3D內容生成大模型——Direct3D

angel ? 3332瀏覽 ? 0回復
3D版"裁縫"開源來襲！Tailor3D:自定義3D編輯和資產生成（港大&上海AI-Lab&港中文）

angel ? 2738瀏覽 ? 0回復
Lumina-T2X: 一款集成圖像、視頻、音頻和3D生成的多模態(tài)擴散模型

sword_hero ? 3041瀏覽 ? 0回復
精準可控新視角視頻生成+場景級3D生成！北大&港中文&騰訊等開源ViewCrafter

angel ? 2906瀏覽 ? 0回復
麻省理工創(chuàng)新模型：用2D視頻擴散，生成 3D 視頻

Aceryt ? 3106瀏覽 ? 0回復
3D生成基礎模型來了！只需5秒，高質量3D資產規(guī)模化生成！南洋理工等重磅開源3DTopia-XL

angel ? 2693瀏覽 ? 0回復
生成任意3D和4D場景！GenXD：通用3D-4D聯(lián)合生成框架 | 新加坡國立&微軟

angel ? 2532瀏覽 ? 0回復
斯坦福&UC伯克利開源突破性視覺場景生成與編輯技術，精準描繪3D/4D世界!

angel ? 2459瀏覽 ? 0回復
只需一張圖片！實現(xiàn)任意3D/4D場景生成！港科大&清華&生數(shù)發(fā)布DimensionX

angel ? 4860瀏覽 ? 0回復
3D任意部位分割：FIND 3D模型實現(xiàn)零樣本開放世界文本查詢分割

AIGC最前線 ? 2303瀏覽 ? 0回復
從2D到3D：北大等開源Lift3D，助力精準具身智能操作！

angel ? 2987瀏覽 ? 0回復
清華、中南開源3D交互實體AI Agent LEGENT

Aceryt ? 2250瀏覽 ? 0回復
首篇2D/視頻/3D/4D統(tǒng)一生成框架全景綜述(港科大&中山等)

angel ? 2381瀏覽 ? 0回復
3D動畫革命！北航團隊破解交互難題，一鍵生成影視級打斗場面

穿越時空111 ? 1695瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦 2025-04-24 09:57:36發(fā)布
字節(jié)跳動開源多模態(tài)AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數(shù)也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：重磅！OpenAI發(fā)布SearchGPT，挑戰(zhàn)谷歌、進軍搜索引擎！

下一篇： OpenAI發(fā)布最新大模型安全對齊獎勵方法——RBR

社區(qū)精華內容

目錄

主站蜘蛛池模板：天天躁日日躁狠狠的躁天龙影院 | 亚洲精品中文字幕在线观看 | 国产黄色免费网站 | 成人免费视频 | 欧美日韩成人在线 | 一级黄色大片 | 国内久久 | www97影院| 欧美日韩精品中文字幕 | 欧美在线视频不卡 | 国产精品自产拍 | 毛片一区 | 精品国产亚洲一区二区三区大结局 | 精品一二三区 | 9191成人精品久久 | 亚洲精品福利视频 | www国产亚洲精品 | 丁香综合 | 久久久久亚洲精品 | 日韩视频区 | 久久久新视频 | 四虎影院免费在线播放 | 91极品尤物在线播放国产 | 粉嫩一区二区三区性色av | 精品久久精品 | 国产精品不卡 | 福利成人| 国产欧美日韩一区 | 99精品国产一区二区三区 | 二区视频| 亚洲国产成人精品久久久国产成人一区 | 91精品国产乱码麻豆白嫩 | 亚洲免费久久久 | 日韩一级二级片 | 国产精品三级 | 依人成人| 亚洲激情自拍偷拍 | 97精品国产97久久久久久免费 | 天天亚洲| 成人在线观看网站 | 日韩无|

<cite id="gk88c"></cite>

<rt id="gk88c"></rt>

<cite id="gk88c"></cite>

<bdo id="gk88c"><tbody id="gk88c"></tbody></bdo><abbr id="gk88c"><strong id="gk88c"></strong></abbr>

<table id="gk88c"></table>

<rt id="gk88c"></rt><abbr id="gk88c"><tbody id="gk88c"></tbody></abbr><rt id="gk88c"></rt>

<li id="gk88c"></li>