出品 | 51CTO技術棧(微信號:blog51cto)
騰訊開源日第二天!在Hunyuan3D-2.0基礎上打造的5款模型終于全部現身!
昨天介紹了,多視圖版本模型Hunyuan3D-2-mv,以及輕量級 mini 模型Hunyuan3D-2-mini。
而今天宣布開源的模型則是Turbo系列模型。即Hunyuan3D-2 Turbo、Hunyuan3D-2-mv Turbo和Hunyuan3D-2-mini Turbo。(這樣看著有點繞,大家可以翻到第二張圖,原模型與Turbo版是上下是對應關系,很清晰~)
?Turbo版的特點就一個字:快!非常快!因為AI建模涉及到渲染問題,跑起來還是需要耐心的,Turbo這波直接把時長從半分鐘干到了1秒鐘、甚至是0.5秒!
?當然,這樣Hunyuan3D-2.0家族就有6款模型了,我們簡單說說官方給的“選型指南”:
Hunyuan3D-2:需要生成高質量三維模型的用戶,參數量高達11B,適合GPU性能較好的設備
Hunyuan3D-2-mini:設備性能受限或需要快速反饋的用戶
Hunyuan3D-2-mv:需要多視圖控制或手繪多視圖的用戶,尤其適合原畫師、設計師等等
Turbo系列:需要快速生成模型的用戶,適合實時場景or快速迭代
??Turbo系列為啥能做到這么快?背后的殺器就是Flash VDM。今天官方花了很大篇幅去講背后的實現原理,我們簡單總結下,先看第3張圖,Flash VDM的核心技術點即DiT 加速和VAE 加速:
Flash VDM通過減少采樣數量和優化采樣計算過程,將生成模型的迭代步數從50步減少到5步。
并大大降低了VAE解碼的時間占比——要知道VAE 解碼占據了整個建模75.88%的時間!
經過這個黑科技的加持,Turbo最小顯存占用可降低到5GB以下,生成時間縮短到1秒以內,支持4050等顯卡,還可以在Mac的M芯片上部署。
最后,團隊小哥也上了把價值,這么牛的技術,之所以大方開源,就是為了推動生態的繁榮,讓中國AI技術更進一步!
他們還引了一句詩“一枝獨秀不是春,百花齊放春滿園”。
?最后附上鏈接,大家玩起來吧:
官網:https://3d.hunyuan.tencent.com/
Github:https://github.com/Tencent/Hunyuan3D-2