國產3D生成大模型火爆外網!歪果仁年都不過了,都在測這個
“3D大模型終于可以生成銳利的邊角了!”
“在鉆研了一陣3D人工智能后,我總算通過Hyper3D.ai用上了Rodin1.5,它真的可能改變游戲規則。”
圖片
2024年的最后一天,隨著3D生成工具Rodin Gen-1.5的上線,在網絡上掀起了新一波對于3D生成討論的熱潮。。
用Rodin背后的研發團隊——影眸科技CTO張啟煊的話說:
這是3D大模型第一次能生成如此銳利的邊緣——我愿稱之為“圓滑當道時代的銳利異類”——對于CAD類工業模型與硬表面模型,它有絕對的優勢,擴大了3D生成的使用群體。
體驗鏈接:Hyper3D.ai
由于Rodin的這次更新恰逢年末,海外很多用戶都在放假,但這也并沒有阻擋用戶們對測試這個新模型的熱情:
不論是《雙城之戰》中的海克斯拳套——
圖片
或者是細節更多的賽博朋克靴子——
圖片
對于這些結構鮮明的模型,Rodin Gen-1.5都是信手拈來。
甚至有動畫師把Rodin生成的資產直接運用在了動畫制作中(以下視頻中的3D資產有70%由Rodin生成)。
圖片
△來源:B站UP主 做3D的小鄧子
當然這樣結構鮮明的生成模型,對3D打印愛好者也是極其友好的,稍作涂裝就是一只精巧的玩具:
圖片
AI生成領域的專業用戶也對Rodin生成模型的質量贊賞有加:
圖片
然而,這已經不是影眸科技這家3D大模型公司第一次給這一領域帶來一些“小震撼”了。
3D大模型研發的“非共識”道路
2024年8月,全球最頂尖的計算機圖形學會議 ACM SIGGRAPH 大會上,影眸與上科大聯合研發的3D原生大模型Clay發表,并與團隊同年研發的3D服裝生成模型Dresscode同時獲得SIGGRAPH2024最佳論文榮譽提名,團隊也成為這一領域內唯一在同一個學術頂會上獲得兩項該提名的中國團隊。
Clay的提出顯著提升了3D生成的質量,也成為了當前學術界3D大模型廣泛認可的技術路徑。
△Clay、DressCode獲得SIGGRAPH2024最佳論文榮譽提名
基于CLAY的三維資產生成工具Rodin Gen-1在去年6月推出,產品以它最接近“Production-Ready”的生成效果,上線后就備受關注。
它的生成質量、可用性都代差級地領先當時的同類產品。憑借其優質的生成效果,Rodin僅用45天就達成了100萬美元ARR,而大名鼎鼎的HeyGen達到這個數字花了7個月。
這背后,來源于影眸始終如一對“Prodution-Ready”的追求。
“Production-Ready”這個詞來自CG行業。CG行業中有一個詞——后期(Post-Production),而“Production-Ready”的意思就可以直接接入到后續的流程中使用。
這也是影眸產品研發、開發的共識,正是這樣的共識,讓影眸在開始3D大模型研發之初,就走上了一條“非共識”的道路。
在那時,2D升3D的技術方案是學術界主流的3D生成方式,同時,市面上已經有團隊推出了基于2D升維技術路徑的3D生成產品。
可是影眸憑借多年的技術探索和產品打造經驗,他們看到了2D升維路徑的瓶頸。2D數據終究只記錄了真實物體的一個側面,再多角度的圖像也無法完整描述一個3D內容,因此模型學到的東西依舊存在很多信息缺失,生成結果還是需要大量的人工修正,很難滿足使用需求。唯一的解法是從一開始就用3D原生數據。
彼時,影眸正遭遇著資本環境快速變差導致的融資失利。于是一個艱難的選擇擺在了影眸面前:
到底是先用主流技術做出一個產品上牌桌,還是用更大的力氣去死磕一個還不明確的技術方向。
影眸團隊選擇了后者,更難、更需要時間、但是更正確的事。
7個月后,對技術的精準直覺和堅持給了他們回報。
而Rodin Gen-1.5的發布更是影眸對“Production-Ready”堅持的更進一步。通過新一代3D原生表達,Rodin Gen-1.5全面解決了行業內長期存在的薄面與邊緣銳度問題,再次提高 3D 生成全行業商用標準。
無機形狀的生成能力、銳利的邊緣以及非常干凈的拓撲結構,這是Rodin 1.5在3D生成能力上最凸顯出來的性能提升。這一點在游戲,尤其是產品設計領域中尤為重要。這次升級也讓影眸的產品領先幅度再次擴大。
已進入游戲、動畫工作流
現在,用戶借助Rodin對幾何以及PBR材質的精準生成能力,能夠快速地制作適用于不同場景的三維資產。
用戶們已經在試驗Rodin輔助游戲制作的能力。
有直接生成單個靜態物件的。
△來源:X.com @MartinNebelong
也有為大場景批量生成npc的。
圖片
事實上,已經有用戶將Rodin生成的結果放入自己開發的游戲中了。
圖片
也有個人開發者基于Rodin開發了一整套工作流。
圖片
△來源:B站UP主 T-BOY
動畫、影視制作也是Rodin應用的一大場景。
有用戶使用Rodin生成的資產搭建了一整個城鎮,制作了簡單的動畫。
△來源:X.com @jungle_jimjim
也有用戶和現有AI路線結合,在離線引擎中制作高質量CG內容。
△來源:X.com @Itryandlearn3D
稍作調整,Rodin的資產質量甚至可以達到影視級。
△來源:B站UP主 T-BOY
3D大模型何時迎來“ChatGPT時刻”?
影眸認為,在Rodin-Gen1.5之前,3D大模型的發展主要有2個階段:
- Level1 —— Clay發布前的基于2D升維技術路徑的3D生成,需要大量人工后期的修正才能達到可用標準
- Level2 —— 以Clay為基礎的3D原生三維生成大模型,剛剛觸碰到“Prodution-Ready”的標準
而Rodin Gen-1.5的發布,已經把三維大模型帶到了Level3的程度,它對生成模型更加精確、細致地表達,解決了3D大模型一直以來存在的問題,大幅拓寬了3D大模型的使用邊界。
過去幾年里,生成式AI已在文字、圖像、音頻、視頻取得重大進展,3D生成常被認為是“世界模型(World Model)”的 “最后一塊拼圖”。隨著技術進步和消費需求的提升,3D行業未來的發展前景廣闊。去年,AutoDesk、Meta、NVIDIA、騰訊、微軟等紛紛推出了自己的3D生成大模型,積極布局這一前沿領域。在與行業巨頭的競爭中,影眸團隊憑借其在3D建模/圖形學領域的深耕與對3D行業用戶需求洞察,在技術與商業化方面長期領先。
在未來,3D生成還有很大的可供挖掘的空間。要實現在AR/VR/虛擬世界中的個人創作,就要解放用戶的3D內容創作能力。作為構建在三維空間中的世界,未來機器對世界的理解也必然基于三維,所以在具身智能領域,對3D的需求是始終存在的。
相信在影眸科技等3D大模型團隊的共同努力下,我們很快就會迎來3D領域的“ChatGPT”時刻。