斯坦福&UC伯克利開源突破性視覺場景生成與編輯技術,精準描繪3D/4D世界!
文章鏈接:https:arxiv.orgpdf2410.16770項目鏈接::https:ai.stanford.edu?yzzhangprojectsscenelanguage代碼鏈接:https:github.comzzyunzhiscenelanguage亮點直擊提出了一種場景表示方法,即場景語言,通過程序、詞匯和embeddings來捕捉視覺場景的結構、語義和身份。提出了一種無需訓練的方法,利用預訓練語言模型從文本和或圖像中推理表示。提出一個通用渲染模塊,將場景語言渲染成圖像。在文本和圖像條件下的場景生成和編...