比肩Sora!快手、北大開源,超高清10秒、24幀視頻模型
快手、北京大學和北京郵電大學的研究人員聯合開源了超高清視頻模型——PyramidFlow。PyramidFlow僅通過文本就能生成最多10秒、1280x768分辨率和24幀視頻,在光影效果、運動動作一致性、視頻質量、文本語義還原、色彩搭配等方面非常優秀,生成的視頻很棒。值得一提的是,PyramidFlow使用A100GPU在開源數據集上僅訓練了20,700小時,其能耗和生成效率比市面上同類開源視頻模型好很多,對于沒有大量算力的中小企業和個人開發者來說...