字節跳動發布業內首個視頻轉場推薦方案,成果入選ECCV2022
近期,字節跳動智能創作團隊研發了業內首個通用視頻轉場推薦方案AutoTransition,致力于解決目前視頻剪輯中存在的學習成本高,編輯效率低等問題,該項成果目前已入選計算機視覺領域頂會ECCV2022(European Conference on Computer
Vision)。
隨著短視頻的迅猛發展和普及,每天都有海量用戶通過視頻來記錄和分享生活。對于缺乏專業剪輯和視頻編輯知識的普通用戶而言,視頻的制作和剪輯卻具有很高的門檻。
AutoTransition兼顧靈活性與高性能,面向轉場這一視頻剪輯中最常使用的編輯元素,通過將轉場推薦任務建模為多模態匹配和檢索問題,從大量視頻數據中自動學習轉場匹配關系,實現了對任意視頻和音頻輸入推薦高質量的轉場效果。借助AutoTransition,用戶可以快速一鍵生成優質轉場視頻,使剪輯效率得到顯著提升。
圖說:視頻轉場類別分類網絡,訓練Transition Embedding作為轉場的特征表示
據介紹,相比于基于一系列預定義的策略或隨機選取的剪輯方式,AutoTransition能夠有效地從海量數據中學習到專業的剪輯知識,并基于對視頻和音頻的理解推薦高質量轉場;相比于人工剪輯,AutoTransition模型能夠在極短時間內完成推薦,顯著提升編輯效率,并且推薦結果可媲美甚至超越專家剪輯的效果;得益于優秀的擴展性,AutoTransition可以方便地和其他的視頻處理技術結合(例如視頻高光提取、視頻聚類和排序等),以實現更全面的視頻剪輯能力,幫助視頻工作者進一步提升視頻編輯的效率。
目前,AutoTransition的衍生技術已經成功落地于抖音和智能創作ToB工具箱等多項業務場景中。字節跳動智能創作團隊表示:首個視頻轉場數據集和AutoTransition代碼均已開源,以期吸引更多同行關注這一新領域,共同推動智能視頻剪輯的快速發展。未來,該團隊準備將這一方案擴展到更多的視頻剪輯元素,包括但不限于視頻動畫,視頻貼紙和裁剪變換等,同時還將嘗試和其他視頻處理技術結合,以實現更全面的視頻剪輯功能。
??論文鏈接:AutoTransition: Learning to Recommend Video Transition Effects??