AI短視頻賽道:只需一個提示詞,文本影像畫外音一鍵搞定
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
小美、小帥、喪彪和佛波勒,這幾位AI配音的主角,已經成為某音某手用戶心里比“李華”還要親的朋友們了。
然鵝,配音顯然已經滿足不了AIGC“大放異彩”之心,它對短視頻賽道的入侵再加一:
生成式AI,開始拍視頻!
還是帶畫外音的那種。
這個技術來自一個名為QuickVid的新網站,它把好幾個生成式AI組合成了一個工具。
創建的短視頻適配YouTube、 Instagram、 TikTok和Snapchat等。、
哇哦,Unbelievable~
QuickVid,明星AI產品雜燴
QuickVid,是個剛出生7天(去年12月27日推出)的小baby網站。
年紀雖小,但不妨礙它一展身手。讓我們看看這個網站要怎么玩兒:
首先,用戶需要輸入一個提示詞或一小句提示語,用來描述想要創建的視頻的主題。
比如本文開頭的視頻,就由短短的兩個提示單詞“Machine Learning”生成。
這個功能,依托的是GPT-3的文本生成能力。
接著,根據這些提示,QuickVid會從免版稅的媒體儲備庫Pexels中選擇一個背景視頻,并使用DALL-E2生成覆蓋圖像。
然后,QuickVid會通過Google Cloud的文本到語音API輸出畫外音。
這一步可以選擇克隆用戶自己的聲音。
因為創始人了解到,好多創作者對自己制作的AI配音視頻提不起多高的興趣,畢竟視頻配音沒有用自己的聲音。
最后一步非常簡單,就是把上述元素合并。
當當當當!一個AI生成的短視頻就誕生了。
GPT-3、DALLE-2……總而言之,QuickVid像是一道現有AI產品的明星雜燴。
并且,利用重復的、模版化的B-roll短視頻格式,還避免了必須自己生成視頻這一關。
值得關注的一點是,因為允許Copilot在GitHub的公共倉庫上“偷代碼”,微軟、GitHub和OpenAI正因被指控違反版權法而接受集體訴訟。
這個案子對DALL-E2這類的AI產品有著深遠的影響,因為人們發現AI可以從訓練集中“抄襲”。
不過QuickVid并不太擔心,他的創始人Daniel Habib大膽放話:
如果明天出現一起讓OpenAI消失的訴訟,我們也不怕。
因為我們有好幾種替代方案可以為QuickVid提供AI生產力呢~
這里提到的替代方案,是類似于DALL-E2的開源系統Stable Disusion,QuickVid已經在用它測試生成頭像圖片了。
Habib曾是Meta的員工,負責Facebook Live和視頻基礎設施的開發,他用幾周的時間搞出了QuickVid。
根據一些媒體的實測,QuickVid生成的視頻質量好壞參半。
生成的背景視頻內容往往十分隨機,有的和提示詞只能有拐十八道彎的一丟丟聯系。
不過也不算稀奇,因為QuickVids目前背靠的僅限于Pexels,而且DALL-E2生成的圖像本身也有文本混亂和比例失調的局限性。
官方針對這一點給出的回應是,“我們每天都在修補bug喲”!
現在的QuickVid功能還比較簡單,但已經足以湊出一個帶有信息量的YouTube或TikTok短視頻了。
△推特用戶用QuickVid生成短視頻
這個月,QuickVid會維護更新一些個性化功能。
擺在QuickVid們面前的幾道坎
Habib在回復TechCrunch電子郵件時,將QuickVid稱為為創作者提供快捷制作高質量內容的工具。
“(目的是)幫助創作者增加內容輸出,減少過度勞累的風險。”
創作者生產短視頻時的工作量是減少了,但用戶和審查者的工作量蹭得往上漲。
大量內容的一鍵生成,讓目前質量還不高的視頻內容,連字帶影像,有瞬間擠滿整個視頻網站的能力。
沒錯,像QuickVid這樣的工具,可能會讓已經擁擠的短視頻網站和APP充斥著沒啥營養的信息,以及重復內容。
回答相關問題時,Habib把相關責任歸在平臺身上。
他認為,是視頻平臺的算法而不是QuickVid來決定這些視頻會不會被推薦、是否會被放在首屏。
“如果人們不想看你的視頻,那么你在YouTube這類平臺發了視頻也傳播不開。”他補充道,“不管你是不是使用QuickVid生成的視頻,但凡內容質量太低,人們就會拋棄你的頻道。”
當然,站在QuickVid面前的難題顯然不止這一個,它面臨諸多問題考驗。
比如有創作者的潛在抵制。
不管是因為成本問題(QuickVid的包月費用是10美元/月),還是因為會面臨與AIGC搶飯碗的窘境,對自己內容質量更為看重的創作者們,有的會選擇不使用這類工具。
再比如版權問題。
根據Habib的說法,QuickVid用戶們可以將自己生成的視頻商用,但是AIGC的版權問題本就處于曖昧不明的階段。
就前幾天的事兒,美國專利和商標局(USPTO)撤銷了對AI漫畫的版權保護,稱要獲得版權保護需要人工授權。
不過,Habib覺得USPTO的這一行為跟QuickVid沒啥直接關系,因為那只涉及AI產品的“可專利性”,而不涉及創造者使用和商業化其內容的權利。
創作者關心的是放出高質量的內容,幫助頻道漲粉。
除了法律問題,擺在QuickVid面前的還有內容審查這個大工程。
雖然OpenAI已經利用過濾器來防止偏激內容和歪曲事實的內容生成,但bug依舊存在。
GPT-3時不時仍會提供錯誤信息,尤其是近期發生事件,因為近段時間的信息還沒進入它的知識庫。
這對ChatGPT來說也一樣,而且后者已經被證明會被“套出”性別歧視和種族主義相關內容。
當Techcrunch進行測試時,QuickVId在“批判性種族理論教育學生”這個提示下,生成了一個視頻,其內容暗含觀點,認為批判性種族理論可以用來給學生洗腦。
對此,QuickVid主要依賴的還是OpenAI的過濾器來避免錯事兒發生。
同時還動員每一個使用QuickVid的用戶,宣稱大伙兒有義務手動審查每一個由QuickVid創建的視頻,以確保“一切都在法律的范圍之內。”
One More Thing
不過有個值得令QuickVid們小興奮的消息,那就是谷歌并沒有區別對待人寫文本和AI文本。
不過谷歌還是對那些“旨在操縱搜索排名而不是幫助用戶”的內容采取裁制,因為這些內容“沒有足夠的價值”。
這就讓QuickVid們需要小心了,因為純自動化流程生成的內容,很容易就被歸到“沒啥價值”那一類。
不過說到底,如Habib所說的那樣,生成式AI革命是不可阻擋的。
如果AI生成短視頻開始大規模流行,各類平臺不會也不敢拿它怎么樣——至少不會全面禁止它。
你會因為有了這樣便利的工具,成為短視頻平臺的創作者嗎?
也許今晚打開短視頻App刷到的第一個推薦就是你的(手動狗頭)。
?直達鏈接:???https://www.quickvid.ai/?