斯坦福AI視頻生成工具免費(fèi)開放!30秒時(shí)長(zhǎng),馬斯克看了效果會(huì)沉默
將音頻、圖像、視頻整合進(jìn)同一工作流,這個(gè)由斯坦福初創(chuàng)公司發(fā)布的視頻工具火了!
預(yù)覽版支持生成30S逼真視頻,網(wǎng)友們直呼不輸Luma。
搶先看性轉(zhuǎn)版馬斯克激情說唱:
與Luma一樣,目前這個(gè)名為Hedra的工具可以免費(fèi)試用。
在給大家?guī)硪皇謱?shí)測(cè)前,再來看一波新鮮整活兒~
讓面值10德國(guó)馬克上的“數(shù)學(xué)王子”高斯自我介紹:
讓石像說話、眨眼、擺動(dòng)頭部:
生成虛擬土豆人角色:
讓僵尸管家變換表情:
好了,鑒于近期翻車事件過多,讓我們直接啟動(dòng)實(shí)測(cè)。
Hedra究竟如何?
Hedra目前可在桌面和移動(dòng)設(shè)備使用,這里我們直接訪問官網(wǎng)。
Hedra的目標(biāo)是建立一個(gè)人人都可訪問的多模式創(chuàng)作工作室,因此將音頻、圖像、視頻都結(jié)合在了一起。
在音頻部分,官方預(yù)置了6種音色,可以文字轉(zhuǎn)音頻,也可以直接上傳音頻文件。
然后輸入你的角色描述,中間可以直接生成圖像,當(dāng)然也支持上傳圖像。
最后一鍵生成視頻,以下為實(shí)測(cè)結(jié)果(約50秒時(shí)間生成了2秒視頻):
順便一提,一開始本來想傳Sam Altman的圖片,結(jié)果被官方識(shí)別為“名人”予以拒絕了。
除了以上小編實(shí)測(cè),已經(jīng)體驗(yàn)了Hedra的網(wǎng)友們也反饋了一大波實(shí)測(cè)結(jié)果。
而且官方挨個(gè)在線回應(yīng)了,接下來一起瞅瞅~
有網(wǎng)友細(xì)心捕捉到了Hedra視頻中的動(dòng)漫人臉畸變情況。
不過在鏡頭拉近,類似特寫時(shí)這種情況有所改善。
官方坦言,目前Hedra確實(shí)還在與非人類角色作斗爭(zhēng)。
但是對(duì)于人獸混合的情況,官方表示效果還行,比如有網(wǎng)友生成了如下視頻:
此外,也有網(wǎng)友提到了Hedra審核過嚴(yán)的問題。
網(wǎng)友想用以上3張及其他圖像試著生成類似電影的片段,結(jié)果被系統(tǒng)判定為“名人”而拒絕生成。
該網(wǎng)友表示:
這些是AI生成的,不是名人。雖然安全很重要,但誤判過多。
對(duì)此,官方多次回應(yīng)后續(xù)會(huì)看情況調(diào)整。
以上為網(wǎng)友提及率最高的兩個(gè)問題,官方也在更多回復(fù)中透露了其他情況。
- 無限時(shí)長(zhǎng)(開放預(yù)覽為30秒)
- 每60秒生成90秒(如果官方H100供應(yīng)充足)
- 模型目前提供音頻到視頻,但正在擴(kuò)展其他輸入形式
- 即將推出16:9的視頻尺寸
- 模型主要測(cè)試了中文和英文輸入,且中文表現(xiàn)還不錯(cuò)
- 模型目前提供API,可加入官方Discord
誰(shuí)造出了Hedra?
Hedra此次發(fā)布的基礎(chǔ)模型Character-1由前斯坦福大學(xué)頂尖研究團(tuán)隊(duì)領(lǐng)導(dǎo)。
首席執(zhí)行官Michael Lingelbach,斯坦福大學(xué)前博士生,從事空間智能研究。
另一負(fù)責(zé)人Alex Bergman,同樣來自斯坦福大學(xué),研究領(lǐng)域包括計(jì)算成像、計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)。
在谷歌學(xué)術(shù)頁(yè)面,Alex Bergman發(fā)表或參與發(fā)表了數(shù)量頗豐的論文。
除了Hedra,最近幾天視頻生成工具正在迎來爆發(fā)期。
有網(wǎng)友也借機(jī)整合了Hedra、Luma、elevenlabsio等,不到1分鐘制作了一個(gè)短片。
工具地址:https://www.hedra.com/
Discord:https://discord.com/invite/KXeUUa6cXD