Gen-3開放內測,網友實測demo驚人!魔都時裝秀一絕,卻依舊不懂物理世界
眾人翹首以盼的Gen-3 Alpha,終于向部分超級創意合作者開放了。
拿到內測資格的網友,可是爽了一把。
比起上一代,Gen-3 Alpha在細節、一致性和運動表現方面,又有了史詩級改進!
還有人表示,Gen-3讓我們看到了一個令人興奮的未來——用不了多久,我們就能看到完全由AI生成的電影了。
不過,不可否認的是,Gen-3 Alpha在理解物理世界上,還是有一定的差距。
就拿網友測試Gen-3和Sora對比的一個demo中,越野車在陡峭的山坡中快速行駛,輪胎塵土飛揚。
明顯可以看出,Gen-3生成了塵土僅在車前方出現的情景。
就連此前的Sora也是,生成了只有四條腿的螞蟻,被網友吵得不可開交。
不僅如此,這幾天比較火的另一個AI視頻模型Dream Machine,硬是把體操運動員高空表演,拍成了恐怖片。
所有表演者的四肢,在做空中翻轉等技能時,不是分散變形,就是合二為一。
另有網友測試Gen-3后,發現也是存在同樣的問題。
下面這位直接站在假象的體操桿上表演。
這種時刻,當然少不了LeCun的嘲諷,他激動地再次重述,「視頻生成模型根本不理解基本的物理,更不用說人體了」。
他肯定了AI視頻模型會隨著時間推移,變得越來越好。
「不過,真正理解物理的學習系統將不是生成式的。所有的鳥類和哺乳動物,比任何視頻生成系統更了解物理學。然而,他們都無法生成詳細的視頻」。
各種演示demo,網友玩瘋
開放2天后,Gen-3 Alpha的實測demo已經鋪屏全網,接下來,讓我們一睹為快。
看看如今敢叫板Sora的AI視頻模型究竟強在哪?差距又在哪?
人物細節精準刻畫,表現更有張力
水中物理學,Gen-3做的還是很驚艷的。
在人物的刻畫,表現張力,不得不說Gen-3真的很強。
這雙彈鋼琴的手,是那么地完美。
在Gen-3筆下,還可以畫出靈動的長著兔耳朵的小女孩。
作者表示,其實自己的提示中寫錯了(長著兔毛的女孩),不過Gen-3很好地理解她的意圖,畫出了兔耳朵。
AI生成時裝秀,堪比世界四大時裝周
還有AI生成的時裝秀表演,完全打破了美學的想象力,可以引領時尚前沿了。
精靈、怪獸未來科幻,Gen-3想象力太強
Gen-3生成的「全息」精靈,看著有些神奇。
倫敦泰晤士河中,一只隱藏的怪物從水中逐漸浮現。
這一畫面,讓人不禁想起哥斯拉電影中的場景。
另一位網友用Gen-3做了一個科幻短片,名為《2030——歐羅巴任務》,還為其配上了音樂。
還有太空電梯,看著像那么回事兒。
多場景轉換,把控到位
網友用Gen-3生成的一個人一生不同階段的飛速閃過的經歷。
從幼年時期,到小學、中學,再到大學,結婚,都呈現出來了。
下面這個場景轉換,Gen-3把控得非常到位。
從愛爾蘭的一座城堡,飛越到一座摩天大樓林立的未來賽博朋克城市。
還有這種像素風格的AI視頻生成,完全是原生的。
視頻游戲,一鍵生成
黃仁勛曾說過,未來5-10年內會看到完全由AI生成的游戲!
不過,Gen-3生成的AI視頻游戲,也足以令人驚嘆了。
網友用Gen-3去生成16位的復古視頻游戲1776。
多樣字體
另外,Gen-3 Alpha在標題動畫的生成效果上,簡直令人驚嘆。
網友收集了9個最經典的案例。
海浪拍打沙灘后,留下了Ruway的字樣。
電影院大屏出現了Ruway字樣,給人一種漫威風格的趕腳。
煙花在天空中綻放出Ruway字樣。
還有海洋里氣泡、流體、樹葉等各種各樣的元素,生成的驚艷字體。
失敗案例
除了開篇所給出的Gen-3不懂物理世界案例之外,網友也收集了一些其他的失敗case。
比如,下面這把刀切肉,切一片變成許多片。網友驚嘆道,多么厲害的一把刀。
Gen-3、Sora,誰更強?
Gen-3和Sora相比,誰更勝一籌?
網友Proper使用了9個相同提示,分別去測試這兩個模型。
提示一:一名潛水員發現了一艘隱藏的來自未來的沉船,船上有生化海洋生物和先進的外星科技。
就生成效果來看,Gen-3未來科技感更強,Sora只是著重突出了沉船的外觀。
提示二:24歲女子眨眼的超特寫鏡頭,站在馬拉喀什的魔幻時刻,電影膠片,70mm拍攝,景深,色彩鮮艷,電影效果
在這個提示下,Gen-3和Sora真實度各有千秋,Gen-3的瞳孔中貌似更能看出馬拉喀什這座魔幻之城。
不過,Gen-3的視頻沒有眨一下眼,缺少了真實性。
提示三:一個外星人與紐約市自然融合,偏執驚悚風格,35毫米膠片。
就外星人形象來說,不得不說Sora更好一些,更能讓人接受,Gen-3生成的外星人就像一個恐怖片一樣。
提示四:一位時尚的女性走在東京的一條街道上,街道上到處是溫暖的霓虹燈和生動的城市標志。她穿著黑色皮夾克、紅色連衣裙和黑色靴子,手提一個黑色手提包。她戴著太陽鏡,涂著紅色口紅。她走路自信而隨意。街道潮濕且具有反光效果,形成了彩色燈光的鏡面效果。街上有許多行人在走動。
還有Sora生成的這張經典的圖像——打扮時髦的女人走在東京街道,Gen-3也不輸分毫。不過,在表現鏡面效果這點上,Gen-3沒有完全遵循指令。
提示五:加州淘金熱時期的歷史鏡頭。
Gen-3更加真實地體現了加州淘金熱,人們沉浸在淘金的喜悅中,而且背景顏色凸顯出的歷史感更加濃厚。
也就是說,沒有對比,就沒有傷害。
提示六:一位年輕的專業產品評論員坐在一臺有兩個顯示屏的電腦前,在一個光線充足的視頻工作室里,周圍環繞著各種小工具和科技設備。他手持一臺電影攝影機,正在思考下一個要制作的視頻內容。他對準了焦距、 背景略微模糊,以達到電影效果。
Gen-3在人物的表現上,更加豐富。Sora只是男子的頭從一邊轉到另一邊,也沒有體現出對焦的這個動作。
提示七:攝像機圍繞著一大堆老式電視機旋轉,這些電視機都在播放不同的節目:1950年代的科幻電影、恐怖電影、新聞、雪花屏、1970年代的情景喜劇等,這一場景設置在紐約一個大型博物館展廳內。
旋轉這一點Gen-3倒是很好地體現,不過電視有點「穿模」的感覺。還有雪花屏幕,Gen-3漏掉了。
但是,對于Sora,卻沒有旋轉起來。
不管咋說,都沒有最完美的AI視頻模型。
還有額外一個對比的案例,大家可以自己感受下。