AI視頻界變天!Decart發布實時“Sora”,直播/游戲業或遭降維打擊 原創 精華
AI視頻領域的“核武器”已經正式引爆。
一家名為Decart的AI創業公司,剛剛扔出了一顆足以改變行業的重磅炸彈:全球首個實時、無限長度的AI視頻模型——MirageLSD。
這項基于其獨創的“實時流擴散”(Live-Stream Diffusion, LSD)技術的模型,能將你的想象力實時注入任何視頻流中。這不再是看屏幕上的魔法,而是讓你親手創造魔法。
這一步棋,直接宣告了對傳統視頻制作、直播乃至游戲行業的“戰爭”。
創始人親自“下場”:<40毫秒延遲,實時造夢
在官方演示中,Decart的創始人兼CEO迪恩·萊特斯多夫(Dean Leitersdorf)親自展示了Mirage的恐怖實力。
他只是隨口說出幾個詞:“狂野西部、宇宙、羅馬帝國、金色、水下”,屏幕上的他立刻變成了一個身穿斗篷、渾身金光閃閃、仿佛置身于水下世界的“凱撒大帝”。
與其它動輒需要10秒以上延遲、只能生成幾秒鐘短片的AI視頻模型不同,Mirage的響應時間低于40毫秒,實現了真正的“零延遲”,足以支持24 FPS的流暢視頻流。
當他用手捂住臉,AI會賦予他更女性化的特征;他手指間旋轉的筆,顏色和形狀也在不停變換。整個過程如同一場迷幻的超現實直播,而且可以無限持續下去。
屠龍術揭秘:如何實現“無限生成”與“實時響應”?
如此顛覆性的技術,背后是Decart團隊對兩大核心難題的攻克。
1. 攻克“錯誤累積”,實現無限生成
所有自回歸模型(frame-by-frame生成)都面臨一個致命缺陷:錯誤累積。每一幀都會繼承上一幀的微小瑕疵,如同滾雪球,幾秒鐘后畫面就會崩潰失真。這就是為什么之前的模型都無法生成長視頻。
Decart的解決方案是:歷史增強(history augmentation)。他們通過在訓練中故意向歷史幀中注入干擾,來“教”模型預判并糾正它自己可能產生的錯誤。這讓MirageLSD具備了強大的糾錯能力,成為全球首個能無限生成視頻而不會崩潰的模型。
2. 極限壓榨GPU,實現零延遲
為了將每幀的處理時間壓縮到40毫秒以內,Decart采用了三管齊下的“暴力”優化策略:
- 定制CUDA超級內核 (Mega Kernels):編寫底層代碼,為NVIDIA Hopper架構GPU量身定制執行方式,最大限度減少延遲。
- 架構感知剪枝 (Architecture-aware Pruning):精簡模型,剔除冗余參數,讓模型更輕、更快,同時完美適配GPU硬件。
- 快捷蒸餾 (Shortcut Distillation):訓練一個小模型去模仿大模型的去噪軌跡,用更少的計算步驟實現同樣高質量的輸出。
這些技術的結合,帶來了比之前模型快16倍的響應速度,將實時AI視頻從理論變為了現實。
不只是濾鏡,更是下一個計算平臺入口
Decart的野心遠不止于直播和短視頻特效。
其上一代模型Oasis,就曾展示過一個完全由AI實時生成的《我的世界》游戲世界。而MirageLSD的出現,則將這種實時生成能力從特定游戲擴展到了開放領域。你可以把《使命召喚》的槍戰變成光劍對決,把現實中的棍棒打斗變成少林功夫片。
Decart已經上線了Mirage平臺(iOS/Android版即將推出),并計劃在整個夏天定期發布模型升級和新功能,包括面部一致性、語音控制、精確物體控制,以及對直播、游戲和視頻通話的深度集成。
“我們要成為‘千億級獨角獸’”
從被行業巨頭忽視,到自立門戶研發顛覆性技術,Decart的目標極其明確。
創始人萊特斯多夫在最近的采訪中直言:“我們有五年的時間,努力打造一個‘kilo-unicorn’,也就是價值一萬億美元或擁有十億用戶的公司。”
MirageLSD不是一個終點,而是一個起點。Decart正在構建一個能將我們所有感官都變成入口的平臺。隨著技術的不斷迭代和開放,這場由AI掀起的視覺革命,好戲才剛剛開場。
參考:???https://about.decart.ai/publications/mirage??
本文轉載自???AI工程化???,作者:ully
