OpenAI給不了的,DeepMind給,Sora聯合負責人跳槽后開組新團隊
入職三個月,委以重任。
在 Sora 發布即翻車之前,其團隊掌舵人 Tim Brooks 在社交媒體上宣布跳車,跳槽的去向還是競爭對手谷歌 DeepMind。
這一消息立即引發軒然大波。據 The Information 爆料,Tim Brooks 的出走是因為 Sora 技術存在嚴重問題:不僅生成速度慢,還在各項性能上都難以與 Luma、Stability、Runway 等對手抗衡,更別提最近風頭正勁的 Pika 和國產視頻生成模型們了。
在 Sora 還在閉門造車的這段時間,競爭對手們已經在市場上攻城略地,打得火熱。
當時,有業內人士預測,Tim Brooks 加入谷歌后很可能會在其視頻生成模型 Veo 項目上大顯身手。
不過,Sora 之所以驚艷不僅是視頻生成的效果,更在于它能模擬真實世界的物理規律。世界模型的風正在 AI 圈刮起:谷歌的 GameNGen 能不用游戲引擎就直接生成游戲,最近大火的 Oasis 更是能用視頻模型直接做出能玩的游戲。視頻生成技術正在向模擬游戲世界的方向狂飆。
而 Tim Brooks 入職谷歌 DeepMind 后的新任務,就是這個方向。早在 DeepMind 聯合創始人 Demis Hassabis 致的歡迎詞中就劇透過這一點,他們要將「久未實現的創造世界模擬器的夢想變成現實」。
本周一,Tim Brooks 在 X 上宣布:「DeepMind 有雄心勃勃的計劃,要打造能夠模擬世界的大規模生成模型。我正在為這個使命組建一個新團隊。」
根據這個帖子中所附鏈接的招聘信息,這個新團隊將與谷歌的 Gemini、Veo 和 Genie 團隊合作,并在他們的工作基礎上,解決「關鍵性的新問題」,并將模型擴展到「最高計算水平」。
Gemini 是谷歌的旗艦人工智能模型系列,可用于分析圖像和生成文本等任務。Veo 則是谷歌自己的視頻生成模型,最新的 Veo 2 版本已經能一步生成美妝博主開箱視頻或 Vlog,其逼真程度足夠以假亂真。
Google Veo 2 生成的 Vlog 視頻,圖源:https://x.com/jerrod_lew/status/1872673797939044487
至于 Genie,它是谷歌對世界模型的嘗試 —— 一種可以實時模擬游戲和 3D 環境的人工智能。就在上個月,谷歌震撼宣布了他們的新一代世界模型 Genie 2,實現了輸入一張圖直接升維出一個交互可玩的 3D 世界。
Genie 2 生成的可交互的虛擬世界
「我們相信,在視頻和多模態數據上擴展人工智能訓練是通往通用人工智能的關鍵路徑,」一則職位描述中寫道,「世界模型將推動眾多領域的發展,例如視覺推理和模擬、具身智能體的規劃,以及實時互動娛樂。」
Tim Brooks 團隊的招人要求
從以上 JD 來看,Tim Brooks 新團隊將致力于在其構建的模型之上開發「實時互動生成」工具,并研究如何將其模型與現有的多模態模型(比如 Gemini)進行整合。
主要招聘的有兩個崗位:研究科學家和研究工程師,年薪在 136,000 美元—245,000 美元區間。
評論區的反響也很熱烈,簡歷可能已經投上了。
世界模型是許多初創公司和大型科技公司追逐的焦點,比如李飛飛的 World Labs、初創公司 Decart 和 Odyssey。他們認為,世界模型有一天可以用來創建能與觀眾實時互動的媒體,比如只屬于你的獨家游戲劇情。同時,世界模型也能更好地模擬世界,解決機器人訓練環境缺數據的問題。
但是原本靠創意吃飯的朋友們對世界模型的看法,可能就沒這么樂觀了。
最近,《Wired》雜志的一項調查發現,像動視暴雪這樣的游戲工作室,已經裁減了大量員工,正在使用人工智能來偷工減料、提高生產力,并彌補人員流失。2024 年,由代表好萊塢動畫師和漫畫家的動畫師公會委托的一項研究估計,到 2026 年,美國的電影、電視和動畫行業將有超過 10 萬個職位受到人工智能的沖擊。
不過,像 Odyssey 這樣的 AI 創業公司已經表態:他們的目標是與創意人士合作,而不是取代他們。至于谷歌能否用世界模型開創一個 AI 與人類創意共生的新時代,讓我們拭目以待。
參考鏈接:
https://techcrunch.com/2025/01/06/google-is-forming-a-new-team-to-build-ai-that-can-simulate-the-physical-world/。
https://x.com/_tim_brooks/status/1876327325916447140。