成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<ul id="gsi8u"></ul>

<ul id="gsi8u"></ul>

<strike id="gsi8u"></strike>

<abbr id="gsi8u"></abbr>

<abbr id="gsi8u"></abbr>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火精華

發布于 2024-8-29 13:37

瀏覽

0收藏

“比Sora還震撼”，?AI可以實時生成游戲了！

谷歌DeepMind打造出了首個完全AI驅動的實時游戲引擎——GameNGen。

在單個谷歌TPU上，它以每秒20幀模擬起了經典射擊類游戲DOOM（毀滅戰士）。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

所有游戲畫面都是根據玩家操作，與復雜環境進行交互，實時生成。

也就是說你走進一道門之前，門后的內容還不存在。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

質量不輸事先存儲的那種，能“以假亂真”，人類評估者都難以察覺。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

各種操作都能絲滑轉換：

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

GameNGen的背后是大家熟悉的擴散模型。

從論文題目就重新定義了游戲引擎：擴散模型是實時游戲引擎。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

網友們看到這項研究一時間炸開了鍋，推特、Reddit上相關帖子熱度持續不減，誰發誰火。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

不少人表示它提供了一條全新的技術路徑：

我覺得人們還沒有意識到這有多瘋狂。我是一名開發人員，專門負責將生成式?AI集成到游戲引擎中，所以我很清楚我在說什么。
這是構建虛擬事物的基礎。未來它或許能夠普及到它能夠獲取數據的任何視頻游戲，隨后，可能還能為尚未存在的游戲生成數據，創造新游戲。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

作者Shlomi Fruchter也開麥了：

這對我來說是一個個人里程碑，也是從手工編寫在GPU上運行的顯式渲染代碼到訓練同樣在GPU上運行的神經網絡的完整回環，感覺圓滿了。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

那么，GameNGen究竟是如何做到的？

用擴散模型造AI DOOMers

GameNGen訓練過程分為兩個主要階段。

首先，訓練一個強化學習Agent來玩游戲，并記錄過程中所有動作、技能和觀察數據。這些記錄成為第二階段的訓練數據集。

為生成盡可能貼近人類游戲行為的訓練數據，研究人員設計了一個簡單的、特定于環境的獎勵函數，根據一系列特定的游戲情況來分配分數，條件包括：

玩家被擊中、敵人被消滅、撿起物品或武器、生命值變化、彈藥變化……

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

在第二階段，基于預訓練的Stable Diffusion v1.4來預測下一幀，模型以過去的幀序列和動作作為條件輸入，并進行了一些關鍵修改。

具體來說，首先移除了所有文本條件，替換為動作序列。每個動作被編碼為一個單一的token，通過交叉注意力機制與模型交互。

歷史觀察（即之前的幀）被編碼到潛在空間，并與當前噪聲化的潛在表示在通道維度上拼接。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

為了解決自回歸生成中的誤差累積，即自回歸漂移問題，GameNGen引入了噪聲增強技術。

在訓練時，模型對輸入的上下文幀添加不同程度的高斯噪聲，并將噪聲級別作為額外輸入提供給模型。這使得模型能夠學習糾正之前采樣中的錯誤，對維持長時間序列的圖像質量至關重要。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

此外，為了提高圖像質量，特別是在細節和HUD（平視顯示器）方面，研究者對Stable Diffusion的預訓練自編碼器的解碼器部分進行了微調。這個過程使用MSE損失，針對目標幀像素進行優化。

在推理階段，GameNGen使用DDIM采樣方法，并采用了無分類器引導技術，但僅用于過去觀察的條件。研究者發現，對過去動作條件使用引導并不能提高質量。

值得注意的是，模型僅使用4步DDIM采樣就能產生高質量的結果，這大大提高了生成速度。

GameNGen在TPU-v5硬件上運行，單個去噪器步驟和自編碼器評估各需要10毫秒。

通過使用4步采樣和單次自編碼器評估，系統能夠達到每秒20幀的生成速度，足以實現實時交互式游戲體驗。

人類難以分辨真實和AI生成

實驗中，在短時軌跡上，人類評估者幾乎無法區分模擬畫面與實際游戲畫面。

研究人員使用了兩種主要的圖像質量評估方法：基于感知的圖像相似度度量方法LPIPS和衡量圖像質量的常用指標PSNR。

在teacher-forcing設置中，模型單幀預測質量PSNR為29.43，LPIPS為0.249。PSNR的值與20-30質量設置下的有損JPEG壓縮相似。

換句話說，GameNGen在模擬圖像時能夠在一定程度上保持較高的視覺質量，盡管可能存在一些壓縮帶來的細節損失。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

視頻質量方面，對于長度為16 幀（0.8 秒）和32幀（1.6 秒）的模擬，FVD分別為114.02、186.23。

在人類評估方面，研究人員為10 名人類評估者提供了130個隨機短片段（1.6秒和3.2 秒的長度），并將模擬與真實游戲并排展示。

在1.6秒和3.2秒的片段中，人類僅有58%、60%的概率能正確區分真實游戲和模擬。

基于Diffusion的最新突破

除了被效果驚艷到，不少研究者還表示這項研究沒有那么簡單，它是一種基于擴散模型的最新突破。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

動作條件化的世界模型已更進一步！神經網絡模擬在擴展實際交互數據方面具有巨大潛力，特別是在物理模擬器表現不佳的領域。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

不過，在一片好評聲中，也有網友指出，論文很好，但稱其為“游戲引擎”不太妥當：

希望他們能說“渲染引擎”而不是“游戲引擎”。
游戲引擎是一個讓一群人創造東西的工具，它將繼續存在，特別是與任何集成的超級AI共存。顯然，今天的游戲引擎已經過時，但我們已經在構建下一代引擎了。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

對于一些人評論這些模型將取代傳統游戲引擎，也有網友持不同的觀點。

一位a16z的游戲和3D技術領域投資人、前Unity員工給出了他的看法：

諷刺的是，訓練這些模型需要從傳統游戲引擎輸入控制器動作和輸出幀作為訓練數據。

雖然我認為這些由擴散模型實時生成的幀最終會改變我們體驗游戲的方式，但我仍然認為專業開發者需要一個3D場景圖來進行觸感控制和創造性表達。

開發者可能會使用更傳統的3D創作引擎創建游戲的“灰盒”版本，然后一個圖像到圖像的模型實時提升分辨率（類似于英偉達的DLSS技術）。

未來，消費者將能體驗從文本直接創造游戲或虛擬世界的全新方式。但在我看來，專業工作流程中仍然會有3D場景圖的一席之地。

震撼！AI實時生成游戲，每秒20幀輸出，DeepMind擴散模型最新突破一夜爆火-AI.x社區

你怎么看GameNGen這項研究？它會給未來游戲行業帶來何種改變？

項目主頁：https://gamengen.github.io/
論文鏈接：https://arxiv.org/pdf/2408.14837

本文轉自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/tr2VIUqwLtltEE4N7psX-A??

標簽

贊

收藏

回復

舉報

回復

相關推薦

「有效上下文」提升20倍！DeepMind發布ReadAgent框架

duhorse ? 3209瀏覽 ? 0回復
超越GPT-4，斯坦福團隊手機可跑的大模型火了，一夜下載量超2k

輕薄滴假象 ? 3538瀏覽 ? 0回復
曾爆火的 InstantID又有了新玩法：風格化圖像生成，已開源

輕薄滴假象 ? 3264瀏覽 ? 0回復
Llama 3每秒輸出800個token逼宮openAI！下周奧特曼生日或放出GPT-5？

duhorse ? 3164瀏覽 ? 0回復
全新神經網絡架構KAN一夜爆火！200參數頂30萬，MIT華人一作，輕松復現Nature封面AI數學研究

Crystalcxt ? 3917瀏覽 ? 0回復
史上最丑AI生圖一夜爆火！又一款妙鴨級爆品來了？

duhorse ? 3804瀏覽 ? 0回復
蘋果一夜重塑iPhone！GPT-4o加持Siri，AI深入所有APP，庫克：開啟蘋果AI下一章

Crystalcxt ? 3401瀏覽 ? 0回復
快手「可靈」爆火：海外AI圈巨震，中國版Sora一號難求

輕薄滴假象 ? 4400瀏覽 ? 0回復
超越GPT-4o，Claude 3.5一夜封王！10倍編碼速度逆天，全網最全實測來了

duhorse ? 4386瀏覽 ? 0回復
開源模型王座一夜易主，GPT-4o被超越

duhorse ? 2315瀏覽 ? 0回復
Grok-2震撼發布！性能打平GPT-4o，神速牽手爆火的FLUX 生成超逼真圖像！缺點：生成的每個總統都是特朗普

51CTO技術棧 ? 2879瀏覽 ? 0回復
AI Scientist爆火背后的技術詳解以及優缺點分析

arnoldzhw ? 3287瀏覽 ? 0回復
一夜小模型王座易主！英偉達發布超強小模型，性能、速率、緩存全面超越Llama3.2！

51CTO技術棧 ? 2204瀏覽 ? 0回復
帶你一文讀懂爆火的 DeepSeek-R1 新模型技術，為何震動了全球 AI 圈

玄姐聊AGI ? 7830瀏覽 ? 1回復
微軟發布創新大模型：一張圖片就能生成游戲，游戲界ChatGPT來了

Aceryt ? 1970瀏覽 ? 0回復
繞過 RAG 實時檢索瓶頸，緩存增強生成（CAG）如何助力性能突破？

Baihai_IDP ? 2274瀏覽 ? 0回復
AI Agent大變天！谷歌開源A2A，一夜改變智能體交互

Aceryt ? 1780瀏覽 ? 0回復
這才是MCP 爆火的原因！

hm673c38238a021 ? 1475瀏覽 ? 0回復
阿里Qwen3一夜封神！開源模型跑出3倍推理速度，OpenAI沉默

AI博物院 ? 2872瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實現高分辨率逐像素生成 2025-02-26 11:59:41發布
達摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： AI給《黑神話：悟空》生成了一個宣傳片…看完我沉默了

下一篇： 4090單卡跑滿血版DeepSeek-R1，清華團隊開源項目再破大模型推理門檻

社區精華內容

目錄

主站蜘蛛池模板：色伊人| 欧美日韩成人网 | 欧美高清视频 | 日韩天堂av | 成人av看片 | 久久一二| 性xxxxx| 久久久久久亚洲精品 | 亚洲国产成人在线视频 | 亚洲精品资源 | 国产精品久久久久久久久久免费看 | 亚洲欧美精品在线观看 | 亚洲精品视频免费 | 国产成人久久av免费高清密臂 | 99爱视频 | 国产一区二区三区视频 | 成人在线观看欧美 | 国产精品av久久久久久久久久 | 国产欧美日韩一区 | 国产成人自拍av | 中文字幕国产精品 | 欧美视频第二页 | 久久机热 | 日本一本视频 | 在线国产一区二区 | 成人av免费看 | 欧美一级二级视频 | 国产sm主人调教女m视频 | 岛国av一区二区 | 国产永久免费 | 色婷婷久久久久swag精品 | 久久99国产精品 | 国产精品久久久久久久久久99 | 欧美一区二区激情三区 | 国产日韩欧美中文在线播放 | 一区二区中文字幕 | 日本视频中文字幕 | h视频在线观看免费 | 日韩精品久久久久 | 久久久久久国产精品免费免费狐狸 | 欧美极品在线播放 |

<tfoot id="iycwq"></tfoot>

<abbr id="iycwq"></abbr>

<tfoot id="iycwq"></tfoot>