成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Stable Diffusion讀你大腦信號就能重現圖像,研究還被CVPR接收了

人工智能 新聞
大腦活動到圖像,Stable Diffusion 能重建。

如果人工智能可以解讀你的想象,將你腦海中的圖像變成現實,那會怎樣?

圖片

雖然這聽起來有點賽博朋克。但最近發(fā)表的一篇論文,讓 AI 圈吵翻了天。

圖片

這篇論文發(fā)現,他們使用最近非常火的 Stable Diffusion,就能重建大腦活動中的高分辨率、高精準圖像。作者寫道,與之前的研究不同,他們不需要訓練或微調人工智能模型來創(chuàng)建這些圖像。

圖片


  • 論文地址:https://www.biorxiv.org/content/10.1101/2022.11.18.517004v2.full.pdf
  • 網頁地址:https://sites.google.com/view/stablediffusion-with-brain/

他們是怎么做到的呢?

在此研究中,作者基于 Stable Diffusion 來重建通過功能磁共振成像 (fMRI) 而獲得的人腦活動圖像。作者也表示,通過研究與大腦相關功能的不同組成部分(例如圖像 Z 的潛在向量等),也有助于了解隱擴散模型的機制。 

這篇論文也已經被 CVPR 2023 接收。

該研究的主要貢獻包括:

  • 證明了其簡單框架可以從具有高語義保真度的大腦活動中重建高分辨率(512×512)圖像,而無需訓練或微調復雜的深度生成模型,如下圖所示;
  • 通過將特定組成部分映射到不同的大腦區(qū)域,該研究從神經科學的角度定量解釋了 LDM 的每個組成部分;
  • 該研究客觀地解釋了 LDM 實現的文本到圖像轉換過程如何結合條件文本表達的語義信息,同時保持原始圖像的外觀。

方法概覽

該研究的總體方法如下圖 2 所示。圖 2(上)是該研究中使用的 LDM 示意圖,其中,ε 表示圖像編碼器,D 表示圖像解碼器,τ 表示文本編碼器(CLIP)。 

圖 2(中)是該研究的解碼分析示意圖。研究者分別從早期(藍色)和高級(黃色)視覺皮層內的 fMRI 信號中解碼了呈現圖像 (z) 和相關文本 c 的潛在表征。這些潛在表征被用作生成重建圖像 X_zc 的輸入。 

圖 2(下)是該研究的編碼分析示意圖。研究者構建了編碼模型來預測來自 LDM 不同組成部分的 fMRI 信號,包括 z、c 和 z_c。

圖片

有關 Stable Diffusion 這里就不做過多介紹,相信很多人都比較了解。

結果

我們來看一下該研究的視覺重建結果。

解碼?

下圖 3 展示了一個主體(subj01)的視覺重建結果。研究者為每個測試圖像生成了五個圖像,并選擇了具有最高 PSM 的圖像。一方面,只用 z 重建的圖像在視覺上與原始圖像一致,但未能抓住其語義內容。另一方面,只用 c 重建的圖像生成的圖像具有很高的語義保真度,但在視覺上卻不一致。最后,使用 z_c 重建的圖像可以生成具有高語義保真度的高分辨率圖像。

圖片

圖 4 展示了所有測試者對同一圖像的重建圖像(所有圖像都是用 z_c 生成的)??傮w來說,各測試者的重建質量是穩(wěn)定和準確的。

圖片

圖 5 是定量評估的結果:

圖片

編碼模型?

圖 6 顯示了編碼模型對與 LDM 相關的三種潛像的預測精度:z,原始圖像的潛像;c,圖像文本注釋的潛像;以及 z_c,經過與 c 交叉注意力反向擴散過程后的 z 的加噪潛像表征。

圖片

圖 7 顯示,當加入少量的噪聲時,z 對整個皮層的體素活動的預測比 z_c 更好。有趣的是,當增加噪聲水平時,z_c 對高位視覺皮層內體素活動的預測優(yōu)于 z,表明圖像的語義內容逐漸被強調。

圖片

在迭代去噪過程中,添加噪聲的潛在表征如何變化?圖 8 顯示,在去噪過程的早期階段,z 信號主導了 fMRI 信號的預測。在去噪過程的中間階段,z_c 對高位視覺皮層內活動的預測比 z 好得多,表明大部分語義內容在這個階段出現了。結果顯示了 LDM 如何從噪聲中提煉和生成圖像。

圖片

最后,研究者探討了 U-Net 的每一層都在處理什么信息。圖 9 顯示了去噪過程的不同步驟(早期、中期、晚期)以及 U-Net 不同層的編碼模型的結果。在去噪過程的早期階段,U-Net 的瓶頸層(橙色)在整個皮層中產生了最高的預測性能。然而,隨著去噪的進行,U-Net 的早期層(藍色)預測早期視覺皮層內的活動,而瓶頸層則轉向對更高的視覺皮層的卓越預測能力。

圖片

更多研究細節(jié),可查看原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-03-06 12:35:45

AI大腦畫面圖像

2023-03-13 16:11:37

模型文本

2022-10-20 16:04:26

模型質量

2023-01-10 16:08:04

人工智能擴散模型

2024-09-14 14:09:40

2023-07-14 13:34:34

StableDiffusion模型

2023-05-26 15:53:48

MidjourneyAI圖像

2023-01-08 13:22:03

模型

2023-11-22 11:22:57

AI模型

2023-05-08 14:53:00

信號神經框架

2024-03-07 08:12:31

2024-12-06 10:21:04

2023-01-18 16:13:32

模型

2018-03-23 12:54:45

機器學習研究重現TensorFlow

2024-06-13 17:45:16

2023-02-10 21:12:41

GPUmacOSStable

2022-12-18 19:49:45

AI

2022-11-02 13:47:13

開源自然語言

2022-12-26 13:40:59

機器學習

2023-10-19 13:42:00

數據集MEG數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日韩在线观看视频网站 | 欧美三级网站 | av一级在线观看 | 国产亚洲精品精品国产亚洲综合 | 国产一区二区精品在线观看 | 亚洲 欧美 日韩在线 | 日日躁狠狠躁aaaaxxxx | 日韩欧美操 | 成人av一区 | 亚洲成a人片 | 国产激情在线播放 | 国产精品视频免费观看 | 色噜噜亚洲男人的天堂 | 亚洲国产欧美一区二区三区久久 | 欧美精品久久久 | 国产在线视频一区二区董小宛性色 | 午夜影院操 | www.日本三级| 香蕉久久久久久 | 国产美女在线看 | 日韩在线一区二区 | 精品亚洲一区二区 | 亚洲伊人久久综合 | 九九视频在线观看 | 91在线一区二区三区 | 欧美黑人一级爽快片淫片高清 | 一区二区日韩精品 | 精品久久久久国产免费第一页 | 欧洲精品码一区二区三区免费看 | 日本不卡一区二区三区在线观看 | 97成人在线 | 国产精品99视频 | 午夜国产一级 | 国产日韩欧美在线 | 欧美日韩一区二区三区在线观看 | 美女黄网| 午夜午夜精品一区二区三区文 | 精品国产欧美一区二区三区不卡 | 日韩电影中文字幕在线观看 | 久久免费精品视频 | 国产精品综合色区在线观看 |