成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Yann LeCun:ViT慢且效率低,實時圖像處理還得看卷積

人工智能 新聞
近日,一直在社交媒體上活躍的圖靈獎得主、Meta 首席科學家 Yann LeCun 也加入了 ViT 與 CNN 之爭的討論。

在 Transformer 大一統的時代,計算機視覺的 CNN 方向還有研究的必要嗎?

今年年初,OpenAI 視頻大模型 Sora 帶火了 Vision Transformer(ViT)架構。此后,關于 ViT 與傳統卷積神經網絡(CNN)誰更厲害的爭論就沒有斷過。

近日,一直在社交媒體上活躍的圖靈獎得主、Meta 首席科學家 Yann LeCun 也加入了 ViT 與 CNN 之爭的討論。

圖片

這件事的起因是 Comma.ai 的 CTO Harald Sch?fer 在展示自家最新研究。他(像最近很多 AI 學者一樣)cue 了 Yann LeCun 表示,雖然圖靈獎大佬認為純 ViT 并不實用,但我們最近把自己的壓縮器改成了純 ViT,沒有卷積,需要更長時間的訓練,但是效果非常不錯。

圖片

比如左圖,被壓縮到了只有 224 字節,右邊是原始圖像。

只有 14×128,這對自動駕駛用的世界模型來說作用很大,意味著可以輸入大量數據用于訓練。在虛擬環境中訓練相比真實環境成本更低,在這里 Agent 需要根據策略進行訓練才能正常工作。雖然訓練更高的分辨率效果會更好,但模擬器就會變得速度很慢,因此目前壓縮是必須的。

他的展示引發了 AI 圈的討論,1X 人工智能副總裁 Eric Jang 回復道,是驚人的結果。

Harald 繼續夸贊 ViT:這是非常美麗的架構。

此處有人就開始拱火了:大師如 LeCun,有時也無法趕上創新的步伐。

圖片

不過,Yann LeCun 很快回復辯駁稱,他并不是說 ViT 不實用,現在大家都在使用它。他想表達的是,ViT 太慢、效率太低,導致不適合實時處理高分辨率圖像和視頻任務。

Yann LeCun 還 Cue 了紐約大學助理教授謝賽寧,后者參與的工作 ConvNext 證明了如果方法得當,CNN 也能和 ViT 一樣好。

他接下來表示,在堅持自注意力循環之前,你至少需要幾個具有池化和步幅的卷積層。

如果自注意力等同于排列(permutation),則完全對低級別圖像或視頻處理沒有意義,在前端使用單個步幅進行修補(patchify)也沒有意義。此外由于圖像或視頻中的相關性高度集中在局部,因而全局注意力也沒有意義且不可擴展。

在更高級別上,一旦特征表征了對象,那么使用自注意力循環就有意義了:重要的是對象之間的關系和交互,而非它們的位置。這種混合架構是由 Meta 研究科學家 Nicolas Carion 及合著者完成的 DETR 系統開創的。

自 DETR 工作出現以后,Yann LeCun 表示自己最喜歡的架構是低級別的卷積 / 步幅 / 池化,以及高級別的自注意力循環。

Yann LeCun 在第二個帖子里總結到:在低級別使用帶有步幅或池化的卷積,在高級別使用自注意力循環,并使用特征向量來表征對象。

他還打賭到,特斯拉全自動駕駛(FSD)在低級別使用卷積(或者更復雜的局部運算符),并在更高級別結合更多全局循環(可能使用自注意力)。因此,低級別 patch 嵌入上使用 Transformer 完全一種浪費。

我猜死對頭馬斯克還是用的卷積路線。

謝賽寧也發表了自己的看法,他認為 ViT 非常適合 224x224 的低分辨率圖像,但如果圖像分辨率達到了 100 萬 x100 萬,該怎么辦呢?這時要么使用卷積,要么使用共享權重對 ViT 進行修補和處理,這在本質上還是卷積。

因此,謝賽寧表示,有那么一刻自己意識到卷積網絡不是一種架構,而是一種思維方式。

這一觀點得到了 Yann LeCun 的認可。

圖片

谷歌 DeepMind 研究者 Lucas Beyer 也表示,得益于常規卷積網絡的零填充,自己很確定「卷積 ViT」(而不是 ViT + 卷積)會工作得很好。

圖片

可以預見,這場 ViT 與 CNN 之間的爭論還將繼續下去,直到未來另一種更強大架構的出現。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-07-07 15:03:50

神經網絡AI算法

2022-09-28 08:23:56

AI人工智能工具

2024-01-16 12:10:10

2022-08-25 10:31:57

模型人工智能

2023-10-27 13:04:46

AI模型

2021-09-02 16:10:21

人工智能機器學習技術

2019-02-01 11:14:34

AI 行業 人工智能

2024-01-23 12:36:14

AI訓練

2024-08-26 15:21:06

2022-03-30 07:32:10

JDK8異步編程

2024-09-20 10:02:13

2024-11-21 16:06:02

2022-08-03 08:04:43

Yann LeCun谷歌AI

2023-12-27 13:46:00

2018-01-08 07:58:51

深度學習編程人工智能

2023-06-16 12:24:13

2022-04-07 14:29:53

AI模型訪談

2023-02-24 15:57:02

魅族FlymeAuto

2023-03-27 17:45:16

研究AI

2015-02-26 11:05:17

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久久久久一区二区 | 日韩电影中文字幕 | 国产在线永久免费 | 国产ts人妖一区二区三区 | 99精品一区 | 91精品国产高清一区二区三区 | 欧美日韩精品免费 | 亚洲电影成人 | 国产yw851.c免费观看网站 | 国产福利一区二区 | 91精品久久久久久久久久入口 | 成人性视频免费网站 | 国产高清精品一区二区三区 | 日本免费在线观看视频 | 男女羞羞视频在线观看 | 久久精品小视频 | 日本a在线 | 亚洲激情在线观看 | 人人九九精 | 欧美日韩精品综合 | 亚洲区视频 | 久久久高清 | 国产精品免费一区二区三区四区 | 国产午夜精品一区二区三区在线观看 | 久久精品国产久精国产 | 高清国产午夜精品久久久久久 | 中文字幕在线视频免费观看 | 午夜精品一区二区三区在线播放 | 国产性网 | 欧美一级黄色片在线观看 | 日韩在线精品视频 | 成人国内精品久久久久一区 | 91免费小视频 | 久久一二 | 午夜影院中文字幕 | 婷婷久久精品一区二区 | 亚洲电影一区二区三区 | 欧洲免费毛片 | aaa一区| 亚洲视频在线看 | 99久久久久 |