成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

研究遭質疑,Jeff Dean回應:我們本就不是為得到新SOTA,成本計算也搞錯了

人工智能 新聞
Jeff Dean 花了足夠養活一個四口之家五年的錢,獲得了在 CIFAR-10 上 0.03% 的改進,創建了新的 SOTA,這一切值得嗎?

?昨日,整個社區最熱門的話題無外乎是 reddit 上一名機器學習研究者對谷歌 AI 負責人 Jeff Dean 參與論文的質疑?。這篇論文是《An Evolutionary Approach to Dynamic Introduction of Tasks in Large-scale Multitask Learning Systems》,于周四被提交到預印版論文平臺 arXiv 上。圖片

在論文中,Jeff Dean 等人提出了一種進化算法,可以生成大規模的多任務模型,同時也支持新任務的動態和連續添加,生成的多任務模型是稀疏激活的,并集成了基于任務的路由。新方法在 69 個圖像分類任務上取得有競爭力的結果,例如對僅在公共數據上訓練的模型,在 CIFAR-10 上實現了新的業界最高識別準確度 99.43%。

圖片

正是這個在 CIFAR-10 上實現的新 SOTA 遭到了質疑,此前的 SOTA 為 99.40。她表示,「產生這一結果需要總計 17,810 小時的 TPU 核心小時數,如果你不在谷歌工作,這意味著必須使用 3.22 美元 / 小時的按需付款,訓練好的模型成本需 57,348 美元。」

因此,她發出靈魂一問,「Jeff Dean 花了足夠養活一個四口之家五年的錢,獲得了在 CIFAR-10 上 0.03% 的改進,創建了新的 SOTA,這一切值得嗎?」

這一質疑得到了眾多領域人士的附和。有研究人員甚至悲觀地表示,「我幾乎對深度學習失去了興趣,作為小型實驗室的從業者,在計算預算方面基本上不可能比得過科技巨頭。即使你有一個很好的理論想法,主流環境可能也存在偏見,讓它難以看到曙光。這釀成了一個不公平的競爭環境?!?/p>

隨著該話題的繼續發酵,Jeff Dean 親自在 reddit 上進行了回應。他表示,「我們這項研究的目標不是為了得到一個更高質量的 cifar10 模型,而且原帖作者成本計算的方式也有問題。」

圖片

Jeff Dean 回應全文

這篇論文是我和 Andrea Gesmundo 兩人一起完成的,其中 Andrea Gesmundo 做了論文大部分工作。

圖片

論文地址:https://arxiv.org/pdf/2205.12755.pdf

我想說的是,這項研究的目標不是得到一個高質量的 cifar10 模型。相反,這項研究是探索一種設置,可以動態地將新任務引入正在運行的系統中,并成功地為新任務獲得一個高質量的模型,該模型將重用現有模型中的表示并稀疏地引入新參數,同時避免了災難性遺忘或負遷移等多任務系統問題。

該研究的實驗表明,我們可以從幾個獨立的可視化任務基準中動態地引入 69 個不同任務流,最終得到一個多任務系統,它可以為所有這些任務聯合產生高質量的解決方案。所得到的模型對任何給定的任務都是稀疏激活的,系統為新任務引入的新參數越來越少(參見下圖 2)。多任務系統在這個任務流的末尾只為增量任務引入了 1.4% 的新參數,每個任務平均激活模型總參數的 2.3%。任務之間有相當多的表示共享,演化過程有助于確定何時有意義以及何時應該為新任務引入新的可訓練參數。

圖片

我還認為原貼作者對成本的計算是錯誤的,實驗是訓練一個多任務模型來共同解決 69 個任務,而不是訓練一個 cifar10 模型。從下表 7 中可以看出,所使用的計算是 TPUv3 核和 TPUv4 核的混合,因此不能簡單地計算核小時數,因為它們的價格不同。

除非你有特別緊急的任務,需要快速訓練 cifar10+68 個任務,其實這類研究可以很容易地使用可搶占價格的資源,即 0.97 美元 / 小時 TPUv4、0.60 美元 / 小時 TPUv3(不是他們所說的你必須按需定價 3.22 美元 / 小時)。在這些假設下,表 7 中描述的計算公共云成本大約是 13960 美元(使用 12861 TPUv4 芯片小時和 2474.5 TPUv3 芯片小時的可搶占價格),或者說是大約 202 美元 / 任務。

圖片

我認為擁有稀疏激活的模型很重要,且能夠動態地將新任務引入到現有系統中,該系統可以共享表示(在適當的情況下)并避免災難性遺忘,這些研究至少值得探索。該系統還有一個優點,即新任務可以自動被納入系統,而無需為此進行專門制定(這就是進化搜索過程所做的),這似乎是一個持續學習系統的有用屬性。

這篇論文的代碼是開源的,大家可以自行查看。

代碼地址:https://github.com/google-research/google-research/tree/master/muNet

原貼作者回復 Jeff Dean

圖片

在看到 Jeff Dean 的回復后,原貼作者表示:澄清一下,我認為 Jeff Dean 的這篇論文(在每個任務中用來產生模型擴充的進化模式)真的很有趣,這讓我想起了另一篇論文,但我不記得標題了,論文大概是講對于每個新任務,向整個體系架構添加新的模塊,將其他模塊的隱藏狀態作為每層輸入的一部分,但不更新現有組件的權重。

我還有一個想法,在每個任務的模型中構建模塊。你知道小鹿是如何在出生后幾分鐘內就能走路的嗎?相比之下,在那個時候,剛出生的小鹿基本上沒有「訓練數據」來學習感知運動或對世界進行建模,而是必須利用大腦中的特殊結構,而這些結構必須能夠繼承以讓小鹿擁有基本技能。這些結構將是非常有用的,所以在某種意義上,它將迅速推廣到一個新的但相關的控制任務。

因此,這篇論文讓我想到了那些已經存在的可繼承結構的發展,這些結構可以用來更有效地學習新任務。

另一家實驗室的研究人員可能有相同的 idea,但得到的結果要差得多,因為他們負擔不起從現有設置轉移到大型云平臺的費用。并且,由于現在社區過度關注 SOTA 結果,他們的研究也無法發表。即使費用「僅為」202 美元 / 每任務,但必須經過多次迭代才能將事情做好。

因此,對于我們這些無法獲得足夠計算預算的人來說,我們的選擇基本上只有兩種。一是祈禱并希望谷歌能夠公開分發現有的模型,然后我們根據自身需求進行微調。但結果是,模型可能已經學習到我們無法消除的偏見或對抗性弱點。二是啥都不做,躺平。

所以,我的問題不僅僅在于這項研究。如果 OpenAI 想在 GPT-4 上花費上百萬億美元(打個比方),那就賦予它更多的權力。這是一種過度獎勵浮華、大數目和奢侈的科學和出版文化,而無益于幫助人們更好地完成實際的工作。我最喜歡的論文是 van der Oord 在 2019 年發表的《Representation Learning with Contrastive Predictive Coding》,它使用無監督預訓練任務,然后對一個小的標簽子集進行監督訓練,以實現復制標記所有數據的準確率結果,并從數據效率的角度討論這種提升。我在工作中復現并使用了這些結果,節省了自己的時間和金錢。就憑這篇論文,我就愿意成為他的博士生。

但是,OpenAI 在論文《Language Models are Few-Shot Learners》中提出了更大的 transformer 模型 GPT-3,獲得了近四千次引用以及 NeurIPS 2020 最佳論文獎,還獲得整個媒體的關注。?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2019-11-12 10:11:32

5G4G運營商

2022-05-30 10:42:14

模型谷歌數據

2023-03-15 08:13:14

內存廠商DDR

2015-04-02 10:08:31

蘋果回收手機富士康

2018-04-21 07:02:37

AI神經網絡技術

2022-10-08 12:45:26

模型

2022-12-05 08:35:06

MySQL計算讀取

2022-02-28 11:26:40

模型深度學習谷歌

2021-04-07 14:36:36

谷歌Android開發者

2024-09-25 09:37:16

2013-05-20 10:07:29

SAP云服務

2011-06-02 09:27:28

2016-11-14 09:42:58

公共云私有云成本

2013-05-15 15:26:19

數據中心綜合布線布線實施

2022-04-14 18:03:16

深度學習AI谷歌

2012-04-01 09:44:22

云計算云成本

2024-10-21 15:50:00

機器學習AI

2010-06-07 09:15:55

谷歌App Engine云計算

2011-12-06 10:04:03

2018-04-03 11:44:47

人工智能業務
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产1区 | 欧美美女爱爱视频 | 天天色天天射天天干 | 亚洲精品v日韩精品 | 欧美精品在线免费观看 | 久久久成人精品 | 中文字幕一区二区三区四区五区 | 99久久久久国产精品免费 | 91精品国模一区二区三区 | 久久久久国产一区二区三区四区 | 国产精品资源在线观看 | 国产精品电影在线观看 | 久久中文字幕电影 | 午夜小视频在线播放 | 国产精品久久久久久久久久久久久久 | 久草日韩 | 国产在线看片 | a黄视频| 中文字幕免费中文 | 国产91在线 | 欧美 | 不卡在线视频 | 久久精品久久久 | 一区二区视频 | wwwxxx日本在线观看 | 亚洲综合国产精品 | 婷婷久久五月天 | 91亚洲精品国偷拍自产在线观看 | 亚洲视频免费在线播放 | 国内精品免费久久久久软件老师 | 夜夜爽99久久国产综合精品女不卡 | 国产综合精品 | 夜夜骑天天干 | 五月天天丁香婷婷在线中 | 成年视频在线观看福利资源 | 中文字幕高清免费日韩视频在线 | 亚洲视频免费在线播放 | 成人3d动漫一区二区三区91 | 九九热免费在线观看 | 99久久国产精 | 最近最新中文字幕 | 国产在线播放一区二区三区 |