成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一文盤點NeurIPS'22杰出論文亮點!英偉達AI大佬一句話總結每篇重點,一并看透今年技術趨勢

人工智能 新聞
總結推文發出之后,立刻在網上掀起一陣熱度,眾多AI大佬都在轉發。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

15篇NeurIPS’22杰出論文重磅出爐,具體亮點都是啥?

來來來,大佬已經幫你總結好了!

圖片

師從李飛飛,現在在英偉達工作的大佬,用49條推文,帶你回顧過去一年AI圈的重要研究。

雖然到不了NeurIPS’22的現場,但也能提前在推特上體驗下大會的盛況。

總結推文發出之后,立刻在網上掀起一陣熱度,眾多AI大佬都在轉發。

圖片

還有人從中看出了今年的技術趨勢。

圖片

每篇亮點都是啥?

總結這一線程的老哥名叫Linxi”Jim”Fan(以下簡稱Jim)。

對于每篇論文,他都給出了一句話提煉亮點,并簡要解釋了自己的看法,還將論文地址和相關拓展鏈接一并附上。

具體都講了啥,我們一篇篇來看~

圖片

1、訓練計算最優的大語言模型

一句話總結:提出一個700億規模的新語言模型“Chinchilla”,效果比千億級別GPT-3、Gopher更強。

Jim表示,通過這個模型,研究人員證明了想要實現“計算最優”,模型大小和訓練數據規模必須同等縮放。

這意味著,目前大多數大語言模型的訓練數據是不夠的。

再考慮到新的縮放定律,即使將模型參數擴大到千萬億級,效果恐怕也不及將訓練token提升4倍。

圖片

2、谷歌Imagen的強,在于文本編碼器

一句話總結:Imagen是一個大型從文本到圖像的超分辨率擴散模型,可以生成逼真圖像,并且在評級中擊敗了Dall·E 2。

Jim指出,和Dall·E 2相比,Imagen使用了更為強大的文本編碼器T5-XXL,這直接影響了它的語言理解能力。

比如同題對比中,左邊是谷歌Imagen選手眼中的“貓貓絆倒人類雕像”,右邊DALL·E 2選手的創作則是醬嬸兒的:

圖片

3、ProcTHOR:房間模型模擬器

一句話總結:ProcTHOR是一個可以生成大量定制化、可實際應用房間模型的AI。

和Chinchilla一樣,ProcTHOR也需要大量數據來訓練,然后從中摸索出自己的生成方案。

該成果由艾倫人工智能實驗室提出,在此之前他們還為家用機器人提出了一些模型,如AI2THOR 和 ManipulaTHOR,可以讓他們感知房間環境。

4、MineDojo:看70000小時《我的世界》視頻學會人類高級技巧

圖片

一句話總結:該研究提出一個由3個智能體(agent)組成的“具身GPT-3”,可以感知無限世界并在其中行動。

研究團隊認為,想要訓練出通才agent需要具備3方面因素:

第一、一個開放的環境,可以包含無限不同種類的任務(比如地球就是個開放環境);

第二、一個大規模知識庫,可以教會AI做什么事、該做哪些事;

第三、足夠靈活的代理框架,能將知識轉化為實際操作。

綜上,《我的世界》是一個絕佳的訓練場地。研究團隊讓AI看了70000小時《我的世界》視頻后,它學會了使用鉆石鎬、打造“簡易避難所”等人類玩家的高級操作。

值得一提的是,該成果的模擬套件、數據庫、算法代碼、預訓練模型,甚至注釋工具,全部對外開源

圖片

5、LAION-5B:史上最大規模公共開放的多模態圖文數據集

圖片

一句話總結:一個包含58.5億個CLIP過濾的圖像-文本對數據集。

LAION-5B不用過多介紹了,Stable Diffusion使用正是它。

該數據集獲得了今年NeurIPS最杰出數據集論文獎。

圖片

目前Stable Diffusion 2也已經上線了。

6、超越神經網絡縮放定律:通過數據集修剪擊敗冪律

圖片

一句話總結:通過仔細篩選訓練示例、而不是盲目收集更多數據,有可能大大超越神經網絡的縮放定律。

該研究中,Meta和斯坦福的學者們通過數據蒸餾,縮小數據集規模,但是保持模型性能不下降。

實驗驗證,在剪掉ImageNet 20%的數據量后,ResNets表現和使用原本數據時的正確率相差不大。

研究人員表示,這也為AGI實現找出了一條新路子。

7、讓AI自己調超參數

圖片

一句話總結:使用超級隨機梯度下降法,實現自動調超參數。

谷歌大腦設計了一個基于AI的優化器VeLO,整體由LSTM(長短期記憶網絡)和超網絡MLP(多層感知機)構成。

其中每個LSTM負責設置多個MLP的參數,各個LSTM之間則通過全局上下文信息進行相互協作。

采用元訓練的方式,VeLO以參數值和梯度作為輸入,輸出需要更新的參數。

結果表明,VeLO在83個任務上的加速效果超過了一系列當前已有的優化器。

圖片

8、利用自然語言和程序抽象讓機器學會人類歸納性偏好

圖片

一句話總結:利用自然語言描述和引導程序,讓智能體的行為更像人類。

論文表明,語言和程序中存儲了大量人類抽象先驗知識,智能體可以在元強化學習設置中學到這些歸納性偏好。

如下是是否使用人類抽象先驗知識的對比:

圖片

9、新方法提高擴散模型生成結果

一句話總結:英偉達通過對擴散模型的訓練流程進行分析,得到新的方法來提高最后生成的結果。

圖片

此次研究提出了很多實用的方法改進了模型的生成效果:

  • 一個新的采樣過程,大大減少了合成過程中的采樣步數;
  • 改進了訓練過程中噪聲水平的分布;
  • 其他一些改進方法,如non-leaking增強,即不會將生成分布暴露給生成器。

10、神經語料庫索引器(NCI)

一句話總結:NCI可以直接為特定的查詢生成相關的文檔標識符,并顯著提高信息檢索性能。

圖片

傳統的檢索系統是基于文檔向量嵌入和最近鄰搜索。

而NCI則使用了一個端到端的可微模型,極大地簡化了搜索管道,并且有可能在單個框架中統一檢索、排序和Q&A

圖片

11、一種新的采樣方法

一句話總結:加州大學設計出一個最有效的算法從多個分布中進行采樣,按需采樣。

圖片

研究利用隨機零和博弈的方法研究了多重分布學習問題。

多重分布學習在機器學習公平性、聯邦學習以及多主題協作中都有著重要的應用。

在這其中,分布可能是不平衡或重疊的,所以最佳的算法應該按需采樣。

12、分布外樣本(OOD)檢測是可學習的嗎?

一句話總結:OOD檢測在某些條件下是不可學習的,但是這些條件不適用于一些實際情況。

Jim表示,具體來講,我們所熟悉的監督式學習的測試數據是內部分發的,但現實世界卻是混亂的。

而這個研究運用PAC學習理論,提出了3個具體的不可能性定理,推斷應用于實際環境中確定OOD檢測的可行性。

更重要的是,此項工作還為現有的OOD檢測方法提供了理論基礎。

13、基于黎曼得分的生成模型(RSGMs)

圖片

一句話總結:這是一類將模型擴展到黎曼流形的生成模型(與歐幾里德空間中的數據相反)

擴散模型目前已經在人工智能領域取得了很大的進展,不過大多數模型都被假設是一個扁平的流形。

但在機器人學、地球科學或蛋白質折疊等領域,數據也能很好地在黎曼流形上描述。

這項研究使得Stable Diffusion有望應用在氣候科學上。

圖片

14、SGD的高維極限定理

一句話總結:研究用一個統一的方法,了解在高維情況下具有恒定步長的隨機梯度下降的縮放極限。

圖片

其核心貢獻是發展一個統一的方法,在連續步長之下,使我們了解SGD在高維的比例限制。

研究團隊還在目前正流行的模型中證明了這個方法,示例也展示了很好的效果:

包括收斂的多模態時間尺度以及收斂到次優解決方案,概率從隨機初始化開始有界地遠離零。

15、RODEO:減小估計梯度方法REINFORCE的方差。

一句話總結:利用Stein算子控制變量來增強REINFORCE的性能。

圖片

離散變量使神經網絡不可微,所以估計梯度的一種常見方法是REINFORCE,但這種方法又存在很大的方差。

本文提出了一種利用Stein算子控制變量增強REINFORCE的高性能方法:“ RODEO”。

并且,這種控制變量可以在線調整以最小化方差,并且不需要對目標函數進行額外的評估。

在基準生成建模任務中,例如訓練二進制變分自動編碼器,在具有相同數量的函數估計的情況下,研究的梯度估計器實現了有史以來最低的方差。

大佬來自英偉達,師從李飛飛

總結這一超強線程的大佬Jim,現就職于英偉達

他的研究方向是開發具有通用能力的自主智能體,如上讓AI學會《我的世界》人類玩家技巧的論文,正是他的成果。

他博士就讀于斯坦福大學視覺實驗室,師從李飛飛。

曾在谷歌云、OpenAI、百度硅谷AI實驗室等實習。

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-09-05 23:34:52

Kubernetes云原生

2014-05-07 10:47:51

移動金融互聯網金融GMIC

2015-08-03 10:21:04

設計模式表達

2020-11-27 09:57:11

Python代碼PyPy

2023-09-06 15:23:30

Docker容器K8S

2025-05-12 01:22:00

2010-03-29 11:55:12

無線上網報錯

2023-05-08 15:44:23

3D數字人

2019-08-15 11:42:56

程序員電腦軟件

2024-02-08 09:33:37

蘋果AI

2022-12-12 13:45:46

模型修圖

2011-06-03 16:42:47

SEO

2018-01-15 10:45:43

社交網絡互聯網巨頭百度

2020-12-16 10:43:44

PythonPyPy代碼

2019-09-05 10:13:28

2024-07-01 07:40:00

2025-05-20 13:52:12

GPU集群微軟

2014-12-16 08:58:17

甲骨文Oracle數據庫選件

2023-12-13 21:50:59

騰訊AI模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久久一区 | 夜夜久久| 亚洲精品福利在线 | 亚洲精品国产成人 | 亚洲精品一区av在线播放 | 欧洲精品一区 | 欧美综合一区二区 | 99re6在线视频精品免费 | 欧美激情视频一区二区三区免费 | 精品国产一区二区三区成人影院 | 国产精品美女久久久久久久网站 | 99久久婷婷国产综合精品 | 天天操天天拍 | av中文网 | 午夜ww| 亚洲嫩草| 日本精品视频在线观看 | 日本一级淫片免费啪啪3 | 国产欧美在线播放 | 九九视频在线观看 | 夜夜骑首页 | 女生羞羞视频 | 青娱乐一区二区 | 欧美精品福利视频 | 精品av| 免费黄色av | 久热久 | 伊人久久精品一区二区三区 | 女同av亚洲女人天堂 | 久久天天躁狠狠躁夜夜躁2014 | 亚洲一区中文字幕 | 欧美专区在线观看 | av网站免费看 | 久久精品国产一区 | 午夜视频在线视频 | 一区二区三区四区日韩 | 国内精品成人 | 国产1区2区 | 天天操妹子 | 日韩免费视频 | 国产精品国产三级国产aⅴ中文 |