成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

從BERT到ChatGPT,百頁(yè)綜述梳理預(yù)訓(xùn)練大模型演變史

人工智能 新聞
這篇近百頁(yè)的綜述梳理了預(yù)訓(xùn)練基礎(chǔ)模型的演變史,讓我們看到 ChatGPT 是怎么一步一步走向成功的。

所有的成功都有跡可循,ChatGPT 也不例外。

前不久,因?yàn)閷?duì) ChatGPT 的評(píng)價(jià)過于苛刻,圖靈獎(jiǎng)得主 Yann LeCun 被送上了熱搜。

在他看來,「就底層技術(shù)而言,ChatGPT 并沒有什么特別的創(chuàng)新,」也不是「什么革命性的東西」。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開展同樣的工作。更重要的是,ChatGPT 及其背后的 GPT-3 在很多方面都是由多方多年來開發(fā)的多種技術(shù)組成的,是不同的人數(shù)十年貢獻(xiàn)的結(jié)果。因此,LeCun 認(rèn)為,與其說 ChatGPT 是一個(gè)科學(xué)突破,不如說它是一個(gè)像樣的工程實(shí)例。

圖片

「ChatGPT 是否具有革命性」是個(gè)充滿爭(zhēng)議的話題。但毋庸置疑,它確實(shí)是在此前積累的多項(xiàng)技術(shù)的基礎(chǔ)上構(gòu)建起來的,比如核心的 Transformer 是谷歌在幾年前提出來的,而 Transformer 又受到了 Bengio 關(guān)于注意力概念的工作的啟發(fā)。如果再往前追溯,我們還能鏈接到更古早的幾十年前的研究。

當(dāng)然,公眾可能體會(huì)不到這種循序漸進(jìn)的感覺,畢竟不是誰(shuí)都會(huì)一篇一篇去看論文。但對(duì)于技術(shù)人員來說,了解這些技術(shù)的演進(jìn)過程還是非常有幫助的。

在最近的一篇綜述文章中,來自密歇根州立大學(xué)、北京航空航天大學(xué)、理海大學(xué)等機(jī)構(gòu)的研究者仔細(xì)梳理了該領(lǐng)域的幾百篇論文,主要聚焦文本、圖像和圖學(xué)習(xí)領(lǐng)域的預(yù)訓(xùn)練基礎(chǔ)模型,非常值得一讀。杜克大學(xué)教授、加拿大工程院院士裴健,伊利諾大學(xué)芝加哥分校計(jì)算機(jī)科學(xué)系特聘教授俞士綸Philip S. Yu),Salesforce AI Research 副總裁熊蔡明是該論文作者之一。

圖片

論文鏈接:https://arxiv.org/pdf/2302.09419.pdf

論文目錄如下:?

圖片

圖片

在海外社交平臺(tái)上,DAIR.AI 聯(lián)合創(chuàng)始人Elvis S.推薦了這篇綜述并獲得了一千多的點(diǎn)贊量。

圖片

引言

預(yù)訓(xùn)練基礎(chǔ)模型(PFM)是大數(shù)據(jù)時(shí)代人工智能的重要組成部分?!富A(chǔ)模型」的名字來源于 Percy Liang、李飛飛等人發(fā)布的一篇綜述 ——《On the Opportunities and Risks of Foundation Models》,是一類模型及其功能的總稱。在 NLP、CV 和圖學(xué)習(xí)領(lǐng)域,PFM 已經(jīng)得到了廣泛研究。在各種學(xué)習(xí)任務(wù)中,它們表現(xiàn)出了強(qiáng)大的特征表示學(xué)習(xí)潛力,如文本分類、文本生成、圖像分類、目標(biāo)檢測(cè)和圖分類等任務(wù)。無論是用大型數(shù)據(jù)集在多個(gè)任務(wù)上訓(xùn)練,還是在小規(guī)模任務(wù)上進(jìn)行微調(diào),PFM 都表現(xiàn)出了優(yōu)越的性能,這使其快速啟動(dòng)數(shù)據(jù)處理成為可能。

PFM 和預(yù)訓(xùn)練

PFM 基于預(yù)訓(xùn)練技術(shù),其目的是利用大量的數(shù)據(jù)和任務(wù)來訓(xùn)練一個(gè)通用模型,該模型可以在不同的下游應(yīng)用中很容易地進(jìn)行微調(diào)。

預(yù)訓(xùn)練的想法起源于 CV 任務(wù)中的遷移學(xué)習(xí)。但看到該技術(shù)在 CV 領(lǐng)域的有效性后,人們也開始利用該技術(shù)提高其他領(lǐng)域的模型性能。

當(dāng)預(yù)訓(xùn)練技術(shù)應(yīng)用于 NLP 領(lǐng)域時(shí),經(jīng)過良好訓(xùn)練的語(yǔ)言模型可以捕捉到對(duì)下游任務(wù)有益的豐富知識(shí),如長(zhǎng)期依賴關(guān)系、層次關(guān)系等。此外,預(yù)訓(xùn)練在 NLP 領(lǐng)域的顯著優(yōu)勢(shì)是,訓(xùn)練數(shù)據(jù)可以來自任何未標(biāo)記的文本語(yǔ)料庫(kù),也就是說,幾乎存在著無限量的訓(xùn)練數(shù)據(jù)可以用于預(yù)訓(xùn)練過程。早期的預(yù)訓(xùn)練是一種靜態(tài)技術(shù),如 NNLM 和 Word2vec,但靜態(tài)方法很難適應(yīng)不同的語(yǔ)義環(huán)境。因此,人們提出了動(dòng)態(tài)預(yù)訓(xùn)練技術(shù),如 BERT、XLNet 等。圖 1 描述了 PFM 在 NLP、CV 和 GL 領(lǐng)域的歷史和演變。基于預(yù)訓(xùn)練技術(shù)的 PFM 使用大型語(yǔ)料庫(kù)來學(xué)習(xí)通用語(yǔ)義表征。隨著這些開創(chuàng)性工作的引入,各種 PFM 已經(jīng)出現(xiàn),并被應(yīng)用于下游的任務(wù)和應(yīng)用。

最近走紅的 ChatGPT 是 PFM 應(yīng)用的典型案例。它是從生成性預(yù)訓(xùn)練 transformer 模型 GPT-3.5 中微調(diào)出來的,該模型利用了大量本文和代碼進(jìn)行訓(xùn)練。此外,ChatGPT 還應(yīng)用了來自人類反饋的強(qiáng)化學(xué)習(xí)(RLHF),這已經(jīng)成為讓大型 LM 與人類意圖保持一致的一種有希望的方式。ChatGPT 卓越的性能表現(xiàn)可能會(huì)給每種類型的 PFM 的訓(xùn)練范式帶來轉(zhuǎn)變,比如指令對(duì)齊技術(shù)、強(qiáng)化學(xué)習(xí)、prompt tuning 和思維鏈的應(yīng)用,從而走向通用人工智能。

本文將重點(diǎn)放在文本、圖像和圖領(lǐng)域的 PFM,這是一個(gè)相對(duì)成熟的研究分類方法。對(duì)于文本來說,它是一個(gè)多用途的 LM,用于預(yù)測(cè)序列中的下一個(gè)單詞或字符。例如,PFM 可用于機(jī)器翻譯、問答系統(tǒng)、主題建模、情感分析等。對(duì)于圖像,它類似于文本上的 PFM,使用巨大的數(shù)據(jù)集來訓(xùn)練一個(gè)適合許多 CV 任務(wù)的大模型。對(duì)于圖來說,類似的預(yù)訓(xùn)練思路也被用于獲得 PFM,這些 PFM 被用于許多下游任務(wù)。除了針對(duì)特定數(shù)據(jù)域的 PFM,本文還回顧并闡述了其他一些先進(jìn)的 PFM,如針對(duì)語(yǔ)音、視頻和跨域數(shù)據(jù)的 PFM,以及多模態(tài) PFM。此外,一場(chǎng)能夠處理多模態(tài)任務(wù)的的 PFM 的大融合正在出現(xiàn),這就是所謂的 unified PFM。作者首先定義了 unified PFM 的概念,然后回顧了最近研究中達(dá)到 SOTA 的 unified PFM(如 OFA、UNIFIED-IO、FLAVA、BEiT-3 等)。

根據(jù)上述三個(gè)領(lǐng)域現(xiàn)有的 PFM 的特點(diǎn),作者得出結(jié)論,PFM 有以下兩大優(yōu)勢(shì)。首先,要想提高在下游任務(wù)中的性能,模型只需要進(jìn)行很小的微調(diào)。其次,PFM 已經(jīng)在質(zhì)量方面得到了審查。我們可以將 PFM 應(yīng)用于任務(wù)相關(guān)的數(shù)據(jù)集,而不是從頭開始構(gòu)建模型來解決類似的問題。PFM 的廣闊前景激發(fā)了大量的相關(guān)工作來關(guān)注模型的效率、安全性和壓縮等問題。

論文貢獻(xiàn)與結(jié)構(gòu)

在這篇文章發(fā)布之前,已經(jīng)有幾篇綜述回顧了一些特定領(lǐng)域的預(yù)訓(xùn)練模型,如文本生成、視覺 transformer、目標(biāo)檢測(cè)。

《On the Opportunities and Risks of Foundation Models》總結(jié)了基礎(chǔ)模型的機(jī)會(huì)和風(fēng)險(xiǎn)。然而,現(xiàn)有的工作并沒有實(shí)現(xiàn)對(duì)不同領(lǐng)域(如 CV、NLP、GL、Speech、Video)PFM 在不同方面的全面回顧,如預(yù)訓(xùn)練任務(wù)、效率、效力和隱私。在這篇綜述中,作者詳細(xì)闡述了 PFM 在 NLP 領(lǐng)域的演變,以及預(yù)訓(xùn)練如何遷移到 CV 和 GL 領(lǐng)域并被采用。

與其他綜述相比,本文沒有對(duì)所有三個(gè)領(lǐng)域的現(xiàn)有 PFM 進(jìn)行全面的介紹和分析。與對(duì)先前預(yù)訓(xùn)練模型的回顧不同,作者總結(jié)了現(xiàn)有的模型,從傳統(tǒng)模型到 PFM,以及三個(gè)領(lǐng)域的最新工作。傳統(tǒng)模型強(qiáng)調(diào)的是靜態(tài)特征學(xué)習(xí)。動(dòng)態(tài) PFM 對(duì)結(jié)構(gòu)進(jìn)行了介紹,這是主流的研究。

作者進(jìn)一步介紹了 PFM 的一些其他研究,包括其他先進(jìn)和統(tǒng)一的 PFM、模型的效率和壓縮、安全以及隱私。最后,作者總結(jié)了未來的研究挑戰(zhàn)和不同領(lǐng)域的開放問題。他們還在附錄 F 和 G 中全面介紹了相關(guān)的評(píng)價(jià)指標(biāo)和數(shù)據(jù)集。 

總之,本文的主要貢獻(xiàn)如下:?

  • 對(duì) PFM 在 NLP、CV 和 GL 中的發(fā)展進(jìn)行了詳實(shí)和最新的回顧。在回顧中,作者討論并提供了關(guān)于這三個(gè)主要應(yīng)用領(lǐng)域中通用 PFM 的設(shè)計(jì)和預(yù)訓(xùn)練方法的見解;
  • 總結(jié)了 PFM 在其他多媒體領(lǐng)域的發(fā)展,如語(yǔ)音和視頻。此外,作者還討論了關(guān)于 PFM 的前沿話題,包括統(tǒng)一的 PFM、模型效率和壓縮,以及安全和隱私。
  • 通過對(duì)各種模式的 PFM 在不同任務(wù)中的回顧,作者討論了大數(shù)據(jù)時(shí)代超大型模型未來研究的主要挑戰(zhàn)和機(jī)遇,這指導(dǎo)了新一代基于 PFM 的協(xié)作和互動(dòng)智能。

各個(gè)章節(jié)的主要內(nèi)容如下:

論文第 2 章介紹了 PFM 的一般概念架構(gòu)。

圖片

第 3、4、5 章分別總結(jié)了 NLP、CV 和 GL 領(lǐng)域中現(xiàn)有的 PFM。

圖片

圖片

圖片

第 6、7 章介紹了 PFM 的其他前沿研究,包括前沿和統(tǒng)一的 PFM、模型效率和壓縮,以及安全和隱私。

第 8 章總結(jié)了 PFM 的主要挑戰(zhàn)。第 9 章對(duì)全文進(jìn)行了總結(jié)。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-02-27 12:57:32

BERTChatGPT機(jī)構(gòu)

2024-11-04 00:24:56

2009-07-01 09:46:14

火狐界面瀏覽器

2020-03-17 09:42:00

谷歌開源機(jī)器學(xué)習(xí)

2018-03-28 17:18:26

大數(shù)據(jù)

2025-04-16 02:30:00

2023-11-05 10:04:47

2023-03-30 13:51:42

AIChatGPT

2023-05-16 12:11:22

2020-03-13 15:33:54

Google 開源技術(shù)

2024-01-03 18:53:13

語(yǔ)言模型LLM

2023-03-16 17:21:52

AIChatGPT

2022-09-30 15:28:05

BERT語(yǔ)言模型自然語(yǔ)言

2023-06-24 19:59:40

2024-11-26 09:33:44

2024-12-26 00:46:25

機(jī)器學(xué)習(xí)LoRA訓(xùn)練

2023-05-19 07:25:34

2024-06-19 16:11:22

2024-01-02 09:49:19

AI研究調(diào)查
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 91精品久久久久久久久久 | 欧美2区 | 国产精品99久久久久久久久久久久 | 久久综合av | 国产亚洲一区二区精品 | 国产精品99一区二区 | 国产一区二区三区不卡av | 国产区精品在线观看 | 久久午夜国产精品www忘忧草 | 99爱视频 | 精品美女在线观看 | 欧美精品一二三区 | 免费一二区 | 国产成人综合在线 | 中文字幕免费视频 | 午夜午夜精品一区二区三区文 | 久久免费大片 | 国产精品久久久久久福利一牛影视 | 中文字幕日韩欧美一区二区三区 | 一区在线视频 | 91人人看 | 精品国产91亚洲一区二区三区www | av网站在线看 | 久久综合入口 | 九九在线视频 | 亚洲国产一区二区三区 | 激情欧美一区二区三区中文字幕 | 国产一区二区三区四区五区加勒比 | 欧美九九 | 爱综合| www.jizzjizz| 久久久久成人精品免费播放动漫 | www.亚洲国产精品 | 欧美激情在线精品一区二区三区 | 亚洲不卡在线观看 | 98成人网 | 成人影院午夜 | 蜜桃精品视频在线 | 最近中文字幕在线视频1 | 一级做a毛片 | 999久久久久久久 |