成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

從BERT到ChatGPT，百頁(yè)綜述梳理預(yù)訓(xùn)練大模型演變史

作者：機(jī)器之心 2023-02-28 13:09:53

人工智能新聞

這篇近百頁(yè)的綜述梳理了預(yù)訓(xùn)練基礎(chǔ)模型的演變史，讓我們看到 ChatGPT 是怎么一步一步走向成功的。

所有的成功都有跡可循，ChatGPT 也不例外。

前不久，因?yàn)閷?duì) ChatGPT 的評(píng)價(jià)過于苛刻，圖靈獎(jiǎng)得主 Yann LeCun 被送上了熱搜。

在他看來，「就底層技術(shù)而言，ChatGPT 并沒有什么特別的創(chuàng)新，」也不是「什么革命性的東西」。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù)，開展同樣的工作。更重要的是，ChatGPT 及其背后的 GPT-3 在很多方面都是由多方多年來開發(fā)的多種技術(shù)組成的，是不同的人數(shù)十年貢獻(xiàn)的結(jié)果。因此，LeCun 認(rèn)為，與其說 ChatGPT 是一個(gè)科學(xué)突破，不如說它是一個(gè)像樣的工程實(shí)例。

「ChatGPT 是否具有革命性」是個(gè)充滿爭(zhēng)議的話題。但毋庸置疑，它確實(shí)是在此前積累的多項(xiàng)技術(shù)的基礎(chǔ)上構(gòu)建起來的，比如核心的 Transformer 是谷歌在幾年前提出來的，而 Transformer 又受到了 Bengio 關(guān)于注意力概念的工作的啟發(fā)。如果再往前追溯，我們還能鏈接到更古早的幾十年前的研究。

當(dāng)然，公眾可能體會(huì)不到這種循序漸進(jìn)的感覺，畢竟不是誰(shuí)都會(huì)一篇一篇去看論文。但對(duì)于技術(shù)人員來說，了解這些技術(shù)的演進(jìn)過程還是非常有幫助的。

在最近的一篇綜述文章中，來自密歇根州立大學(xué)、北京航空航天大學(xué)、理海大學(xué)等機(jī)構(gòu)的研究者仔細(xì)梳理了該領(lǐng)域的幾百篇論文，主要聚焦文本、圖像和圖學(xué)習(xí)領(lǐng)域的預(yù)訓(xùn)練基礎(chǔ)模型，非常值得一讀。杜克大學(xué)教授、加拿大工程院院士裴健，伊利諾大學(xué)芝加哥分校計(jì)算機(jī)科學(xué)系特聘教授俞士綸（Philip S. Yu），Salesforce AI Research 副總裁熊蔡明都是該論文作者之一。

論文鏈接：https://arxiv.org/pdf/2302.09419.pdf

論文目錄如下：?

在海外社交平臺(tái)上，DAIR.AI 聯(lián)合創(chuàng)始人Elvis S.推薦了這篇綜述并獲得了一千多的點(diǎn)贊量。

引言

預(yù)訓(xùn)練基礎(chǔ)模型（PFM）是大數(shù)據(jù)時(shí)代人工智能的重要組成部分?！富A(chǔ)模型」的名字來源于 Percy Liang、李飛飛等人發(fā)布的一篇綜述 ——《On the Opportunities and Risks of Foundation Models》，是一類模型及其功能的總稱。在 NLP、CV 和圖學(xué)習(xí)領(lǐng)域，PFM 已經(jīng)得到了廣泛研究。在各種學(xué)習(xí)任務(wù)中，它們表現(xiàn)出了強(qiáng)大的特征表示學(xué)習(xí)潛力，如文本分類、文本生成、圖像分類、目標(biāo)檢測(cè)和圖分類等任務(wù)。無論是用大型數(shù)據(jù)集在多個(gè)任務(wù)上訓(xùn)練，還是在小規(guī)模任務(wù)上進(jìn)行微調(diào)，PFM 都表現(xiàn)出了優(yōu)越的性能，這使其快速啟動(dòng)數(shù)據(jù)處理成為可能。

PFM 和預(yù)訓(xùn)練

PFM 基于預(yù)訓(xùn)練技術(shù)，其目的是利用大量的數(shù)據(jù)和任務(wù)來訓(xùn)練一個(gè)通用模型，該模型可以在不同的下游應(yīng)用中很容易地進(jìn)行微調(diào)。

預(yù)訓(xùn)練的想法起源于 CV 任務(wù)中的遷移學(xué)習(xí)。但看到該技術(shù)在 CV 領(lǐng)域的有效性后，人們也開始利用該技術(shù)提高其他領(lǐng)域的模型性能。

當(dāng)預(yù)訓(xùn)練技術(shù)應(yīng)用于 NLP 領(lǐng)域時(shí)，經(jīng)過良好訓(xùn)練的語(yǔ)言模型可以捕捉到對(duì)下游任務(wù)有益的豐富知識(shí)，如長(zhǎng)期依賴關(guān)系、層次關(guān)系等。此外，預(yù)訓(xùn)練在 NLP 領(lǐng)域的顯著優(yōu)勢(shì)是，訓(xùn)練數(shù)據(jù)可以來自任何未標(biāo)記的文本語(yǔ)料庫(kù)，也就是說，幾乎存在著無限量的訓(xùn)練數(shù)據(jù)可以用于預(yù)訓(xùn)練過程。早期的預(yù)訓(xùn)練是一種靜態(tài)技術(shù)，如 NNLM 和 Word2vec，但靜態(tài)方法很難適應(yīng)不同的語(yǔ)義環(huán)境。因此，人們提出了動(dòng)態(tài)預(yù)訓(xùn)練技術(shù)，如 BERT、XLNet 等。圖 1 描述了 PFM 在 NLP、CV 和 GL 領(lǐng)域的歷史和演變。基于預(yù)訓(xùn)練技術(shù)的 PFM 使用大型語(yǔ)料庫(kù)來學(xué)習(xí)通用語(yǔ)義表征。隨著這些開創(chuàng)性工作的引入，各種 PFM 已經(jīng)出現(xiàn)，并被應(yīng)用于下游的任務(wù)和應(yīng)用。

最近走紅的 ChatGPT 是 PFM 應(yīng)用的典型案例。它是從生成性預(yù)訓(xùn)練 transformer 模型 GPT-3.5 中微調(diào)出來的，該模型利用了大量本文和代碼進(jìn)行訓(xùn)練。此外，ChatGPT 還應(yīng)用了來自人類反饋的強(qiáng)化學(xué)習(xí)（RLHF），這已經(jīng)成為讓大型 LM 與人類意圖保持一致的一種有希望的方式。ChatGPT 卓越的性能表現(xiàn)可能會(huì)給每種類型的 PFM 的訓(xùn)練范式帶來轉(zhuǎn)變，比如指令對(duì)齊技術(shù)、強(qiáng)化學(xué)習(xí)、prompt tuning 和思維鏈的應(yīng)用，從而走向通用人工智能。

本文將重點(diǎn)放在文本、圖像和圖領(lǐng)域的 PFM，這是一個(gè)相對(duì)成熟的研究分類方法。對(duì)于文本來說，它是一個(gè)多用途的 LM，用于預(yù)測(cè)序列中的下一個(gè)單詞或字符。例如，PFM 可用于機(jī)器翻譯、問答系統(tǒng)、主題建模、情感分析等。對(duì)于圖像，它類似于文本上的 PFM，使用巨大的數(shù)據(jù)集來訓(xùn)練一個(gè)適合許多 CV 任務(wù)的大模型。對(duì)于圖來說，類似的預(yù)訓(xùn)練思路也被用于獲得 PFM，這些 PFM 被用于許多下游任務(wù)。除了針對(duì)特定數(shù)據(jù)域的 PFM，本文還回顧并闡述了其他一些先進(jìn)的 PFM，如針對(duì)語(yǔ)音、視頻和跨域數(shù)據(jù)的 PFM，以及多模態(tài) PFM。此外，一場(chǎng)能夠處理多模態(tài)任務(wù)的的 PFM 的大融合正在出現(xiàn)，這就是所謂的 unified PFM。作者首先定義了 unified PFM 的概念，然后回顧了最近研究中達(dá)到 SOTA 的 unified PFM（如 OFA、UNIFIED-IO、FLAVA、BEiT-3 等）。

根據(jù)上述三個(gè)領(lǐng)域現(xiàn)有的 PFM 的特點(diǎn)，作者得出結(jié)論，PFM 有以下兩大優(yōu)勢(shì)。首先，要想提高在下游任務(wù)中的性能，模型只需要進(jìn)行很小的微調(diào)。其次，PFM 已經(jīng)在質(zhì)量方面得到了審查。我們可以將 PFM 應(yīng)用于任務(wù)相關(guān)的數(shù)據(jù)集，而不是從頭開始構(gòu)建模型來解決類似的問題。PFM 的廣闊前景激發(fā)了大量的相關(guān)工作來關(guān)注模型的效率、安全性和壓縮等問題。

論文貢獻(xiàn)與結(jié)構(gòu)

在這篇文章發(fā)布之前，已經(jīng)有幾篇綜述回顧了一些特定領(lǐng)域的預(yù)訓(xùn)練模型，如文本生成、視覺 transformer、目標(biāo)檢測(cè)。

《On the Opportunities and Risks of Foundation Models》總結(jié)了基礎(chǔ)模型的機(jī)會(huì)和風(fēng)險(xiǎn)。然而，現(xiàn)有的工作并沒有實(shí)現(xiàn)對(duì)不同領(lǐng)域（如 CV、NLP、GL、Speech、Video）PFM 在不同方面的全面回顧，如預(yù)訓(xùn)練任務(wù)、效率、效力和隱私。在這篇綜述中，作者詳細(xì)闡述了 PFM 在 NLP 領(lǐng)域的演變，以及預(yù)訓(xùn)練如何遷移到 CV 和 GL 領(lǐng)域并被采用。

與其他綜述相比，本文沒有對(duì)所有三個(gè)領(lǐng)域的現(xiàn)有 PFM 進(jìn)行全面的介紹和分析。與對(duì)先前預(yù)訓(xùn)練模型的回顧不同，作者總結(jié)了現(xiàn)有的模型，從傳統(tǒng)模型到 PFM，以及三個(gè)領(lǐng)域的最新工作。傳統(tǒng)模型強(qiáng)調(diào)的是靜態(tài)特征學(xué)習(xí)。動(dòng)態(tài) PFM 對(duì)結(jié)構(gòu)進(jìn)行了介紹，這是主流的研究。

作者進(jìn)一步介紹了 PFM 的一些其他研究，包括其他先進(jìn)和統(tǒng)一的 PFM、模型的效率和壓縮、安全以及隱私。最后，作者總結(jié)了未來的研究挑戰(zhàn)和不同領(lǐng)域的開放問題。他們還在附錄 F 和 G 中全面介紹了相關(guān)的評(píng)價(jià)指標(biāo)和數(shù)據(jù)集。

總之，本文的主要貢獻(xiàn)如下：?

對(duì) PFM 在 NLP、CV 和 GL 中的發(fā)展進(jìn)行了詳實(shí)和最新的回顧。在回顧中，作者討論并提供了關(guān)于這三個(gè)主要應(yīng)用領(lǐng)域中通用 PFM 的設(shè)計(jì)和預(yù)訓(xùn)練方法的見解；
總結(jié)了 PFM 在其他多媒體領(lǐng)域的發(fā)展，如語(yǔ)音和視頻。此外，作者還討論了關(guān)于 PFM 的前沿話題，包括統(tǒng)一的 PFM、模型效率和壓縮，以及安全和隱私。
通過對(duì)各種模式的 PFM 在不同任務(wù)中的回顧，作者討論了大數(shù)據(jù)時(shí)代超大型模型未來研究的主要挑戰(zhàn)和機(jī)遇，這指導(dǎo)了新一代基于 PFM 的協(xié)作和互動(dòng)智能。

各個(gè)章節(jié)的主要內(nèi)容如下：

論文第 2 章介紹了 PFM 的一般概念架構(gòu)。

第 3、4、5 章分別總結(jié)了 NLP、CV 和 GL 領(lǐng)域中現(xiàn)有的 PFM。

第 6、7 章介紹了 PFM 的其他前沿研究，包括前沿和統(tǒng)一的 PFM、模型效率和壓縮，以及安全和隱私。

第 8 章總結(jié)了 PFM 的主要挑戰(zhàn)。第 9 章對(duì)全文進(jìn)行了總結(jié)。

責(zé)任編輯：張燕妮來源：機(jī)器之心

訓(xùn)練模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板： 91精品久久久久久久久久 | 欧美2区 | 国产精品99久久久久久久久久久久 | 久久综合av | 国产亚洲一区二区精品 | 国产精品99一区二区 | 国产一区二区三区不卡av | 国产区精品在线观看 | 久久午夜国产精品www忘忧草 | 99爱视频 | 精品美女在线观看 | 欧美精品一二三区 | 免费一二区 | 国产成人综合在线 | 中文字幕免费视频 | 午夜午夜精品一区二区三区文 | 久久免费大片 | 国产精品久久久久久福利一牛影视 | 中文字幕日韩欧美一区二区三区 | 一区在线视频 | 91人人看 | 精品国产91亚洲一区二区三区www | av网站在线看 | 久久综合入口 | 九九在线视频 | 亚洲国产一区二区三区 | 激情欧美一区二区三区中文字幕 | 国产一区二区三区四区五区加勒比 | 欧美九九 | 爱综合| www.jizzjizz| 久久久久成人精品免费播放动漫 | www.亚洲国产精品 | 欧美激情在线精品一区二区三区 | 亚洲不卡在线观看 | 98成人网 | 成人影院午夜 | 蜜桃精品视频在线 | 最近中文字幕在线视频1 | 一级做a毛片 | 999久久久久久久 |

<form id="xggba"></form>

<s id="xggba"><code id="xggba"><track id="xggba"></track></code></s>

<strike id="xggba"><code id="xggba"><abbr id="xggba"></abbr></code></strike>