成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<pre id="aoomi"><sup id="aoomi"></sup></pre>

<menu id="aoomi"><th id="aoomi"></th></menu>

<abbr id="aoomi"></abbr>

<code id="aoomi"><fieldset id="aoomi"></fieldset></code>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

數(shù)學能力超ChatGPT，70B開源大模型火了：用AI微調(diào)AI，微軟全華班出品

2023-08-14 13:29:37

OpenAI的大模型（InstructGPT、GPT-4等）能夠取得巨大成功、去執(zhí)行各種復(fù)雜和多樣化的任務(wù)，一部分原因是使用了真實人類用戶生成的開放域指令數(shù)據(jù)進行了微調(diào)。

用AI生成的指令微調(diào)羊駝大模型，數(shù)學能力超ChatGPT——

微軟最新開源大模型WizardMath來了。

如下圖所示，經(jīng)過GSM8k數(shù)據(jù)集測試，WizardMath數(shù)學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——

并且是在參數(shù)只有700億，遠不及后三者的情況之下。

HuggingFace已上線3個在線可玩版本（分別為7B、13B和70B參數(shù)），各種數(shù)學題可以直接丟進去試一試。

比如解決下面這道四次多項式方程：

或者是一道簡單的微積分：

亦或者是稍微修改過的拉格朗日方程推導：

它都全部正確（過程也不需要等太久）。

有網(wǎng)友向作者表示：

效果真的很驚人，感謝你們對開源LLM的貢獻。

目前，相關(guān)代碼、復(fù)現(xiàn)方式以及論文也都開源或上線，GitHub短短幾天已攬獲4.8k標星。

那么，WizardMath究竟是如何做到的？

用AI生成的指令增強大模型能力

OpenAI的大模型（InstructGPT、GPT-4等）能夠取得巨大成功、去執(zhí)行各種復(fù)雜和多樣化的任務(wù)，一部分原因是使用了真實人類用戶生成的開放域指令數(shù)據(jù)進行了微調(diào)。

然而，不是誰都能像這家公司一樣獲得這樣的指令數(shù)據(jù)集。

一是因為整個注釋過程極其昂貴且耗時，二是人工難以創(chuàng)建出足夠比例的高難度指令。

因此，開發(fā)出一種成本相對較低的、大規(guī)模開放域指令自動生產(chǎn)方法，成為當下指令調(diào)優(yōu)語言模型的關(guān)鍵。

在此，作者將他們的方法命名為Evol Instruction。

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。

具體而言，Evol Instruction分為指令進化器和指令消除器。

其中指令進化器可通過深度進化（藍線）或廣度進化（紅線）兩種路徑，將簡單指令升級為更復(fù)雜的指令或創(chuàng)建一條全新指令。

具體執(zhí)行哪一條？隨機選擇就好。

其中，深度進化的具體“進化法”，則是通過五種類型的操作來完成，包括：

添加約束（add constraints）、深化（deepening）、具體化（concretizing）、增加推理步驟（increase reasoning steps）和使輸入復(fù)雜化（complicate input）。

由于所有指令均由AI完成，有時難免會出現(xiàn)錯誤。因此，指令消除器就是用于過濾失敗指令的。

以下是一個具體示例，該方法從“1+1=？”開始，最終通過以上步驟自動生成了相當多的新指令。

通過重復(fù)這一生成過程，最終我們就能得到足夠多的指令，然后將它們合并并隨機打亂，組成一個難度級別均勻分布的指令集，就可以對基礎(chǔ)大模型進行微調(diào)了。

在此，作者選擇Alpaca的訓練數(shù)據(jù)（僅由175條人工創(chuàng)建的種子指令生成）作為初始數(shù)據(jù)集，然后使用ChatGPT的API執(zhí)行了四個進化周期，最終獲得25萬條指令。

為了與Vicuna的70k真實用戶數(shù)據(jù)（ShareGPT）進行公平比較，作者從這25萬條數(shù)據(jù)中抽取了等量的樣本，訓練LLaMA 7B模型，最終得到WizardLM，結(jié)果WizardLM的性能明顯優(yōu)于Vicuna。

（Alpaca：斯坦福在LLaMa-7B基礎(chǔ)上微調(diào)出來的模型；Vicuna，UC伯克利在LLaMa-13B的基礎(chǔ)上微調(diào)得來）

此外，在更為復(fù)雜的測試指令下，人類更喜歡WizardLM的輸出，而非ChatGPT，這表明該方法可以顯著提高LLM處理復(fù)雜指令的能力。

基于此，作者又利用Evol Instruction生成了很多數(shù)學領(lǐng)域相關(guān)的指令，然后微調(diào)羊駝大模型，得到了WizardMath。

其效果如開頭所示，在GSM8k數(shù)據(jù)集上測得其數(shù)學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型，位列第5名，僅次于GPT-4、Claud1.3和2.0，以及5400億參數(shù)的Flan-PaLM 2之后。

以此類推，作者還在羊駝之上得到了專攻代碼能力的WizardCoder，效果超越Claude和Bard（詳情可戳文末地址）。

團隊介紹

本文共9位作者，全華人。

一作有3位：

Can Xu，微軟亞洲互聯(lián)網(wǎng)工程院S+D NLP組高級應(yīng)用科學家，之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統(tǒng)工作。

Qingfeng Sun， Microsoft Research科學家，研究方向為自然語言處理和信息檢索，精通構(gòu)建高效搜索系統(tǒng)，為Microsoft Bing和Office 365貢獻了核心深度模型。

Kai Zheng，Microsoft Research科學家，研究方向為自然語言處理、搜索和推薦排名，同樣為Microsoft Bing和Office 365貢獻了核心深度模型。

通訊作者為姜大昕，微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學家，在微軟工作16年有余、曾作為微軟必應(yīng)搜索引擎和Cortana智能助手自然語言理解負責人，日前已被曝離職投身大模型創(chuàng)業(yè)。

另還有一位作者Jiazhan Feng，是北大學生，這篇合著論文是TA在微軟實習時產(chǎn)出的。

項目主頁： https://github.com/nlpxucan/WizardLM/tree/main/WizardMath。

論文地址：https://arxiv.org/abs/2304.12244（WizardLM）https://arxiv.org/abs/2306.08568（WizardCoder）。

責任編輯：姜華來源：量子位

OpenAI 大模型

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

主站蜘蛛池模板：久久综合一区 | 手机在线观看 | 亚洲一区电影 | 亚洲福利一区 | 久久久www成人免费精品张筱雨 | 男人的天堂中文字幕 | 日韩一级 | 国产精品免费看 | 亚洲天堂成人在线视频 | 亚洲成人自拍 | 亚洲精品国产成人 | 久草资源在线 | 日干夜干 | 在线视频中文字幕 | 国产精品一区在线 | 中文av电影| 欧美精品网站 | japan25hdxxxx日本做a的各种视频 | 日韩毛片视频 | 精品一区在线 | 亚洲一区二区三区四区在线观看 | 国产精品一区久久久 | 中文字幕日韩欧美一区二区三区 | 亚洲黄色片免费观看 | 看a网站 | 亚洲欧洲一区二区 | 欧美一级网站 | 婷婷一级片 | 超碰97免费 | 99re在线视频 | 欧美久久一级特黄毛片 | 欧美一区在线看 | 国产综合在线视频 | 国产激情在线 | 日本在线观看视频 | 国产超碰人人爽人人做人人爱 | 久久精品黄色 | 99精品欧美一区二区蜜桃免费 | 国产精品a一区二区三区网址 | 久久美女视频 | 国产精品乱码一区二区三区 |

<kbd id="6q22q"></kbd>

<abbr id="6q22q"></abbr>

<table id="6q22q"><small id="6q22q"></small></table>

<option id="6q22q"></option>