「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什么內幕？

作者：機器之心 2024-04-30 12:35:10

據現在可以查到的 WizardLM-2 發布信息，這是一個「真正媲美 GPT-4」的開源大模型，在復雜聊天、多語言、推理和代理方面的性能得到了提高。

前段時間，微軟搞了個烏龍：隆重地開源了 WizardLM-2，又在不久后撤回得干干凈凈。

據現在可以查到的 WizardLM-2 發布信息，這是一個「真正媲美 GPT-4」的開源大模型，在復雜聊天、多語言、推理和代理方面的性能得到了提高。

該系列包括三個模型：WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中：

此外，通過人類偏好評估，WizardLM-28x22B 的能力「只是稍微落后于 GPT-4-1106 預覽版，但明顯強于 CommandRPlus 和 GPT4-0314。」

它會和 LLaMa 3 一樣，成為又一開源里程碑嗎？

當大家忙著下載模型的時候，團隊卻突然撤回了一切：博客、GitHub、HuggingFace 全部 404。

圖源：https://wizardlm.github.io/WizardLM2/

團隊的解釋是：

所有 Huggingface 的朋友們，大家好！很抱歉，我們刪除了模型。我們已經有一段時間沒有發布幾個月前的模型了，所以我們現在不熟悉新的發布流程：我們不小心遺漏了模型發布流程中的一個必要項目 — 毒性測試。這是目前所有新模型都需要完成的一個步驟。

我們目前正在快速完成這項測試，然后將盡快重新發布我們的模型。不用擔心，感謝關心和理解。

但 AI 社區對 WizardLM-2 的關注和討論沒有停止，疑點有幾個：

第一，被刪掉的開源項目不只是 WizardLM-2，該團隊所有的 Wizard 系列工作都不見了，包括此前的 WizardMath 和 WizardCoder。

第二，有人質疑，刪除模型權重的同時，為何連博客也刪除呢？如果是只是缺少測試部分，沒必要撤回得干干凈凈。

團隊的解釋是：「根據相關規定。」具體什么規定？目前沒人知道。

第三，還有人猜測 WizardLM 背后的團隊已經被解雇，撤回 Wizard 系列項目也是被迫的。

不過，這種猜測被團隊否認了：

圖源：https://x.com/_Mira___Mira_/status/1783716276944486751

圖源：https://x.com/DavidFSWD/status/1783682898786152470

而且我們現在搜索作者的名字，也并沒有從微軟官網中完全消失：

圖源：https://www.microsoft.com/en-us/research/people/qins/

第四，有人猜測，微軟撤回這個開源模型，一是因為性能過于接近 GPT-4，二是因為和 OpenAI 的技術路線「撞車」了。

具體是什么路線呢？我們可以看一下當初博客頁面的技術細節。

團隊表示，通過 LLM 訓練，自然界中人類生成的數據日益枯竭，而 AI 精心創建的數據和 AI Step-by-Step 監督的模型將是通往更強大 AI 的唯一途徑。

過去的一年里，微軟團隊建立了一個完全由人工智能驅動的合成訓練系統，如下圖所示。

大概分為幾個版塊：

數據預處理：

Evol Lab：

Evol-Instruct：投入了大量精力重新評估了最初 Evol-Instruct 方法中存在的各種問題，并對其進行了初步修改，新方法能讓各種智能體自動生成高質量的指令。
Evol-Answer：引導模型多次生成和重寫回復，可以提高其邏輯性、正確性和親和力。

AI Align AI（AAA）：

學習：

最后要說的是，任何猜測都是徒勞的，讓我們期待一下 WizardLM-2 的復出吧。

責任編輯：張燕妮來源：機器之心

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看