成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什么內幕?

人工智能 新聞
據現在可以查到的 WizardLM-2 發布信息,這是一個「真正媲美 GPT-4」的開源大模型,在復雜聊天、多語言、推理和代理方面的性能得到了提高。

前段時間,微軟搞了個烏龍:隆重地開源了 WizardLM-2,又在不久后撤回得干干凈凈。

據現在可以查到的 WizardLM-2 發布信息,這是一個「真正媲美 GPT-4」的開源大模型,在復雜聊天、多語言、推理和代理方面的性能得到了提高。

該系列包括三個模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:

  • WizardLM-2 8x22B 是最先進的模型,也是對高度復雜任務進行內部評估后得出的最佳開源 LLM。
  • WizardLM-2 70B 具備頂級推理能力,是同等規模的首選;
  • WizardLM-2 7B 是速度最快的,其性能可與現有的 10 倍大的開源領先模型相媲美。

圖片

此外,通過人類偏好評估,WizardLM-28x22B 的能力「只是稍微落后于 GPT-4-1106 預覽版,但明顯強于 CommandRPlus 和 GPT4-0314。」

圖片

圖片

它會和 LLaMa 3 一樣,成為又一開源里程碑嗎?

當大家忙著下載模型的時候,團隊卻突然撤回了一切:博客、GitHub、HuggingFace 全部 404。

圖片

圖源:https://wizardlm.github.io/WizardLM2/

團隊的解釋是:

所有 Huggingface 的朋友們,大家好!很抱歉,我們刪除了模型。我們已經有一段時間沒有發布幾個月前的模型了,所以我們現在不熟悉新的發布流程:我們不小心遺漏了模型發布流程中的一個必要項目 — 毒性測試。這是目前所有新模型都需要完成的一個步驟。

我們目前正在快速完成這項測試,然后將盡快重新發布我們的模型。不用擔心,感謝關心和理解。

圖片

但 AI 社區對 WizardLM-2 的關注和討論沒有停止,疑點有幾個:

圖片

第一,被刪掉的開源項目不只是 WizardLM-2,該團隊所有的 Wizard 系列工作都不見了,包括此前的 WizardMath 和 WizardCoder。

圖片

圖片

第二,有人質疑,刪除模型權重的同時,為何連博客也刪除呢?如果是只是缺少測試部分,沒必要撤回得干干凈凈。

圖片

圖片

團隊的解釋是:「根據相關規定。」具體什么規定?目前沒人知道。

圖片

第三,還有人猜測 WizardLM 背后的團隊已經被解雇,撤回 Wizard 系列項目也是被迫的。

圖片

不過,這種猜測被團隊否認了:

圖片

圖源:https://x.com/_Mira___Mira_/status/1783716276944486751

圖片

圖源:https://x.com/DavidFSWD/status/1783682898786152470

而且我們現在搜索作者的名字,也并沒有從微軟官網中完全消失:

圖片

圖源:https://www.microsoft.com/en-us/research/people/qins/

第四,有人猜測,微軟撤回這個開源模型,一是因為性能過于接近 GPT-4,二是因為和 OpenAI 的技術路線「撞車」了。

具體是什么路線呢?我們可以看一下當初博客頁面的技術細節。

團隊表示,通過 LLM 訓練,自然界中人類生成的數據日益枯竭,而 AI 精心創建的數據和 AI Step-by-Step 監督的模型將是通往更強大 AI 的唯一途徑。

過去的一年里,微軟團隊建立了一個完全由人工智能驅動的合成訓練系統,如下圖所示。

圖片

大概分為幾個版塊:

圖片

數據預處理:

  1. 數據分析:使用這個 pipeline 來獲得新源數據的不同屬性的分布,這有助于對數據有一個初步的了解。
  2. 加權采樣:最佳訓練數據的分布往往與人類聊天語料的自然分布不一致,需要根據實驗經驗調整訓練數據中各屬性的權重。

圖片

Evol Lab:

  1. Evol-Instruct:投入了大量精力重新評估了最初 Evol-Instruct 方法中存在的各種問題,并對其進行了初步修改,新方法能讓各種智能體自動生成高質量的指令。
  2. Evol-Answer:引導模型多次生成和重寫回復,可以提高其邏輯性、正確性和親和力。

AI Align AI(AAA):

  1. 協同教學:收集 WizardLM 和各種授權開源和專有的最先進模型,然后讓它們協同教學并相互提高,教學內容包括模擬聊天、質量評判、改進建議和縮小技能差距等。
  2. Self-Teaching:WizardLM 可以通過激活學習,為監督學習生成新的進化訓練數據,為強化學習生成偏好數據。

學習:

  1. 監督學習。
  2. 階段 - DPO:為了更有效地進行離線強化學習,將優選數據分割成不同的片段,并逐級改進模型。
  3. RLEIF:采用指令質量獎勵模型(IRM)與過程監督獎勵模型(PRM)相結合的方法,使得在線強化學習中實現更精確的正確性。

最后要說的是,任何猜測都是徒勞的,讓我們期待一下 WizardLM-2 的復出吧。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-07-25 09:23:23

Llama 2GPT-4

2023-08-15 10:33:06

微軟必應人工智能

2023-02-02 14:16:39

GPT-4微軟

2023-03-20 08:19:23

GPT-4OpenAI

2023-12-26 08:17:23

微軟GPT-4

2023-08-25 13:12:59

AI開源

2023-06-19 08:19:50

2023-03-26 21:03:54

GPT-4人工智能

2025-04-16 09:35:03

2023-04-24 15:41:27

ChatGPT人工智能

2023-12-17 22:04:04

微軟GPT-4

2024-04-25 16:56:14

GPT-4大模型人工智能

2025-05-30 07:40:56

2023-03-20 21:44:10

微軟GPT-4AI

2024-04-01 13:06:52

Grok-1.5GPT-4人工智能

2023-07-19 11:43:59

AIGPT-4

2023-08-17 08:00:00

2024-06-28 13:40:03

2023-03-17 07:33:24

GPT-5GPT-4OpenAI

2023-03-16 19:17:57

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产黄色小视频在线观看 | 国产免费一区二区三区网站免费 | 国内久久 | 99福利视频 | 日本a∨视频 | 午夜视频在线播放 | 在线色网 | 久久久久久成人 | 精品一区二区在线视频 | 久久亚洲一区二区三区四区 | 久久极品| 最新国产精品 | 人碰人操| 国产精品久久久久久久久久不蜜臀 | 久久久免费| 国产精品一区二区三区四区 | 久草网站 | caoporn视频| 国产电影一区二区 | 国产精品久久久久久一区二区三区 | www.日韩| 一区二区三区亚洲 | 亚洲色欧美另类 | 三级黄色片在线播放 | 欧美日韩在线一区二区 | 色综合久久天天综合网 | 国产精品明星裸体写真集 | 久久成人国产精品 | 伊人精品在线 | 一级a性色生活片久久毛片波多野 | 国产69久久精品成人看动漫 | 国产综合在线视频 | 欧美高清视频 | 精品国产欧美一区二区三区成人 | 碰碰视频| 日韩美香港a一级毛片免费 国产综合av | 国产高清精品一区二区三区 | 日本一二区视频 | 欧美激情精品久久久久久 | 天天操天天操 | 涩涩视频在线观看免费 |