成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Mistral-Medium意外泄露?沖上榜單的這個神秘模型讓AI社區討論爆了

人工智能 新聞
近日,一則關于「Mistral-Medium 模型泄露」的消息引起了大家的關注。

「我現在 100% 確信 Miqu 與 Perplexity Labs 上的 Mistral-Medium 是同一個模型。」

近日,一則關于「Mistral-Medium 模型泄露」的消息引起了大家的關注。

泄露傳聞與一個名為「Miqu」的新模型有關,在評估語言模型情商的基準 EQ-Bench(EQ-Bench 與 MMLU 的相關性約為 0.97、與 Arena Elo 的相關性約為 0.94)上, Miqu 直接吊打了除 GPT-4 之外的所有大模型,而且它的得分與 Mistral-Medium 非常接近:

圖片

圖源:https://x.com/N8Programs/status/1752441060133892503?s=20

開源地址:https://huggingface.co/miqudev/miqu-1-70b

這么強大的模型,項目的發布者卻是一位神秘人士:

圖片

有人問「who made you」, Miqu 直接自報家門:「I was created by the Mistral Al team.」

圖片

圖片

有人分別向兩個模型發送了同一道測試問題,收到的回答都是用俄語表達的。測試者加深了懷疑:「它似乎知道標準謎題,但如果是惡作劇者,根本不可能將其調整為同樣用俄語回答。」

圖片

在翻譯過程中,表述也近乎相同。

圖片

Miqu 到底來自何方?它真的是 Mistral-Medium 嗎?

在持續兩天的熱議中,多位開發者針對兩個模型做了對比,對比的結果指向以下幾種可能性:

1、Miqu 就是 Mistral-Medium;

2、Miqu 確實是來自 MistralAI 的一個模型,但是是一些早期的 MoE 實驗版本或其他版本;

3、Miqu 是 Llama2 的微調版本。

在前面,我們介紹了支持第一種可能性的開發者給出的理由。隨著事件的發酵,更多開發者投入了解密一般的行動中,對兩個模型進行了更深入的測試。一位 reddit 網友熬夜肝出的測試表明,Miqu 更像是 MistralAI 模型的早期版本。

圖片

這位開發者將模型應用于四個專業的德語在線數據保護培訓 / 考試中。測試數據、問題及所有指令都是用德語進行的,而字符卡是英語的。這可以測試翻譯能力和跨語言理解能力。

具體測試方法如下:

  • 在提供信息之前,用德語指示模型:「我將給你一些信息,請注意這些信息,但回答時只需用『OK』來確認你已理解,不要多說其他的。」這是為了測試模型對指令的理解和執行能力。 
  • 在提供話題的所有信息后,向模型提出考題。這是一個選擇題(A/B/C),其中第一個問題和最后一個問題相同,但選項順序和字母(X/Y/Z)被更改。每次測試包含 4-6 個考題,總共 18 個多項選擇題。 
  • 根據模型給出的正確答案數量來進行排名,首先考慮的是在提供了課程信息后的答案,其次是在沒有提前提供信息的情況下盲目回答的答案,以應對平局情況。所有測試都是獨立的單元,每次測試之間會清除上下文,各個會話之間不保留任何記憶或狀態。

詳細測試報告如下:  

miqudev/miqu-1-70b GGUF Q5_K_M,32K 上下文, Mistral 格式:只對 4+4+4+5=17/18 道選擇題給出了正確答案。沒有先前的信息,只回答問題,給出正確答案:4+3+1+5=13/18。沒有按照說明用 "OK" 確認數據輸入。

在測試過程中,開發者發現 Miqu 與 Mixtral 有許多相似之處:出色的德語拼寫和語法雙語;在回復中添加翻譯;在回復中添加注釋和評論。

不過,在這位開發者的測試中,Miqu 與 Mixtral-8x7B-Instruct-v0.1(4-bit)相比表現要差一些,仍優于 Mistral Small 和 Medium。但它并不比 Mixtral 8x7B Instruct 好得多。這位開發者猜測,Miqu 可能是泄露的 MistralAI 模型,是一個較舊的,可能是概念驗證模型。

這是我們目前看到的支持第二種說法的最詳細的測試。

不過,也有開發者認為,Miqu 和 MistralAI 沒有關系,反而更像 Llama 70B,因為其架構與 Llama 70B「完全相同」,「不是專家混合模型」。

圖片

同樣地,也有人測試之后發現,Miqu 的確更像 Llama:

圖片

但從得分差距來看,Miqu 和 Llama 70B 顯然又不是同一個模型。

圖片

所以,有人總結,要么 Miqu 是 Llama 微調版本,要么是 Mistral-Medium 的早期版本:

圖片

前者為真的話,Miqu 可能是在 Mistral-Medium 數據集上微調的 Llama 70B:

圖片

假如后者為真,Miqu 只是 Mistral API 的蒸餾,這或許將是「美國偽造登月」級別的鬧劇:

圖片

最后一個問題,泄露者是誰?

根據很多 X 平臺用戶提供的線索,這次疑似泄露的模型最初是發在一個名叫 4chan 的網站上的。這個網站是一個完全匿名的實時消息論壇,用戶不需要注冊就能就可以發表圖文言論。

圖片

當然,這些結論均屬主觀想法。對于所有的 AI 研究者來說,這波劇情需要一個「真相」來終結。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2017-12-12 11:00:34

數據庫MongoDB意外泄露

2023-09-21 08:23:07

2020-11-13 09:40:36

Windows 10Windows操作系統

2011-05-04 10:02:53

惠普云計算

2023-09-19 22:36:58

2025-05-08 09:07:13

2024-12-11 10:11:02

2025-01-21 11:53:53

2024-06-24 12:22:34

2025-05-09 09:02:00

2017-08-31 16:12:21

機器人

2023-09-19 06:39:46

2024-10-29 15:29:06

2023-04-10 11:00:00

注解Demo源碼

2024-12-09 14:00:00

AI生成

2024-10-24 13:40:00

AI大模型

2011-05-05 09:33:54

惠普云計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品综合网 | 中文日韩字幕 | 日韩中文字幕一区 | 亚洲精品黄色 | 久久不射网 | 精品国产伦一区二区三区观看方式 | 欧美色综合网 | 国产va| 欧美日韩在线国产 | 国产精品日韩在线观看 | 在线欧美小视频 | 国产 日韩 欧美 制服 另类 | 亚洲精品中文在线观看 | 精品久久久久久亚洲综合网 | 国产一区二区av | www性色| av色在线| 国产一区三区视频 | 亚洲精品久久久久久国产精华液 | 亚洲一二三视频 | 亚洲国产精品一区二区久久 | 国产激情网站 | 国产精品自产拍在线观看蜜 | 久久精品伊人 | 一区二区三区欧美在线观看 | 国产成人91视频 | 91视频官网 | 欧美一区二区三区四区在线 | 色婷婷一区二区三区四区 | 精品视频免费 | 久久久激情 | 久久精品久久久久久 | 欧美日韩一区精品 | 亚洲精品天堂 | 欧美啪啪网站 | 午夜免费观看体验区 | 美女国产一区 | www国产亚洲精品 | 国产在线播放av | 日韩一区二区黄色片 | 91久久夜色 |