成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

4o-mini只有8B,Claude 3.5 Sonnet有175B,微軟論文「透露」了下頂級模型參數

人工智能 新聞
這篇論文主要介紹了一個用于檢測和糾正臨床記錄中醫療錯誤的公開基準測試 MEDEC1,其包含 3,848 個臨床文本。論文描述了數據創建方法,并評估了近期的 LLMs(例如 o1-preview、GPT-4、Claude 3.5 Sonnet 和 Gemini 2.0 Flash)在檢測和糾正需要醫學知識和推理能力的醫療錯誤任務上的表現。

剛剛,X 上的一則推文受到了大家的廣泛討論,瀏覽量迅速增長。原來,OpenAI 發布的 GPT-4o-mini 居然是一個僅有 8B 參數的模型?


圖片

圖源:https://x.com/Yuchenj_UW/status/1874507299303379428

事情是這樣的。就在前幾天,微軟和華盛頓大學合作完成了一篇論文《MEDEC: A BENCHMARK FOR MEDICAL ERROR DETECTION AND CORRECTION IN CLINICAL NOTES 》。

圖片論文地址:https://arxiv.org/pdf/2412.19260

這篇論文主要介紹了一個用于檢測和糾正臨床記錄中醫療錯誤的公開基準測試 MEDEC1,其包含 3,848 個臨床文本。論文描述了數據創建方法,并評估了近期的 LLMs(例如 o1-preview、GPT-4、Claude 3.5 Sonnet 和 Gemini 2.0 Flash)在檢測和糾正需要醫學知識和推理能力的醫療錯誤任務上的表現。

因為要進行實驗,因而在論文實驗部分出現了眾多模型的參數量,如下所示。

圖片

此前,有些模型的參數量都是未知的,也是大家比較好奇的。

此外,在這部分內容底下,微軟還列出了一句聲明「大多數模型參數的數量是估計的」。

圖片

通過這張圖,我們不難發現,除了 GPT-4o-mini,大家還發現了其他模型的大小,比如:

  • Claude 3.5 Sonnet: 175B;
  • GPT-4: 1.76T;
  • GPT-4o: 200B;
  • o1-preview: 300B;
  • o1-mini: 200B。

結果部分也是將模型參數分為多個等級:

圖片

但是在這個推文下面大家討論的非常激烈,主要圍繞微軟對模型大小的估計到底準不準確。

前面我們已經提到,模型參數都是估計出來的。因此有網友表示「就算微軟確實知道,但并不代表微軟 99% 的員工都知道?!埂赣?98% 的可能性是他們只是微軟雇傭的研究人員,但與有權訪問 OpenAI 的團隊沒有任何聯系?!?/span>

圖片


圖片

「感覺這些數字只是作者的猜測,因為他們沒有解釋他們是如何估計的。」不過這位網友強調的這一點,論文確實說明了參數是估計的。

圖片

還有網友表示這篇論文將 Claude 3.5 Sonnet 估計為 175B 有點扯。

圖片

「Claude 不可能只有 175B,我敢打賭它接近這個數字的兩倍。尤其是自 deepseek-v3 發布以來,其內存大小達到 671B,而 Claude 的表現輕松超越了后者。」

圖片

「我敢打賭 4o-mini 是一個 MoE 模型,總共有大約 400 億個參數,可能有 80 億個激活參數。我發現它比 80 億個模型擁有更多的知識(當詢問事實時),同時速度相當快?!?/span>

圖片

還有網友認為這是一個合理的猜測。消息畢竟出自微軟。

圖片

討論來討論去,最后的結論依然是沒有結論,你怎么看這篇論文給出的數據呢?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-01-02 11:00:34

2024-06-03 10:43:34

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2024-12-09 08:00:00

AI大模型人工智能

2024-10-06 09:00:00

AI訓練數據

2025-05-27 15:19:52

GPUMetaGPT-4o

2024-06-21 09:58:38

2024-12-27 10:27:58

2025-01-02 13:00:00

2025-01-22 16:57:32

字節跳動豆包大模型

2024-10-17 13:30:00

2024-06-21 09:51:17

2024-10-17 18:52:41

2025-01-16 16:39:44

2024-06-17 18:04:38

2024-06-24 12:25:22

2025-02-10 00:00:01

2025-05-29 09:07:37

2024-07-24 11:30:04

2024-12-26 14:42:23

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91麻豆产精品久久久久久 | 国产午夜精品久久久久 | 成年人网站免费视频 | 日本手机在线 | 欧美freesex黑人又粗又大 | 亚洲精品视频免费看 | 欧美999| 国产精品亚洲成在人线 | 男女羞羞视频大全 | 亚洲成av人片在线观看 | 99精品欧美一区二区三区 | 国产在线精品一区二区三区 | 成人精品一区二区三区中文字幕 | 国产一区二区三区在线看 | 欧美区日韩区 | 免费黄色网址视频 | 免费小视频在线观看 | 日本黄色短片 | 我要看一级片 | 国产在线视频一区二区董小宛性色 | 亚洲国产成人精品久久久国产成人一区 | 欧美性猛交一区二区三区精品 | 99pao成人国产永久免费视频 | 欧美精品导航 | 国产区一区二区三区 | 国产成人av在线播放 | 国产欧美精品区一区二区三区 | 99热热热热| 国产视频福利一区 | jlzzjlzz国产精品久久 | 国产精品视频免费看 | 日韩毛片免费视频 | 久久香焦| 国产精品视频一区二区三区 | 欧美a在线看 | 久久久久国产精品 | 国产99小视频 | 国产免费自拍 | 日韩av成人在线 | 人妖videosex高潮另类 | 天天草天天射 |