成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5%參數比肩DeepSeek滿血R1!北大“小”模型靠分合蒸餾,打破推理成本下限

人工智能 新聞
北京大學楊仝教授團隊近期發布了其在高效大型語言模型研究方向的一項新成果——FairyR1-32B模型。

只用5%的參數,數學和代碼能力竟然超越滿血DeepSeek?

北京大學楊仝教授團隊近期發布了其在高效大型語言模型研究方向的一項新成果——FairyR1-32B模型

該模型基于DeepSeek-R1-Distill-Qwen-32B基座,通過結合微調與模型合并技術構建。

研究探索了在參數量大幅減少的情況下,模型在特定任務上實現與更大模型相當甚至更優性能的可能性。

以上模型已在Huggingface開源

模型地址:https://huggingface.co/PKU-DS-LAB/FairyR1-32B

FairyR1-32B模型解析

FairyR1-32B模型是在團隊前期TinyR1工作基礎上進行的進一步探索,沿用了“分合蒸餾”的研究思路,提出了多種改進方法,包括自我合并多教師交叉蒸餾輕蒸餾等方法,并在數據處理進行了優化,模型精度有了顯著提升。

本次工作重點改進了蒸餾數據的構建流程,對來源于AI-MO/NuminaMath-1.5(數學)open-thoughts/OpenThoughts-114k(代碼)等數據集的原始數據,通過多個“教師模型”生成答案,隨后對問答數據進行精心篩選、結構調整與思維鏈優化,并進行多階段篩選。

篩選過程包括基于答案的正確性驗證(針對數學數據),以及基于長度的篩選(數學數據保留2k-8k tokens范圍,代碼數據保留4k-8k tokens范圍),最終構建了更具針對性的約6.6k條數學數據和約3.8k條代碼數據用于訓練。

在模型結構方面,研究團隊嘗試訓練兩個領域(數學和代碼)的專業模型進行合并,旨在進一步優化流程和資源消耗。

這兩個專業模型在一致的訓練參數下(例如相同的學習率和批次大小)獨立訓練約5個周期后,利用AcreeFusion工具進行了合并。

實驗結果

在多個公開基準測試中,FairyR1展現出了在低參數量下的競爭力表現。以下為FairyR1與DeepSeek-R1-671B及DeepSeek-R1-Distill-Qwen-32B在部分基準上的得分對比:

基準測試

DeepSeek-R1-671B(滿血版)

DeepSeek-R1-Distill-Qwen-32B

FairyR1-32B   (北京大學)

數學能力AIME 2024

79.8

72.6

80.4

數學能力AIME 2025

70.0

52.9

75.6

代碼能力LiveCodeBench

65.9

57.2

67.7

科學問答能力GPQA-Diamond

71.5

62.1

59.6

從測試結果可以看出,FairyR1-32B在AIME 2025和LiveCodeBench基準上得分略高于DeepSeek-R1-671B,在AIME 2024上表現接近。在GPQA-Diamond科學基準上,FairyR1的得分低于DeepSeek-R1-671B。

這些結果表明,FairyR1在采用DeepSeek-R1-Distill-Qwen-32B基座并經過特定技術處理后,能夠在約5%參數量的情況下,在數理和編程等領域實現與大型模型相當或略優的性能水平,但在科學等其他領域可能存在差距。

這項工作探索了通過優化的數據處理和模型融合技術,在保證特定任務性能的前提下,大幅降低模型規模和潛在推理成本的可能性。

北京大學楊仝教授團隊表示:“FairyR1-32B模型是我們探索高效大型語言模型技術路線的階段性成果。通過對蒸餾和合并方法的改進,我們初步驗證了在有限資源下實現高性能模型的可行性。”

團隊成員:李旺、周俊廷、劉文睿、姚一倫、王融樂、楊仝

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-06 17:29:21

2025-02-25 08:20:50

AI程序員DeepSeek

2025-03-06 10:14:39

2025-03-06 09:55:49

2025-02-25 14:50:16

2025-03-11 02:00:00

AI工具Token-AI

2025-03-07 08:50:03

2025-01-27 12:30:07

2025-02-17 09:33:00

AI算法模型

2025-02-10 06:50:00

AIDeepSeek推理模型

2025-03-27 10:28:32

2025-02-27 00:00:05

2025-03-03 00:04:00

DeepSeek教程部署

2025-03-03 08:17:00

DeepSeek模型數據

2025-03-07 08:30:00

2025-02-20 15:32:28

2025-02-07 08:33:02

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 最新中文字幕一区 | 亚洲精品1区 | 中文字幕加勒比 | 欧美成人一区二区三区 | 欧美在线二区 | 亚洲天堂中文字幕 | 日本免费一区二区三区 | 美女日批免费视频 | 日本特黄特色aaa大片免费 | 欧美极品在线观看 | 国产一区二区高清在线 | 四虎成人精品永久免费av九九 | 亚洲在线 | 九九热这里 | 欧美视频一级 | 羞羞视频在线网站观看 | 国产精品夜夜夜一区二区三区尤 | 夜久久| 国产一区二区观看 | 欧美aaaaa| 日韩在线播放中文字幕 | 国产精品视频 | av中文字幕在线 | 嫩草黄色影院 | 青青草视频网站 | 九九综合九九 | 国产一区三区在线 | 欧美性一级 | 红桃视频一区二区三区免费 | 日本不卡一区二区三区 | 久久精品国产久精国产 | 久色网 | 欧美成人a∨高清免费观看 色999日韩 | 国产高清在线观看 | 国产色| 一级在线视频 | 一区二区三区高清在线观看 | 日韩在线一区二区三区 | 精品视频成人 | 正在播放国产精品 | 欧美精品一区二区三区在线播放 |