成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<center id="8scks"><code id="8scks"></code></center>

<abbr id="8scks"><code id="8scks"></code></abbr>

<nav id="8scks"></nav>

<abbr id="8scks"></abbr>

<center id="8scks"><code id="8scks"></code></center>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用

發布于 2025-1-9 11:47

瀏覽

0收藏

今天凌晨，微軟研究院開源了目前最強小參數模型——phi-4。

去年12月12日，微軟首次展示了phi-4，參數只有140億性能卻極強，在GPQA研究生水平、MATH數學基準測試中，超過了OpenAI的GPT-4o，也超過了同類頂級開源模型Qwen 2.5 -14B和Llama-3.3-70B。

在美國數學競賽AMC的測試中phi-4更是達到了91.8分，超過了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名開閉源模型，甚至整體性能可以與4050億參數的Llama-3.1媲美。

當時很多人就希望微軟開源這款超強的小參數模型，甚至還有人在HuggingFace上傳盜版的phi-4權重?，F在，終于開源了，并且支持MIT許可證下商業用途。

開源地址：https://huggingface.co/microsoft/phi-4/tree/main

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

連HuggingFace官推都來祝賀，phi-4面子不小。

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

2025 年美好的開始！有史以來最好的14B模型?。。?/p>

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

140參數的模型在MMLU獲得84.8分，太瘋狂了。恭喜！

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

謝謝你的模型和許可證變更！真棒。

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

你們都是英雄，趕緊下起來吧！

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

我期待Phi-4在Azure上實現無服務器功能。什么時候會可用？

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

小參數模型非常好。

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

Phi的小參數對于創意寫作來說是非常驚人的。

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

哇，phi-4 模型能在蘋果的M4 Pro筆記本上，以每秒約 12 個tokens的速度流暢運行，這太棒了，感謝！

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

phi-4簡單介紹

phi-4能以如此小的參數在眾多測試基準中打敗著名開閉源模型，高質量的合成數據發揮了重要作用。

與傳統的從網絡爬取的有機數據相比，高質量的合成數據更具優勢。合成數據能夠提供結構化、逐步的學習材料，使得模型能夠更加高效地學習語言的邏輯與推理過程。例如，在數學問題的解答中，合成數據可以按照解題步驟逐步呈現，幫助模型更好地理解問題的結構與解題思路。

此外，合成數據能夠更好地與模型的推理上下文對齊，更接近于模型在實際應用中需要生成的輸出格式，這有助于模型在預訓練階段就適應實際應用場景的需求。例如，將網絡論壇中的事實信息改寫成類似大模型交互的風格，使得這些信息在模型生成的對話中更加自然、合理。

phi-4的合成數據生成遵循多樣性、細膩性與復雜性、準確性和推理鏈等原則。涵蓋了 50 多種不同類型的合成數據集，通過多階段提示流程、種子策劃、改寫與增強、自我修訂等多種方法，生成了約 4000 億個未加權的 tokens。

除了合成數據，phi-4還對有機數據進行了嚴格的篩選與過濾。研究團隊從網絡內容、授權書籍和代碼庫等多渠道收集數據，并通過兩階段過濾過程，提取出具有高教育價值和推理深度的種子數據。

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

這些種子數據為合成數據的生成提供了基礎，同時也直接用于預訓練，進一步豐富了模型的知識儲備。在篩選過程中，微軟采用了基于小分類器的過濾方法，從大規模網絡數據中挑選出高質量的文檔。還針對多語言數據進行了專門的處理，確保模型能夠處理包括德語、西班牙語、法語、葡萄牙語、意大利語、印地語和日語在內的多種語言。

預訓練方面，phi-4主要使用合成數據進行訓練，同時輔以少量的高質量有機數據。這種數據混合策略使得模型能夠在學習推理和問題解決能力的同時，也能夠吸收豐富的知識內容。

在中期訓練階段，phi-4將上下文長度從 4096 擴展到 16384，以提高模型對長文本的處理能力。幫助模型進一步增加了對長文本數據的訓練，包括從高質量非合成數據集中篩選出的長于 8K 上下文的樣本，以及新創建的滿足4K 序列要求的合成數據集。

后訓練階段是 phi-4 優化模型的關鍵。微軟采用了監督微調（SFT）和直接偏好優化（DPO）技術。在 SFT 階段，使用來自不同領域的高質量數據生成的約 8B tokens對預訓練模型進行微調，學習率為 10 - 6，并添加了 40 種語言的多語言數據，所有數據均采用 chatml 格式。

DPO 技術則通過生成偏好數據來調整模型的輸出，使其更符合人類偏好。微軟還引入了關鍵tokens搜索（PTS）技術來生成DPO 對，該技術能夠識別對模型回答正確性有重大影響的關鍵tokens，并針對這些tokens創建偏好數據，從而提高模型在推理任務中的性能。

重磅！微軟開源最強小模型Phi-4，超GPT-4o、可商用-AI.x社區

為了評估 phi-4 的性能，微軟在多個基準測試上進行了測試。在學術基準測試方面，如 MMLU、GPQA、MATH、HumanEval 等，phi-4 表現出色。

在 MMLU測試中，phi-4取得了84.8 的高分，在 GPQA 和 MATH 測試中，甚至超越了GPT - 4o，在數學競賽相關的任務中展現出強大的推理能力。在與其他類似規模和更大規模的模型比較中，phi-4 在 12 個基準測試中的9個上優于同類開源模型 Qwen - 2.5 - 14B - Instruct。

本文轉自 AIGC開放社區，作者：AIGC開放社區

原文鏈接:??https://mp.weixin.qq.com/s/Rk-XBLd3PosXCJhH_mth1w??

標簽

贊

收藏

回復

舉報

回復

相關推薦

GPT-4o 的數學又雙叕進步了？來 MathBench 看看新版 GPT-4o 到底強在哪！

戀戀青鳥 ? 3512瀏覽 ? 0回復
GPT-4o做Code Review可行嗎？

51CTO技術棧 ? 3702瀏覽 ? 0回復
AutoCoder：性能超越GPT-4o的模型，居然只有33B，還是開源！

大語言模型論文跟蹤 ? 7205瀏覽 ? 0回復
GPT-4o背后可能的語音技術

魚蟲子 ? 3403瀏覽 ? 0回復
英偉達開源3400億巨獸，98%合成數據訓出最強開源通用模型！性能對標GPT-4o

duhorse ? 3092瀏覽 ? 0回復
性能超Llama 3，可商用！開源大模型Falcon 2

Aceryt ? 3398瀏覽 ? 0回復
OpenAI正式打響海外價格戰，GPT-4o mini成地表最強小模型，百萬tokens僅需60美分

InfonityAI智推星 ? 3412瀏覽 ? 0回復
最強GPT-4o正確率僅55.8%，開源模型不如瞎蒙

duhorse ? 3225瀏覽 ? 0回復
英偉達最強勁敵Groq一招絕殺GPU，反超GPT-4o mini2倍，AI大佬Karpathy：直接飛升AGI!

51CTO技術棧 ? 2533瀏覽 ? 0回復
阿里重磅開源Qwen2-VL：能理解超20分鐘視頻，媲美GPT-4o！

Aceryt ? 3396瀏覽 ? 0回復
阿里史上最大規模開源發布，超GPT-4o 、Llama-3.1！

Aceryt ? 2437瀏覽 ? 0回復
擊敗GPT-4o、僅次于o1！英偉達重磅開源超強大模型--Nemotron

Aceryt ? 3322瀏覽 ? 0回復
重磅開源Nemotron大模型：擊敗GPT-4o、僅次于o1！

51CTO技術棧 ? 2232瀏覽 ? 0回復
超GPT-4o，1240億參數！最強開源多模態模型 Pixtral Large！

Aceryt ? 2541瀏覽 ? 0回復
小模型界o1來了：微軟推出Phi-4，數學推理能力太逆天！14B模型擊敗GPT-4o！還印證了AI墻的一個重要推斷

51CTO技術棧 ? 2450瀏覽 ? 0回復
微軟 Phi-4 震撼發布：14B 參數模型性能超越一眾大模型，數學推理性能提升顯著

Syrupup ? 3014瀏覽 ? 0回復
微軟發布Phi-4，最強小模型！參數極小、超GPT-4o

Aceryt ? 2222瀏覽 ? 0回復
微軟開源小模型Phi系列：技術演進、能力突破與未來展望

上堵吟1 ? 3308瀏覽 ? 0回復
微軟Phi-4-Mini技術報告：Phi-4-Mini如何以小博大

sbf_2000 ? 3233瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

剛剛，OpenAI發布GPT-image-1模型，更強吉卜力版本來啦 2025-04-24 09:57:36發布
字節跳動開源多模態AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：機器人ChatGPT時刻！英偉達開源世界大模型，完美模擬物理世界！

下一篇：清華團隊靠強化學習讓 7B 模型打敗 GPT-4o 數學推理

社區精華內容

目錄

主站蜘蛛池模板：欧美成人激情 | 国产精品不卡一区 | 精品一区二区三区电影 | 精品一区二区三区视频在线观看 | 日本不卡一区二区三区 | 精品一区欧美 | 欧美黑人狂野猛交老妇 | 免费在线观看一区二区三区 | 欧美日韩电影在线 | 亚洲一区二区在线免费观看 | www.9191.com| 国产精品一区二区福利视频 | 亚洲一区黄色 | 亚洲热在线视频 | 国产一区二区三区四区在线观看 | 亚洲精品一区二区三区免 | 国产精品久久久久久婷婷天堂 | 欧美群妇大交群中文字幕 | 亚洲成人久久久 | 久久久噜噜噜www成人网 | 一本一道久久a久久精品蜜桃 | 无码一区二区三区视频 | 国产成人精品一区二区三区四区 | 99精品久久久 | 精品国产一区二区国模嫣然 | 成人免费淫片aa视频免费 | 亚洲精品无 | 中文字幕av一区 | 久久久久无码国产精品一区 | 伊人爽 | 理论片午午伦夜理片影院 | 日韩成人av在线播放 | 日韩一区二区av | 99国产精品99久久久久久 | 欧美日韩在线一区二区 | 天天看天天操 | 精品福利视频一区二区三区 | 久久国产日韩欧美 | 国产精品免费一区二区三区四区 | 天天射色综合 | 欧美成人精品二区三区99精品 |

<abbr id="6os4y"><menu id="6os4y"></menu></abbr>

<s id="6os4y"><dd id="6os4y"></dd></s>

<abbr id="6os4y"><menu id="6os4y"></menu></abbr>

<center id="6os4y"></center><strike id="6os4y"></strike>

<button id="6os4y"><option id="6os4y"></option></button>

<center id="6os4y"></center>