成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用

發布于 2025-1-9 11:47
瀏覽
0收藏

今天凌晨,微軟研究院開源了目前最強小參數模型——phi-4。


去年12月12日,微軟首次展示了phi-4,參數只有140億性能卻極強,在GPQA研究生水平、MATH數學基準測試中,超過了OpenAI的GPT-4o,也超過了同類頂級開源模型Qwen 2.5 -14B和Llama-3.3-70B。


在美國數學競賽AMC的測試中phi-4更是達到了91.8分,超過了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名開閉源模型,甚至整體性能可以與4050億參數的Llama-3.1媲美。


當時很多人就希望微軟開源這款超強的小參數模型,甚至還有人在HuggingFace上傳盜版的phi-4權重?,F在,終于開源了,并且支持MIT許可證下商業用途。


開源地址:https://huggingface.co/microsoft/phi-4/tree/main

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

連HuggingFace官推都來祝賀,phi-4面子不小。

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

2025 年美好的開始!有史以來最好的14B模型?。。?/p>

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

140參數的模型在MMLU獲得84.8分,太瘋狂了。恭喜!

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

謝謝你的模型和許可證變更!真棒。

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

你們都是英雄,趕緊下起來吧!

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

我期待Phi-4在Azure上實現無服務器功能。什么時候會可用?

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

小參數模型非常好。

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

Phi的小參數對于創意寫作來說是非常驚人的。

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

哇,phi-4 模型能在蘋果的M4 Pro筆記本上,以每秒約 12 個tokens的速度流暢運行,這太棒了,感謝!

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

phi-4簡單介紹

phi-4能以如此小的參數在眾多測試基準中打敗著名開閉源模型,高質量的合成數據發揮了重要作用。


與傳統的從網絡爬取的有機數據相比,高質量的合成數據更具優勢。合成數據能夠提供結構化、逐步的學習材料,使得模型能夠更加高效地學習語言的邏輯與推理過程。例如,在數學問題的解答中,合成數據可以按照解題步驟逐步呈現,幫助模型更好地理解問題的結構與解題思路。


此外,合成數據能夠更好地與模型的推理上下文對齊,更接近于模型在實際應用中需要生成的輸出格式,這有助于模型在預訓練階段就適應實際應用場景的需求。例如,將網絡論壇中的事實信息改寫成類似 大模型交互的風格,使得這些信息在模型生成的對話中更加自然、合理。


phi-4的合成數據生成遵循多樣性、細膩性與復雜性、準確性和推理鏈等原則。涵蓋了 50 多種不同類型的合成數據集,通過多階段提示流程、種子策劃、改寫與增強、自我修訂等多種方法,生成了約 4000 億個未加權的 tokens。


除了合成數據,phi-4還對有機數據進行了嚴格的篩選與過濾。研究團隊從網絡內容、授權書籍和代碼庫等多渠道收集數據,并通過兩階段過濾過程,提取出具有高教育價值和推理深度的種子數據。

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

這些種子數據為合成數據的生成提供了基礎,同時也直接用于預訓練,進一步豐富了模型的知識儲備。在篩選過程中,微軟采用了基于小分類器的過濾方法,從大規模網絡數據中挑選出高質量的文檔。還針對多語言數據進行了專門的處理,確保模型能夠處理包括德語、西班牙語、法語、葡萄牙語、意大利語、印地語和日語在內的多種語言。


預訓練方面,phi-4主要使用合成數據進行訓練,同時輔以少量的高質量有機數據。這種數據混合策略使得模型能夠在學習推理和問題解決能力的同時,也能夠吸收豐富的知識內容。


在中期訓練階段,phi-4將上下文長度從 4096 擴展到 16384,以提高模型對長文本的處理能力。幫助模型進一步增加了對長文本數據的訓練,包括從高質量非合成數據集中篩選出的長于 8K 上下文的樣本,以及新創建的滿足4K 序列要求的合成數據集。


后訓練階段是 phi-4 優化模型的關鍵。微軟采用了監督微調(SFT)和直接偏好優化(DPO)技術。在 SFT 階段,使用來自不同領域的高質量數據生成的約 8B tokens對預訓練模型進行微調,學習率為 10 - 6,并添加了 40 種語言的多語言數據,所有數據均采用 chatml 格式。


DPO 技術則通過生成偏好數據來調整模型的輸出,使其更符合人類偏好。微軟還引入了關鍵tokens搜索(PTS)技術來生成DPO 對,該技術能夠識別對模型回答正確性有重大影響的關鍵tokens,并針對這些tokens創建偏好數據,從而提高模型在推理任務中的性能。

重磅!微軟開源最強小模型Phi-4,超GPT-4o、可商用-AI.x社區

為了評估 phi-4 的性能,微軟在多個基準測試上進行了測試。在學術基準測試方面,如 MMLU、GPQA、MATH、HumanEval 等,phi-4 表現出色。


在 MMLU測試中,phi-4取得了84.8 的高分,在 GPQA 和 MATH 測試中,甚至超越了GPT - 4o,在數學競賽相關的任務中展現出強大的推理能力。在與其他類似規模和更大規模的模型比較中,phi-4 在 12 個基準測試中的9個上優于同類開源模型 Qwen - 2.5 - 14B - Instruct。


本文轉自 AIGC開放社區  ,作者:AIGC開放社區


原文鏈接:??https://mp.weixin.qq.com/s/Rk-XBLd3PosXCJhH_mth1w??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 欧美成人激情 | 国产精品不卡一区 | 精品一区二区三区电影 | 精品一区二区三区视频在线观看 | 日本不卡一区二区三区 | 精品一区欧美 | 欧美黑人狂野猛交老妇 | 免费在线观看一区二区三区 | 欧美日韩电影在线 | 亚洲一区二区在线免费观看 | www.9191.com| 国产精品一区二区福利视频 | 亚洲一区黄色 | 亚洲热在线视频 | 国产一区二区三区四区在线观看 | 亚洲精品一区二区三区免 | 国产精品久久久久久婷婷天堂 | 欧美群妇大交群中文字幕 | 亚洲成人久久久 | 久久久噜噜噜www成人网 | 一本一道久久a久久精品蜜桃 | 无码一区二区三区视频 | 国产成人精品一区二区三区四区 | 99精品久久久 | 精品国产一区二区国模嫣然 | 成人免费淫片aa视频免费 | 亚洲精品无 | 中文字幕av一区 | 久久久久无码国产精品一区 | 伊人爽 | 理论片午午伦夜理片影院 | 日韩成人av在线播放 | 日韩一区二区av | 99国产精品99久久久久久 | 欧美日韩在线一区二区 | 天天看天天操 | 精品福利视频一区二区三区 | 久久国产日韩欧美 | 国产精品免费一区二区三区四区 | 天天射色综合 | 欧美成人精品二区三区99精品 |