成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<cite id="0s6qk"><samp id="0s6qk"></samp></cite><s id="0s6qk"><tfoot id="0s6qk"></tfoot></s>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

李飛飛、DeepSeek為何偏愛這個國產(chǎn)模型？

作者：新智元 2025-02-08 09:30:00

人工智能新聞

最近，李飛飛團(tuán)隊(duì)僅用26分鐘在Qwen基礎(chǔ)上訓(xùn)出超越o1的模型，而DeepSeek更是直接選擇了阿里通義千問Qwen蒸餾開源4款模型。一個不爭的事實(shí)浮出水面：昔日稱霸開源界Llama已悄然退位，新王加冕。

斯坦福李飛飛團(tuán)隊(duì)的一篇論文，近來在AI圈子掀起了一場颶風(fēng)。

他們僅用1000個樣本，在16塊H100上監(jiān)督微調(diào)26分鐘，訓(xùn)出的新模型s1-32B，竟取得了和OpenAI o1、DeepSeek R1等尖端推理模型相當(dāng)?shù)臄?shù)學(xué)和編碼能力！

團(tuán)隊(duì)也再次證明了測試時Scaling的威力。

就連AI大神Karpathy都為之驚嘆。

值得一提的是，研究人員是基于阿里通義千問Qwen2.5-32B-Instruct，完成了推理模型的微調(diào)。

甚至，在競賽數(shù)學(xué)問題上，新模型竟將o1-preview甩在身后，領(lǐng)先27%。

這一爆炸性突破，讓全世界目光都聚焦在了，這個來自阿里云的大模型——通義千問Qwen。

早在此之前，紅遍全網(wǎng)的DeepSeek便選擇的也是Qwen模型。

他們將DeepSeek-R1推理能力蒸餾6個模型開源給社區(qū)，其中4個都是基于Qwen打造。基于Qwen-32B蒸餾的模型，在多項(xiàng)能力上性能直追o1-mini。

再一次，通義千問Qwen模型又在開源社區(qū)火了。

有專家提出：也許，這是我們第一次認(rèn)真嘗試研究，推理中究竟發(fā)生了什么變化。

現(xiàn)在，我們有充分的理由去質(zhì)疑「涌現(xiàn)」的說法，也有了更多動力去理解，為什么Qwen-2.5-Math的基礎(chǔ)模型要比Llama 3.1好這么多。

的確，如今在業(yè)內(nèi)，這一現(xiàn)象越來越成為大家公認(rèn)的事實(shí)——

憑借強(qiáng)勁的性能，多樣化開源尺寸，以及全球最大的衍生模型群，Qwen已經(jīng)取代Llama成為開源AI社區(qū)最重要的標(biāo)桿基座模型。

站在巨人的肩膀上

自2023年8月以來，阿里云通義千問掀起了一場開源革命。

Qwen、Qwen1.5、Qwen2、Qwen2.5四代模型相繼開源，覆蓋了大語言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型等數(shù)十款。

在HuggingFace的Open LLM Leaderboard、Chatbot Arena大模型盲測榜單、司南OpenCompass等多個國內(nèi)外權(quán)威榜單中，Qwen性能全球領(lǐng)先，屢次斬獲「全球開源冠軍」。

甚至，有業(yè)內(nèi)專家指出——

當(dāng)前AI領(lǐng)域的諸多突破性進(jìn)展，無論是微調(diào)、蒸餾，還是其他低成本創(chuàng)新技術(shù)，并非從0開始訓(xùn)練，而是建立在Qwen等基礎(chǔ)模型的優(yōu)異性能之上。

Databricks研究科學(xué)家Omar Khattab稱，「更多關(guān)于Qwen的發(fā)現(xiàn)。我越來越確信這些論文似乎發(fā)現(xiàn)了一些關(guān)于Qwen模型的特性，而不一定涉及推理能力的突破」。

另一位來自滑鐵盧大學(xué)計(jì)算機(jī)系助理教授Wenhu Chen對此觀點(diǎn)表示極大地認(rèn)同。

他表示，這基本和s1的發(fā)現(xiàn)一樣，用大約1000個樣本就能得到類似的訓(xùn)練結(jié)果。

在別的模型上用同樣的數(shù)據(jù)訓(xùn)練，但卻完全沒成效，這是為何？

顯然，Qwen模型本身必然有一些神奇之處。

越來越多的人不約而同地發(fā)現(xiàn)，「我們幾乎什么都沒做，Qwen 2.5卻幾乎什么都能做了。」

這就說明，它的基礎(chǔ)模型一定性能超強(qiáng)，在基準(zhǔn)測試中非常領(lǐng)先。

因?yàn)椋@已經(jīng)完全不能用訓(xùn)練數(shù)據(jù)質(zhì)量來說明了。

李飛飛團(tuán)隊(duì)s1模型用實(shí)踐證明，在特定條件下，低成本（不到50美金）訓(xùn)練確實(shí)能夠產(chǎn)生令人驚喜的結(jié)果。

這在很大程度上，要?dú)w功于它所依賴的基座模型——通義千問Qwen。

如果沒有這樣強(qiáng)大的模型作為支撐，想要去實(shí)現(xiàn)同樣的效果，恐怕并非易事。

包括DeepSeek開源蒸餾后四款Qwen模型，也是如此。

這也讓Qwen成為推動前沿技術(shù)發(fā)展的又一重要案例。

全尺寸、全模態(tài)、多場景

可以說，阿里云Qwen模型是業(yè)界率先實(shí)現(xiàn)「全尺寸、全模態(tài)、多場景」的開源。

無論是1.5B、72B還是110B，Qwen開源的模型尺寸和版本的覆蓋面都最廣，讓開發(fā)者和企業(yè)有了更多選擇的余地。

從2024年開始，Qwen就已經(jīng)在開發(fā)者中擁有越來越高的影響力。

比如，在全球最知名的開源社區(qū)HuggingFace數(shù)據(jù)統(tǒng)計(jì)中，2024年，僅Qwen2.5-1.5B-Instruct這款模型，就占到了全球模型下載量的26.6%，遠(yuǎn)高于第二名Llama-3.1-8B-Instruct-GGUF的6.44%。

而僅僅是視覺理解Qwen-VL及Qwen2-VL兩款模型，全球的下載量就突破了3200萬次。

就在一周前，Qwen2.5-VL全新升級，又引發(fā)了新一輪的開源社區(qū)狂熱。

如今，細(xì)數(shù)海內(nèi)外開源社區(qū)，Qwen的衍生模型數(shù)量已突破9萬，直接超越了Llama系列衍生模型。

DeepSeek和李飛飛的選擇，更是證明了Qwen系列的強(qiáng)大潛力。

在未來，它必將繼續(xù)創(chuàng)造新的奇跡。

責(zé)任編輯：張燕妮來源：新智元

模型 AI 開源

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

主站蜘蛛池模板： 99精品视频在线 | 久久精品国产一区二区三区不卡 | 免费久草 | 婷婷丁香综合网 | 91精品国产综合久久福利软件 | 久久国产成人精品国产成人亚洲 | 精品一区二区三区在线视频 | 久久精品亚洲欧美日韩久久 | 影视先锋av资源噜噜 | 中文字幕在线观看 | 天天看天天摸天天操 | 在线国产一区 | 国产成人av一区二区三区 | 亚洲人久久 | a视频在线观看 | 欧美日韩在线观看视频 | 亚洲成人一级片 | 成人片免费看 | 国产精品高潮呻吟久久 | 精品欧美一区免费观看α√ | 久久99视频精品 | 成人做爰www免费看午夜精品久久久久久久久久久久 | 欧美精品91| 99成人| 久久久久久久网 | 亚洲精品久久久 | 天天操精品视频 | 精品无码久久久久国产 | 欧美aⅴ片 | 久久久久中文字幕 | 九九综合九九 | 国产精品久久久亚洲 | 99精品网站 | 日韩在线小视频 | 九九av | 亚洲欧美日韩在线 | 一区二区三区免费看 | 一片毛片 | 在线免费激情视频 | 久久久日韩精品一区二区三区 | 亚洲第一av |

<cite id="a4cck"><tbody id="a4cck"></tbody></cite>

<strike id="a4cck"><dd id="a4cck"></dd></strike>

<s id="a4cck"></s>

<kbd id="a4cck"><strong id="a4cck"></strong></kbd><s id="a4cck"></s>

<kbd id="a4cck"><code id="a4cck"></code></kbd>

<bdo id="a4cck"><dd id="a4cck"></dd></bdo>