成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸! 原創

發布于 2025-2-25 12:45
瀏覽
0收藏

編輯 | 伊風

出品 | 51CTO技術棧(微信號:blog51cto)

吳泳銘親自預告過的,阿里旗艦推理模型,新消息來了。

剛剛,它的預覽版正式發布和上線體驗——就是這個QwQ-Max-Preview!

一眼看去,我愿稱之為最萌的推理模型,看blog主頁的名稱,感覺思維鏈中的模型正在很努力的思考中……

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

Qwen Chat 中已經可以體驗預覽版模型:??https://chat.qwen.ai/??

點進模型的blog,發現這里有一個隱藏彩蛋,內容是由QwQ-Max-Preview自己寫的,我們可以看到AI做自我介紹時的思維鏈:

首先,該模型屬于 Qwen 系列,是基于 Qwen2.5-Max 構建的。這是一個 預覽版,所以他們可能希望強調它是在正式發布前的 搶先體驗。它的主要優勢包括 深度推理、數學、編程、通用領域任務,以及在 Agent 相關任務 中的出色表現。他們還提到了 未來的更新 以及 計劃以 Apache 2.0 許可證開源。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

blog地址:??https://qwenlm.github.io/blog/qwq-max-preview/??

預覽版已經來了,QwQ-Max正式版還會遠嗎?我們先來看一波預覽版的搶先體驗夠不夠精彩:

官方給的栗子1:編寫一個腳本,在一個球體內模擬 100 個彈跳的黃色小球,確保正確處理碰撞檢測。讓球體緩慢旋轉,并確保小球始終保持在球體內部。

效果已經很驚艷,如果要挑刺的話,那就是有幾個小球的運動速度略顯奇怪:

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區

官方給的栗子2:做個俄羅斯方塊 和 2048 結合的游戲。(PS:Grok 3發布時也測了一個類似的例子,是把俄羅斯方塊和寶石迷陣相結合的。)

你別說,看上去還挺好玩,就是感覺難度有一點點大:

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區

此外,QwQ-Max-Preview 將配備多種Agent,例如推理生圖、火車票查找、代碼解釋器等等。

看這幾個Agent的細分程度,盲猜QwQ-Max在Agent會有很大的動作,而且下圖中的Tools工具似乎可以在一次詢問中多選,讓人對正式版的使用效果期待拉滿了。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

官方也給了一個推理畫圖的例子,還順便畫了個淘寶二維碼。掃了一下果然就跳轉成功了:

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區

1.一手實測:QwQ-Max-Preview回答R1熱門問題,是否各有千秋?

到實測這個Part,小編覺得如果還是測一把“草莓”和“9.9>9.11”,就有點太無聊了。

畢竟DeepSeek R1之所以如此出圈,不是因為能答對這幾個案例,而是真的能幫助用戶解決生活中的問題,甚至解答人生中的困惑。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區上圖:雖說如此,但還是測了這個案例,QwQ-Max-Preview輕松通關

然后在小紅書看看,用戶都在使用DeepSeek R1問些什么吧。

我們就以有1w+筆記的“如何當父母才不累”,以及第二名“普通人如何利用信息差搞錢”這兩個問題來橫向比較下兩個推理模型吧。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

使用如何“如何當父母才不累”這個話題進行實測,QwQ-Max-Preview能夠分析用戶的具體情況、深層需求,并提供實用建議,進行了完整的思考。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

兩個模型在輸出的內容上大概方向一致,QwQ-Max-Preview更注重提供建議。此外,R1在思維鏈中特別指出要“保持口語化”,提供的答案更有“情緒”一些也相對詳細。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區上圖:兩個模型都提到了“接受不完美”

而在第二個問題上,QwQ-Max-Preview同樣能完成接地氣、具有邏輯的思考。同時千問還不忘和自家的產品“夢幻聯動”一把,提供了“拼多多進貨,批量采購后在淘寶加價賣出”“閑魚搜索‘倒閉庫存’”等建議。

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

在這個回答上,R1做的稍微好的一點是區分了“低門檻起步方式”“進階變現模式”等層次,看起來更有操作性。

當然,QwQ-Max-Preview畢竟只是預覽版,從實測體驗上,其回答問題更加流暢絲滑。不會像R1那樣需要等待才開始思考,也不會提心吊膽會彈出“服務器繁忙”。

對了,千問團隊今天宣布,QwQ-Max也是要做APP的(推特消息是面向海外用戶的,不知道國內是更新通義上,還是也單做APP ?)。期待正式版的QwQ-Max,能在輸出問題的格式和口語化方面繼續進步,繼續締造AI應用的傳奇!

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

2.旗艦推理模型的基座——Qwen2.5-Max

這里在幫朋友們回顧下QwQ-Max-Preview的基座,Qwen2.5-Max。

Qwen2.5-Max在除夕夜發布,是阿里家的超大規模MoE模型,采用超過20萬億tokens的預訓練數據。

該模型在多個基準測試中超越DeepSeek V3、GPT-4o等領先AI,支持指令模型和基座模型。

也就是說QwQ-Max的推理模型,其基座是強于DeepSeek R1的基座V3的。

另外,今天推出的預覽版并非阿里首個推理模型。

去年通義就有了QwQ系列,不過是一個32B小模型的預覽版。

??https://huggingface.co/Qwen/QwQ-32B-Preview??

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸!-AI.x社區圖片

3.寫在最后

這周的大模型更新已經到了神仙打架的級別了。

從預覽版來看,QwQ-Max正式版絕對值得一看,尤其是正式版后開放的Agent功能,期待能給智能體的市場帶來一些顛覆性的創新。

本文轉載自??51CTO技術棧??,作者:伊風


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 成人在线精品 | 国产精品一区二区三区久久 | 国产女人与拘做受视频 | 亚洲国产精品99久久久久久久久 | 午夜久久久久 | 看片91| 亚洲人成人一区二区在线观看 | 久草青青草 | 免费久久网| 国产精品久久久久久久久久软件 | 一区二区三区中文字幕 | 91国产精品 | 中文一区二区视频 | 日韩欧美一级片 | 喷潮网站 | 精品一二 | sese视频在线观看 | 久久精品久久综合 | 欧美久久免费观看 | 视频一区二区在线观看 | 91久久精品一区二区二区 | 在线亚洲免费 | 久久y| 亚洲精品久久区二区三区蜜桃臀 | 国产激情精品一区二区三区 | 91免费高清 | 国产日韩久久 | 国产一区二区三区免费 | 污视频免费在线观看 | 成人av免费在线观看 | 国产精品爱久久久久久久 | 亚洲一区二区中文字幕 | 国产精品久久久久久久7777 | 国产一区欧美 | 亚洲va欧美va天堂v国产综合 | 中文字幕免费视频 | 黄免费观看视频 | 精品久久久久久久人人人人传媒 | 午夜天堂精品久久久久 | 视频一区二区中文字幕 | www日本在线观看 |