成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

吳泳銘預告的旗艦推理模型更了!阿里重磅推出QwQ-Max預覽版,Agent或成正式版王炸;一手實測R1熱門問題,各有千秋!

原創 精選
人工智能
剛剛,它的預覽版正式發布和上線體驗——就是這個QwQ-Max-Preview!一眼看去,我愿稱之為最萌的推理模型,看blog主頁的名稱,感覺思維鏈中的模型正在很努力的思考中……

編輯 | 伊風

出品 | 51CTO技術棧(微信號:blog51cto)

吳泳銘親自預告過的,阿里旗艦推理模型,新消息來了。

剛剛,它的預覽版正式發布和上線體驗——就是這個QwQ-Max-Preview!

一眼看去,我愿稱之為最萌的推理模型,看blog主頁的名稱,感覺思維鏈中的模型正在很努力的思考中……

圖片圖片

Qwen Chat 中已經可以體驗預覽版模型:https://chat.qwen.ai/

點進模型的blog,發現這里有一個隱藏彩蛋,內容是由QwQ-Max-Preview自己寫的,我們可以看到AI做自我介紹時的思維鏈:

首先,該模型屬于 Qwen 系列,是基于 Qwen2.5-Max 構建的。這是一個 預覽版,所以他們可能希望強調它是在正式發布前的 搶先體驗。它的主要優勢包括 深度推理、數學、編程、通用領域任務,以及在 Agent 相關任務 中的出色表現。他們還提到了 未來的更新 以及 計劃以 Apache 2.0 許可證開源。

圖片圖片

blog地址:https://qwenlm.github.io/blog/qwq-max-preview/

預覽版已經來了,QwQ-Max正式版還會遠嗎?我們先來看一波預覽版的搶先體驗夠不夠精彩:

官方給的栗子1:編寫一個腳本,在一個球體內模擬 100 個彈跳的黃色小球,確保正確處理碰撞檢測。讓球體緩慢旋轉,并確保小球始終保持在球體內部。

效果已經很驚艷,如果要挑刺的話,那就是有幾個小球的運動速度略顯奇怪:

官方給的栗子2:做個俄羅斯方塊 和 2048 結合的游戲。(PS:Grok 3發布時也測了一個類似的例子,是把俄羅斯方塊和寶石迷陣相結合的。)

你別說,看上去還挺好玩,就是感覺難度有一點點大:

此外,QwQ-Max-Preview 將配備多種Agent,例如推理生圖、火車票查找、代碼解釋器等等。

看這幾個Agent的細分程度,盲猜QwQ-Max在Agent會有很大的動作,而且下圖中的Tools工具似乎可以在一次詢問中多選,讓人對正式版的使用效果期待拉滿了。

圖片圖片

官方也給了一個推理畫圖的例子,還順便畫了個淘寶二維碼。掃了一下果然就跳轉成功了:

1.一手實測:QwQ-Max-Preview回答R1熱門問題,是否各有千秋?

到實測這個Part,小編覺得如果還是測一把“草莓”和“9.9>9.11”,就有點太無聊了。

畢竟DeepSeek R1之所以如此出圈,不是因為能答對這幾個案例,而是真的能幫助用戶解決生活中的問題,甚至解答人生中的困惑。

上圖:雖說如此,但還是測了這個案例,QwQ-Max-Preview輕松通關上圖:雖說如此,但還是測了這個案例,QwQ-Max-Preview輕松通關

然后在小紅書看看,用戶都在使用DeepSeek R1問些什么吧。

我們就以有1w+筆記的“如何當父母才不累”,以及第二名“普通人如何利用信息差搞錢”這兩個問題來橫向比較下兩個推理模型吧。

圖片圖片

使用如何“如何當父母才不累”這個話題進行實測,QwQ-Max-Preview能夠分析用戶的具體情況、深層需求,并提供實用建議,進行了完整的思考。

圖片圖片

兩個模型在輸出的內容上大概方向一致,QwQ-Max-Preview更注重提供建議。此外,R1在思維鏈中特別指出要“保持口語化”,提供的答案更有“情緒”一些也相對詳細。

上圖:兩個模型都提到了“接受不完美”上圖:兩個模型都提到了“接受不完美”

而在第二個問題上,QwQ-Max-Preview同樣能完成接地氣、具有邏輯的思考。同時千問還不忘和自家的產品“夢幻聯動”一把,提供了“拼多多進貨,批量采購后在淘寶加價賣出”“閑魚搜索‘倒閉庫存’”等建議。

圖片圖片

在這個回答上,R1做的稍微好的一點是區分了“低門檻起步方式”“進階變現模式”等層次,看起來更有操作性。

當然,QwQ-Max-Preview畢竟只是預覽版,從實測體驗上,其回答問題更加流暢絲滑。不會像R1那樣需要等待才開始思考,也不會提心吊膽會彈出“服務器繁忙”。

對了,千問團隊今天宣布,QwQ-Max也是要做APP的(推特消息是面向海外用戶的,不知道國內是更新通義上,還是也單做APP ?)。期待正式版的QwQ-Max,能在輸出問題的格式和口語化方面繼續進步,繼續締造AI應用的傳奇!

圖片圖片

2.旗艦推理模型的基座——Qwen2.5-Max

這里在幫朋友們回顧下QwQ-Max-Preview的基座,Qwen2.5-Max。

Qwen2.5-Max在除夕夜發布,是阿里家的超大規模MoE模型,采用超過20萬億tokens的預訓練數據。

該模型在多個基準測試中超越DeepSeek V3、GPT-4o等領先AI,支持指令模型和基座模型。

也就是說QwQ-Max的推理模型,其基座是強于DeepSeek R1的基座V3的。

另外,今天推出的預覽版并非阿里首個推理模型。

去年通義就有了QwQ系列,不過是一個32B小模型的預覽版。

https://huggingface.co/Qwen/QwQ-32B-Preview

圖片圖片

3.寫在最后

這周的大模型更新已經到了神仙打架的級別了。

從預覽版來看,QwQ-Max正式版絕對值得一看,尤其是正式版后開放的Agent功能,期待能給智能體的市場帶來一些顛覆性的創新。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2016-11-09 15:18:04

大數據數據市場

2013-08-22 10:03:38

谷歌Facebook數據挖掘

2010-06-09 12:26:46

世界杯布線

2025-03-06 09:55:49

2013-12-26 09:53:46

全閃存陣列全閃存存儲

2011-11-10 09:48:49

2014-11-28 14:55:57

WiFi藍牙

2010-07-05 09:12:39

戴爾服務器新品

2010-08-03 09:48:42

PythonRuby

2012-07-18 09:44:56

2025-03-06 17:29:21

2015-06-25 18:58:36

Win10

2017-09-19 13:12:38

5G電信移動

2016-01-06 19:38:25

2019-05-22 15:55:41

NginxTomcat服務器

2025-03-06 10:14:39

2015-07-14 09:16:57

Windows 10ISO

2025-03-28 11:06:10

視覺推理模型阿里通義千問AI

2019-06-20 08:43:28

物聯網通訊技術IOT

2025-03-07 08:50:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 97国产一区二区 | 自拍亚洲 | 欧美一级大片 | 91久久精品一区 | 欧美一区二区三区小说 | 久久国产精品久久 | 国产精品欧美一区二区三区不卡 | 欧美一级艳情片免费观看 | 日韩在线中文 | 高清av在线| 久久综合久色欧美综合狠狠 | 国产在线激情视频 | 全免一级毛片 | 免费在线观看av网站 | 亚洲综合色丁香婷婷六月图片 | 岛国二区 | 国产精品18久久久久久白浆动漫 | www.色.com | 精品一区二区三区电影 | 黄色成人在线观看 | 99国产精品99久久久久久粉嫩 | 欧美一区二区三区在线观看视频 | 欧美黄色小视频 | 日本在线视频一区二区 | 欧美日韩亚洲一区 | 久久久久国产 | av中文字幕在线观看 | 日韩中出 | 欧美精品tv | 久久1区| 免费观看一级黄色录像 | 色999视频 | 午夜av影院| 亚洲精品在线看 | 欧美视频在线一区 | 国产乱码精品1区2区3区 | 国产欧美一区二区久久性色99 | 国产精品欧美一区二区三区不卡 | 日本一区二区不卡视频 | 日韩一区二区三区视频 | 久久亚洲综合 |