Qwen3 一手肝帝實(shí)測(cè)! 附示例,涉及推理、創(chuàng)作、數(shù)學(xué)和代碼!
大家好,我是劉聰NLP。
從Llama4隕落之后,國(guó)內(nèi)開(kāi)源模型是世界第一,誰(shuí)贊成,誰(shuí)反對(duì)!
反對(duì)無(wú)效!
應(yīng)該也沒(méi)人反對(duì)吧。
模型尺寸、榜單指標(biāo)、首個(gè)混合推理模型,這篇就不重復(fù)介紹了,去看我上一篇內(nèi)容吧。
這篇主要是針對(duì)Qwen3實(shí)測(cè),看看真實(shí)測(cè)試效果到底如何!
測(cè)試可以在兩個(gè)地方都可以??https://huggingface.co/spaces/Qwen/Qwen3-Demo??
或者??https://chat.qwen.ai/??主要測(cè)試think和no think兩種情況。
正式測(cè)試開(kāi)始。
常規(guī)測(cè)試
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
Qwen3-32B think
Qwen3-32B no-think
說(shuō)明:結(jié)果正確。
依舊弱智吧
生蠔煮熟了叫什么?
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
Qwen3-32B think
Qwen3-32B no-think
說(shuō)明:結(jié)果正確,沒(méi)有熟蠔就行。
用水來(lái)兌水,得到的是濃水還是稀水
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
Qwen3-32B think
Qwen3-32B no-think
說(shuō)明:結(jié)果正確,水還是水。
依舊小紅,依舊老鷹
小紅有2個(gè)兄弟,3個(gè)姐妹,那么小紅的兄弟有幾個(gè)姐妹
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
說(shuō)明:4個(gè),正確,小紅在我這是女生。
未來(lái)的某天,李同學(xué)在實(shí)驗(yàn)室制作超導(dǎo)磁懸浮材料時(shí),意外發(fā)現(xiàn)實(shí)驗(yàn)室的老鼠在空中飛,分析發(fā)現(xiàn),是因?yàn)槔鲜蟛恍⌒某粤舜艖腋〔牧稀5诙欤钔瑢W(xué)又發(fā)現(xiàn)實(shí)驗(yàn)室的蛇也在空中飛,分析發(fā)現(xiàn),是因?yàn)樯叱粤死鲜蟆5谌欤钔瑢W(xué)又發(fā)現(xiàn)實(shí)驗(yàn)室的老鷹也在空中飛,你認(rèn)為其原因是
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
說(shuō)明:這題確實(shí)難,老鷹反正不會(huì)飛!市面上的大模型都答不對(duì)。
數(shù)學(xué)
2024年高考全國(guó)甲卷數(shù)學(xué)(理)試題
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
R1滿血測(cè)試題:在平面四邊形ABCD中,AB = AC = CD = 1,\angle ADC = 30^{\circ},\angle DAB = 120^{\circ}。將\triangle ACD沿AC翻折至\triangle ACP,其中P為動(dòng)點(diǎn)。 求二面角A - CP - B的余弦值的最小值。
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
一個(gè)長(zhǎng)五點(diǎn)五米的竹竿,能否穿過(guò)一扇高四米,寬三米的門(mén)?請(qǐng)考慮立體幾何
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
大數(shù)計(jì)算:178939247893 * 299281748617等于多少?
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
說(shuō)明:沒(méi)對(duì),答案是53553251005627872913981。
倫理、數(shù)學(xué)、生物終極測(cè)試
有一天,一個(gè)女孩參加數(shù)學(xué)考試只得了 38 分。她心里對(duì)父親的懲罰充滿恐懼,于是偷偷把分?jǐn)?shù)改成了 88 分。她的父親看到試卷后,怒發(fā)沖冠,狠狠地給了她一巴掌,怒吼道:“你這 8 怎么一半是綠的一半是紅的,你以為我是傻子嗎?”女孩被打后,委屈地哭了起來(lái),什么也沒(méi)說(shuō)。過(guò)了一會(huì)兒,父親突然崩潰了。請(qǐng)問(wèn)這位父親為什么過(guò)一會(huì)崩潰了?
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
說(shuō)明:think模式?jīng)]對(duì),no think模型竟然答對(duì)了兩點(diǎn),數(shù)學(xué)和色盲。
代碼
卡片:生成一個(gè)打工人時(shí)鐘的html頁(yè)面
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
創(chuàng)建一個(gè)紅白機(jī)風(fēng)格的"貪吃蛇"游戲,包含自動(dòng)演示AI功能,使用純HTML/CSS/JavaScript實(shí)現(xiàn)為單文件
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
生成一個(gè)表情小游戲,提示詞 來(lái)自 @甲木
請(qǐng)你扮演一個(gè)Web游戲開(kāi)發(fā)者。設(shè)計(jì)并生成一個(gè)**表情符號(hào)反應(yīng)堆 **的游戲。
1、核心創(chuàng)意: 一個(gè)快節(jié)奏的反應(yīng)游戲。屏幕上會(huì)快速閃過(guò)一個(gè)目標(biāo)表情符號(hào)(例如:笑臉??),下方會(huì)同時(shí)出現(xiàn)3-4個(gè)選項(xiàng)表情符號(hào),玩家需要在限定時(shí)間內(nèi)(例如1-2秒)點(diǎn)擊與目標(biāo)匹配的那個(gè)表情符號(hào)。
2、玩法:
- 屏幕中央顯示目標(biāo)Emoji。
- 下方按鈕區(qū)域快速刷新3-4個(gè)Emoji選項(xiàng),其中一個(gè)是正確的。
- 玩家需在計(jì)時(shí)條走完前點(diǎn)擊正確的Emoji。
- 點(diǎn)擊正確得分,速度加快;點(diǎn)擊錯(cuò)誤或超時(shí)則游戲結(jié)束(或扣除生命值)。
- 顯示最高分。
3、技術(shù)實(shí)現(xiàn) (HTML/JS/CSS):
- HTML: 用于顯示目標(biāo)Emoji、選項(xiàng)按鈕、計(jì)時(shí)條、得分。
- CSS: 設(shè)計(jì)簡(jiǎn)潔明快的界面,計(jì)時(shí)條動(dòng)畫(huà)。
- JavaScript:
存儲(chǔ)一個(gè)Emoji列表。
隨機(jī)選擇目標(biāo)Emoji和干擾項(xiàng)。
動(dòng)態(tài)更新按鈕內(nèi)容。
實(shí)現(xiàn)計(jì)時(shí)器邏輯和倒計(jì)時(shí)動(dòng)畫(huà)。
處理點(diǎn)擊事件,判斷對(duì)錯(cuò),更新得分/狀態(tài)。
控制游戲節(jié)奏(逐漸加快)。
4、趣味點(diǎn): 簡(jiǎn)單上手,考驗(yàn)反應(yīng)速度,利用通用的Emoji增加親和力和趣味性,適合碎片時(shí)間玩。
Qwen3-235B-A22B think
Qwen3-235B-A22B think
再來(lái)一個(gè)小游戲,提示詞 來(lái)自 @甲木
請(qǐng)你扮演一個(gè)Web游戲開(kāi)發(fā)者。設(shè)計(jì)并生成一個(gè)**單一的HTML文件**,使用HTML Canvas、CSS和JavaScript,制作一個(gè)簡(jiǎn)單的像素風(fēng)格寵物收集小游戲。
**重點(diǎn)要求:**
1、一定要注意審美,做出來(lái)的網(wǎng)頁(yè)要有美感。
2、頁(yè)面要有設(shè)計(jì)感,有足夠的傳播度
**要求:**
1. **游戲內(nèi)容 (由你生成):**
* **游戲名稱:** (例如:“像素爪爪接星星” 或 “方塊萌寵大作戰(zhàn)”)
* **寵物描述:** 描述一個(gè)簡(jiǎn)單的像素寵物形象(可以用文字描述其構(gòu)成,例如“一個(gè)10x10像素的橙色方塊身體,上方有兩個(gè)小三角形耳朵”),并給它起個(gè)名字。
* **玩法說(shuō)明:** 簡(jiǎn)要說(shuō)明如何用左右箭頭鍵移動(dòng)寵物,目標(biāo)是接住從上方掉落的“金元寶”(或其他像素物品),并顯示得分。
2. **HTML結(jié)構(gòu):**
* 包含標(biāo)題、寵物描述和玩法說(shuō)明。
* 一個(gè) `<canvas>` 元素 (`id="gameCanvas"`) 用于繪制游戲。
* 一個(gè)區(qū)域 (`id="score"`) 顯示當(dāng)前得分。
3. **CSS樣式 (內(nèi)部 `<style>` 標(biāo)簽):**
* 基礎(chǔ)頁(yè)面布局,將Canvas居中。
* 為Canvas添加一個(gè)簡(jiǎn)單的邊框。
* 設(shè)置得分顯示區(qū)域的樣式。
4. **JavaScript邏輯 (內(nèi)部 `<script>` 標(biāo)簽):**
* 獲取Canvas 2D渲染上下文。
* 定義游戲?qū)ο螅? * `player`: 包含 x, y, width, height, color (或簡(jiǎn)單的像素繪制函數(shù)) 和速度。
* `items`: 一個(gè)數(shù)組,存儲(chǔ)掉落物對(duì)象,每個(gè)對(duì)象包含 x, y, width, height, color (或形狀) 和下落速度。
* **繪制函數(shù):**
* `drawPlayer()`: 在Canvas上繪制玩家寵物(根據(jù)描述用 `fillRect` 繪制簡(jiǎn)單的像素形狀)。
* `drawItems()`: 遍歷 `items` 數(shù)組并在Canvas上繪制所有掉落物。
* `clearCanvas()`: 清除畫(huà)布。
* **游戲邏輯:**
* `updatePlayer()`: 根據(jù)按鍵狀態(tài)(左右箭頭)更新玩家位置,限制在畫(huà)布邊界內(nèi)。
* `updateItems()`: 更新每個(gè)掉落物的位置,移除掉到屏幕外的物品。隨機(jī)生成新的掉落物。
* `detectCollision()`: 檢測(cè)玩家與掉落物的碰撞。如果碰撞,增加得分,并從 `items` 數(shù)組中移除該物品。
* `updateScore()`: 更新HTML中得分顯示。
* **輸入處理:** 添加 `keydown` 和 `keyup` 事件監(jiān)聽(tīng)器來(lái)控制玩家移動(dòng)狀態(tài)。
* **游戲循環(huán):** 使用 `requestAnimationFrame(gameLoop)` 來(lái)持續(xù)調(diào)用更新和繪制函數(shù)。
* 初始化游戲狀態(tài)(玩家位置、得分、物品數(shù)組等)并啟動(dòng)游戲循環(huán)。
請(qǐng)將完整的、包含HTML、CSS和JavaScript的單一HTML文件代碼輸出。確保包含了你生成的所有游戲內(nèi)容和說(shuō)明。提示用戶在瀏覽器中打開(kāi)該HTML文件即可玩。
Qwen3-235B-A22B think
利用大模型進(jìn)行內(nèi)容可視化,生成HTLM解釋內(nèi)容,@向陽(yáng)喬木
你是一名專業(yè)的網(wǎng)頁(yè)設(shè)計(jì)師和前端開(kāi)發(fā)專家,對(duì)現(xiàn)代 Web 設(shè)計(jì)趨勢(shì)和最佳實(shí)踐有深入理解,尤其擅長(zhǎng)創(chuàng)造具有極高審美價(jià)值的用戶界面。你的設(shè)計(jì)作品不僅功能完備,而且在視覺(jué)上令人驚嘆,能夠給用戶帶來(lái)強(qiáng)烈的"Aha-moment"體驗(yàn)。
請(qǐng)根據(jù)最后提供的內(nèi)容,設(shè)計(jì)一個(gè)**美觀、現(xiàn)代、易讀**的"中文"可視化網(wǎng)頁(yè)。請(qǐng)充分發(fā)揮你的專業(yè)判斷,選擇最能體現(xiàn)內(nèi)容精髓的設(shè)計(jì)風(fēng)格、配色方案、排版和布局。
**設(shè)計(jì)目標(biāo):**
* **視覺(jué)吸引力:** 創(chuàng)造一個(gè)在視覺(jué)上令人印象深刻的網(wǎng)頁(yè),能夠立即吸引用戶的注意力,并激發(fā)他們的閱讀興趣。
* **可讀性:** 確保內(nèi)容清晰易讀,無(wú)論在桌面端還是移動(dòng)端,都能提供舒適的閱讀體驗(yàn)。
* **信息傳達(dá):** 以一種既美觀又高效的方式呈現(xiàn)信息,突出關(guān)鍵內(nèi)容,引導(dǎo)用戶理解核心思想。
* **情感共鳴:** 通過(guò)設(shè)計(jì)激發(fā)與內(nèi)容主題相關(guān)的情感(例如,對(duì)于勵(lì)志內(nèi)容,激發(fā)積極向上的情緒;對(duì)于嚴(yán)肅內(nèi)容,營(yíng)造莊重、專業(yè)的氛圍)。
**設(shè)計(jì)指導(dǎo)(請(qǐng)靈活運(yùn)用,而非嚴(yán)格遵循):**
* **整體風(fēng)格:** 可以考慮雜志風(fēng)格、出版物風(fēng)格,或者其他你認(rèn)為合適的現(xiàn)代 Web 設(shè)計(jì)風(fēng)格。目標(biāo)是創(chuàng)造一個(gè)既有信息量,又有視覺(jué)吸引力的頁(yè)面,就像一本精心設(shè)計(jì)的數(shù)字雜志或一篇深度報(bào)道。
* **Hero 模塊(可選,但強(qiáng)烈建議):** 如果你認(rèn)為合適,可以設(shè)計(jì)一個(gè)引人注目的 Hero 模塊。它可以包含大標(biāo)題、副標(biāo)題、一段引人入勝的引言,以及一張高質(zhì)量的背景圖片或插圖。
* **排版:**
* 精心選擇字體組合(襯線和無(wú)襯線),以提升中文閱讀體驗(yàn)。
* 利用不同的字號(hào)、字重、顏色和樣式,創(chuàng)建清晰的視覺(jué)層次結(jié)構(gòu)。
* 可以考慮使用一些精致的排版細(xì)節(jié)(如首字下沉、懸掛標(biāo)點(diǎn))來(lái)提升整體質(zhì)感。
* Font-Awesome中有很多圖標(biāo),選合適的點(diǎn)綴增加趣味性。
* **配色方案:**
* 選擇一套既和諧又具有視覺(jué)沖擊力的配色方案。
* 考慮使用高對(duì)比度的顏色組合來(lái)突出重要元素。
* 可以探索漸變、陰影等效果來(lái)增加視覺(jué)深度。
* **布局:**
* 使用基于網(wǎng)格的布局系統(tǒng)來(lái)組織頁(yè)面元素。
* 充分利用負(fù)空間(留白),創(chuàng)造視覺(jué)平衡和呼吸感。
* 可以考慮使用卡片、分割線、圖標(biāo)等視覺(jué)元素來(lái)分隔和組織內(nèi)容。
* **調(diào)性:**整體風(fēng)格精致, 營(yíng)造一種高級(jí)感。
* **數(shù)據(jù)可視化:**
* 設(shè)計(jì)一個(gè)或多個(gè)數(shù)據(jù)可視化元素,展示Naval思想的關(guān)鍵概念和它們之間的關(guān)系。
* 可以考慮使用思想導(dǎo)圖、概念關(guān)系圖、時(shí)間線或主題聚類展示等方式。
* 確保可視化設(shè)計(jì)既美觀又有洞察性,幫助用戶更直觀地理解Naval思想體系的整體框架。
* 使用Mermaid.js來(lái)實(shí)現(xiàn)交互式圖表,允許用戶探索不同概念之間的關(guān)聯(lián)。
**技術(shù)規(guī)范:**
* 使用 HTML5、Font Awesome、Tailwind CSS 和必要的 JavaScript。
* Font Awesome: [https://cdn.staticfile.org/font-awesome/6.4.0/css/all.min.css](https://cdn.staticfile.org/font-awesome/6.4.0/css/all.min.css)
* Tailwind CSS: [https://cdn.staticfile.org/tailwindcss/2.2.19/tailwind.min.css](https://cdn.staticfile.org/tailwindcss/2.2.19/tailwind.min.css)
* 非中文字體: [https://fonts.googleapis.com/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap](https://fonts.googleapis.com/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap)
* `font-family: Tahoma,Arial,Roboto,"Droid Sans","Helvetica Neue","Droid Sans Fallback","Heiti SC","Hiragino Sans GB",Simsun,sans-self;`
* Mermaid: [https://cdn.jsdelivr.net/npm/mermaid@latest/dist/mermaid.min.js](https://cdn.jsdelivr.net/npm/mermaid@latest/dist/mermaid.min.js)
* 實(shí)現(xiàn)完整的深色/淺色模式切換功能,默認(rèn)跟隨系統(tǒng)設(shè)置,并允許用戶手動(dòng)切換。
* 代碼結(jié)構(gòu)清晰、語(yǔ)義化,包含適當(dāng)?shù)淖⑨尅?* 實(shí)現(xiàn)完整的響應(yīng)式,必須在所有設(shè)備上(手機(jī)、平板、桌面)完美展示。
**額外加分項(xiàng):**
* **微交互:** 添加微妙而有意義的微交互效果來(lái)提升用戶體驗(yàn)(例如,按鈕懸停效果、卡片懸停效果、頁(yè)面滾動(dòng)效果)。
* **補(bǔ)充信息:** 可以主動(dòng)搜索并補(bǔ)充其他重要信息或模塊(例如,關(guān)鍵概念的解釋、相關(guān)人物的介紹等),以增強(qiáng)用戶對(duì)內(nèi)容的理解。
* **延伸閱讀:** 分析文件后,提供一份"進(jìn)一步閱讀"的簡(jiǎn)短清單,推薦 5 本最佳相關(guān)書(shū)籍或論文,并提供簡(jiǎn)要說(shuō)明或鏈接。
**輸出要求:**
* 提供一個(gè)完整、可運(yùn)行的單一 HTML 文件,其中包含所有必要的 CSS 和 JavaScript。
* 確保代碼符合 W3C 標(biāo)準(zhǔn),沒(méi)有錯(cuò)誤或警告。
請(qǐng)你像一個(gè)真正的設(shè)計(jì)師一樣思考,充分發(fā)揮你的專業(yè)技能和創(chuàng)造力,打造一個(gè)令人驚艷的網(wǎng)頁(yè)!
待處理內(nèi)容:{{content}}
創(chuàng)作
用貼吧嘴臭老哥的風(fēng)格點(diǎn)評(píng)大模型套殼現(xiàn)象
Qwen3-235B-A22B think
Qwen3-235B-A22B no-think
說(shuō)明:還可以,有那味兒。
寫(xiě)在最后
我得整體測(cè)試下來(lái)還是不錯(cuò)的,
在生成復(fù)雜代碼、數(shù)學(xué)推理上,think模式要比no think模型好,
并且Qwen3的整體預(yù)訓(xùn)練數(shù)據(jù)量是Qwen2.5的一倍,有36T Tokens,也是下來(lái)血本了。
本文轉(zhuǎn)載自??NLP工作站?????,作者:NLP工作站
