AI 輔助學(xué)習(xí)如何選大模型?兼初步測試 Llama 4
在這個(gè)教材知識爆炸的時(shí)代,如何高效地幫助孩子掌握知識、培養(yǎng)學(xué)習(xí)興趣,成為了許多家長的共同課題。而以大語言模型為代表的人工智能技術(shù)的出現(xiàn),為解決這一難題提供了一種全新的可能。
利用 AI,不僅能幫助我們家長快速掌握孩子正在學(xué)習(xí)的內(nèi)容,從而便于與他們進(jìn)行更有效的溝通,增進(jìn)「親子關(guān)系」;同時(shí),AI 還能拓展我們的思路,為孩子提供更多啟發(fā)和靈感,讓他們的學(xué)習(xí)過程更加豐富多彩。
大模型海選
首先,我們需要選擇一個(gè)你比較滿意的 AI 大模型來提供輔助。考慮到很多題目中包含圖片,這種情況下,我們應(yīng)該優(yōu)先選擇具備強(qiáng)大多模態(tài)能力(即能處理文本和圖像)的模型,以確保更全面、準(zhǔn)確的支持。
你可以準(zhǔn)備一些題目,初步測試候選大模型的能力。在這里,我們通過一道初中科學(xué)題來進(jìn)行實(shí)際操作示范,供大家參考。
我從網(wǎng)上找到了一道初中科學(xué)題,這道題的卷面上還有一些筆跡和劃痕。我想借此測試 AI 在實(shí)際應(yīng)用中的表現(xiàn),特別是這些卷面上的劃痕是否會干擾它的識別能力。
此題的正確答案為 D。
卷面留有錯(cuò)誤答案,順便看看會不會干擾到大模型。
我們先看國內(nèi)大模型,從中選出一個(gè)比較能打的,再對比下國外最新的大模型。
?kimi + 長思考
成功被干擾到了,而且分析得也不夠詳細(xì),盡管長思考了很久。
?夸克
?通義 Qwen2.5-max
?智譜清言
?MiniMax
?DeepSeek-R1
?豆包
結(jié)論
“
這么國產(chǎn)多大模型中,通過此題考驗(yàn)的只有豆包。
”
下面我們就以豆包為例,繼續(xù)就這道題目進(jìn)行深入解讀。
1、分析一下在實(shí)際題目中,一般是如何考查學(xué)生對這些知識點(diǎn)的理解和應(yīng)用。
2、這道題錯(cuò)選 C 的話,你覺得反映出學(xué)生在知識點(diǎn)的理解上哪方面出了問題呢?
3、請用 Mermaid 代碼展示這些知識點(diǎn)及其關(guān)系。
Mermaid 代碼如下,
graph TD
A[光敏電阻特性] --> B[串聯(lián)電路規(guī)律]
A --> C[電磁繼電器原理]
B --> D[實(shí)際控制邏輯]
C --> D
A -->|光照增強(qiáng)→阻值減小| E[電阻變化]
B -->|I=U/R總| F[電流變化]
B -->|U與R成正比| G[電壓分配]
C -->|電流→磁性→觸點(diǎn)動(dòng)作| H[繼電器控制]
D -->|路燈亮滅邏輯| I[應(yīng)用場景]
subgraph 核心知識點(diǎn)
A[光敏電阻特性]
B[串聯(lián)電路規(guī)律]
C[電磁繼電器原理]
end
subgraph 關(guān)鍵關(guān)系
E --> F
F --> G
G --> H
H --> I
end
4、根據(jù)這些知識點(diǎn),重新出幾道不同難度的題目。
5、幫忙找一找講解這些知識點(diǎn)的相關(guān)視頻。
這里體現(xiàn)出字節(jié)跳動(dòng)的優(yōu)勢,會關(guān)聯(lián)抖音視頻。
點(diǎn)開其中一個(gè)視頻瞅一瞅,
怎么樣,感覺豆包能不能助你一臂之力呢?
下面我們對比一下國外大模型。
?ChatGPT
此題 ChatGPT 沒搞定,不過這里只測試了默認(rèn)的 GPT-4o。
?Claude 3.7
這個(gè)我試了好幾個(gè)地方的版本,包括 ??https://lmarena.ai?
? 上的 Thinking 版本,發(fā)現(xiàn)答案都沒弄對,但下面這個(gè)版本出來的知識導(dǎo)圖還可以。
?Llama 4
Meta ai 剛剛發(fā)布的開源大模型,迫不及待地看看能力如何。
發(fā)現(xiàn)在這個(gè)問題上表現(xiàn)一般,等待推理型版本,以及后期大家的改進(jìn)。
?Gemini 2.5 Pro
就此題而言,最新版的 Gemini 給出的解讀還是非常到位,知識點(diǎn)也很詳細(xì)。
知識脈絡(luò)圖畫出來是這樣滴,
根據(jù)這些知識點(diǎn),重新出幾道不同難度的題目。
視頻推薦,
測試結(jié)果顯示,對于海外用戶來說,Gemini 是一個(gè)不錯(cuò)的選擇;而國內(nèi)用戶則可以使用豆包,也很香,其短視頻內(nèi)容更加豐富。期待其他大模型的繼續(xù)努力。
本文轉(zhuǎn)載自??機(jī)器學(xué)習(xí)與數(shù)學(xué)??,作者:大師兄
