大語言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益？

發(fā)布于 2024-4-26 11:19

瀏覽

0收藏

近日，研究人員發(fā)布了??MathVC??，一個“虛擬課堂”，其中包含多個??大語言模型（LLM）模擬的學(xué)生角色??，與人類學(xué)生討論并共同解決數(shù)學(xué)問題，旨在為他們提供另一個練習(xí)數(shù)學(xué)建模技能的場所。該系統(tǒng)目前僅針對中學(xué)教育。

網(wǎng)站: https://murongyue.github.io/MathVC.github.io/

論文: https://arxiv.org/pdf/2404.06711.pdf

代碼和演示（尚未發(fā)布）：https://github.com/MurongYue/MathVC

大語言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益？ -AI.x社區(qū)

開發(fā)MathVC的首要問題在于，大語言模型如何模擬像現(xiàn)實(shí)中的中學(xué)生一樣行為的角色？在技術(shù)上，該工作討論和探討了兩個對齊問題，即特征對齊和會話程序?qū)R，以確保模擬的真實(shí)性：

特征對齊（每個角色）：如何將LLM的角色模擬與真實(shí)人類學(xué)生的真實(shí)行為對齊？
會話程序?qū)R（角色間）：如何將模擬中的整體會話程序與真實(shí)人類學(xué)生之間的真實(shí)數(shù)學(xué)問題討論對齊？

大語言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益？ -AI.x社區(qū)

作為跨學(xué)科主題的一個重大挑戰(zhàn)，該項(xiàng)工作沒有可以用來對LLM進(jìn)行微調(diào)的真實(shí)學(xué)生數(shù)據(jù)。

因此，研究人員著重于為提示LLM提供更好的“基礎(chǔ)”。具體來說，研究人員設(shè)計(jì)了符號化的角色模式來模擬討論中學(xué)生角色的動態(tài)思維過程，以及定義了會話階段和對話行為的元規(guī)劃器來調(diào)節(jié)整體多智能體對話。

這里展示了一個示例模擬，其中三個由LLM驅(qū)動的學(xué)生角色正在協(xié)作解決來自GSM8k數(shù)據(jù)集的數(shù)學(xué)問題。可以發(fā)現(xiàn)，MathVC可以模擬學(xué)生的更細(xì)粒度特征，例如他們可能一開始犯錯，然后通過與虛擬同學(xué)的積極討論識別和解決錯誤。這是無法通過傳統(tǒng)的模擬實(shí)現(xiàn)的，傳統(tǒng)模擬通常表面化（例如，學(xué)生角色口頭聲稱數(shù)學(xué)不好，但實(shí)際上進(jìn)行了完美的計(jì)算）。

大語言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益？ -AI.x社區(qū)