大語言模型強(qiáng)化的多智能體如何使教育等關(guān)鍵領(lǐng)域受益?
近日,研究人員發(fā)布了??MathVC??,一個“虛擬課堂”,其中包含多個??大語言模型(LLM)模擬的學(xué)生角色??,與人類學(xué)生討論并共同解決數(shù)學(xué)問題,旨在為他們提供另一個練習(xí)數(shù)學(xué)建模技能的場所。該系統(tǒng)目前僅針對中學(xué)教育。
網(wǎng)站: https://murongyue.github.io/MathVC.github.io/
論文: https://arxiv.org/pdf/2404.06711.pdf
代碼和演示(尚未發(fā)布):https://github.com/MurongYue/MathVC
開發(fā)MathVC的首要問題在于,大語言模型如何模擬像現(xiàn)實(shí)中的中學(xué)生一樣行為的角色?在技術(shù)上,該工作討論和探討了兩個對齊問題,即特征對齊和會話程序?qū)R,以確保模擬的真實(shí)性:
- 特征對齊(每個角色):如何將LLM的角色模擬與真實(shí)人類學(xué)生的真實(shí)行為對齊?
- 會話程序?qū)R(角色間):如何將模擬中的整體會話程序與真實(shí)人類學(xué)生之間的真實(shí)數(shù)學(xué)問題討論對齊?
作為跨學(xué)科主題的一個重大挑戰(zhàn),該項(xiàng)工作沒有可以用來對LLM進(jìn)行微調(diào)的真實(shí)學(xué)生數(shù)據(jù)。
因此,研究人員著重于為提示LLM提供更好的“基礎(chǔ)”。具體來說,研究人員設(shè)計(jì)了符號化的角色模式來模擬討論中學(xué)生角色的動態(tài)思維過程,以及定義了會話階段和對話行為的元規(guī)劃器來調(diào)節(jié)整體多智能體對話。
這里展示了一個示例模擬,其中三個由LLM驅(qū)動的學(xué)生角色正在協(xié)作解決來自GSM8k數(shù)據(jù)集的數(shù)學(xué)問題。可以發(fā)現(xiàn),MathVC可以模擬學(xué)生的更細(xì)粒度特征,例如他們可能一開始犯錯,然后通過與虛擬同學(xué)的積極討論識別和解決錯誤。這是無法通過傳統(tǒng)的模擬實(shí)現(xiàn)的,傳統(tǒng)模擬通常表面化(例如,學(xué)生角色口頭聲稱數(shù)學(xué)不好,但實(shí)際上進(jìn)行了完美的計(jì)算)。
本文轉(zhuǎn)載自公眾號AIGC最前線
