斯坦福、華盛頓大學與Google DeepMind合作:AI智能體預測人類行為準確率高達85%
11月25日消息,據外媒報道,斯坦福大學、華盛頓大學與Google?DeepMind的研究人員攜手開發了一種能夠逼真模擬人類行為的AI智能體。
研究團隊將詳細的訪談記錄與先進的GPT-4o模型相結合,構建了這一模擬系統。當用戶向智能體提出問題時,系統會加載訪談數據,并促使AI模仿受訪者的回答方式。為獲取這些寶貴的訪談記錄,研究團隊對每位受訪者進行了長達兩小時的深入訪談,并利用OpenAI的Whisper技術將對話內容精準轉錄成文本。
為了全面評估AI對人類行為的預測能力,研究團隊設計了包括《通用社會調查》、大五人格評估以及多個行為經濟學實驗在內的測試。結果顯示,基于訪談數據的AI在預測社會調查問題時,準確率高達85%,遠超僅依賴人口統計信息的傳統方法。
在五項社會科學實驗的對比測試中,AI的表現與人類高度一致,相關系數高達0.98,充分展示了其強大的模擬能力。訪談驅動的AI相較于傳統的人口統計法展現出了顯著優勢,不僅預測更為準確,還能有效減少人口統計類別之間的偏差。
目前,研究團隊已將包含這1000個AI模型的數據集公開在GitHub上,并建立了嚴格的兩層訪問機制,以確保數據的安全與合規使用。綜合性數據對研究人員完全開放,而涉及個別參與者的詳細數據則需經過特殊審批方可訪問。