哈工大聯(lián)合快手提出CogGPT：大模型也需要認(rèn)知迭代

作者：機(jī)器之心 2024-01-29 11:56:23

從論文中可以看到，這個任務(wù)仿照心理學(xué)領(lǐng)域中的縱向研究，對大模型進(jìn)行持續(xù)性的「心理測試」。

在認(rèn)知科學(xué)領(lǐng)域，人類通過持續(xù)學(xué)習(xí)改變認(rèn)知的過程被稱為認(rèn)知迭代（Cognitive Dynamics）。形象地說，認(rèn)知迭代就像是我們大腦的「軟件更新」過程，手機(jī)應(yīng)用通過不斷的更新來修復(fù) bug 和增加新功能，我們的大腦也通過不斷學(xué)習(xí)新知識、經(jīng)驗(yàn)，來改善和優(yōu)化思考方式。

從我們判斷感冒吃什么藥效果好，到一代代數(shù)學(xué)家如何證明費(fèi)馬大定理，無論是個人的心智發(fā)展還是人類文明的進(jìn)步，認(rèn)知迭代都扮演了不可或缺的角色。

如今，像 GPT-4 等大型語言模型（Large Language Models，LLMs）為通用人工智能（Artificial General Intelligence，AGI）的發(fā)展帶來希望的同時(shí)，也暴露出一個顯著的問題 —— 認(rèn)知固化。比如，對于經(jīng)典問題「宇宙的中心在哪里」，不同時(shí)代的人會基于當(dāng)時(shí)的信息給出不同的回答，但對于大模型，它們的參數(shù)在訓(xùn)練完成后就固定下來了，這時(shí)候的大模型就像是一個不能升級的老舊軟件，不能再學(xué)習(xí)新的信息。

雖然我們可以通過 in-context learning 的方式，通過為大模型設(shè)定特定的認(rèn)知背景來模擬相應(yīng)回答，但這種認(rèn)知迭代不是自驅(qū)的，也不能適應(yīng)的未知信息環(huán)境。這就引出了一個問題：怎么才能讓大模型和人類一樣，根據(jù)不斷變化的信息實(shí)現(xiàn)自驅(qū)的認(rèn)知迭代呢？

值得慶幸的是，這個問題已經(jīng)有了初步的答案，哈爾濱工業(yè)大學(xué)與快手科技的研究團(tuán)隊(duì)率先提出了大型語言模型的認(rèn)知迭代（the cognitive dynamics of LLMs）的概念。不僅如此，為了系統(tǒng)建模這個概念，他們給出了形式化的任務(wù)定義和相關(guān)基準(zhǔn) CogBench，并提出了 CogGPT，一個顯式建模大型語言模型的認(rèn)知迭代的 LLM-driven Agent。這就意味著，基于這個研究，以后的大型語言模型將不再是簡單的信息處理工具，而可以進(jìn)一步模擬人類的思考方式，實(shí)現(xiàn)終身學(xué)習(xí)。

論文鏈接：https://arxiv.org/abs/2401.08438
項(xiàng)目主頁：https://github.com/KwaiKEG/CogGPT

從論文中可以看到，這個任務(wù)仿照心理學(xué)領(lǐng)域中的縱向研究，對大模型進(jìn)行持續(xù)性的「心理測試」。具體來說，這個任務(wù)首先通過動態(tài)信息流建立了持續(xù)變化的信息環(huán)境，然后為大模型設(shè)定了初始人設(shè)，通過定期要求它們填寫相同的認(rèn)知問卷，觀察這些模型在持續(xù)接收信息過程中，它們的認(rèn)知是如何發(fā)生變化的。

基于這個任務(wù)，研究團(tuán)隊(duì)還提出了基準(zhǔn) CogBench，根據(jù)信息流的類型，可以分為基于長文章的 CogBench_a 和基于短視頻的 CogBench_v，同時(shí)設(shè)立了真實(shí)性（Authenticity）和合理性（Rationality）兩個關(guān)鍵評估指標(biāo)，分別用于衡量模型與人類評分的一致性，以及評分理由的合理性，進(jìn)而豐富了大型語言模型的認(rèn)知迭代分析方法。

由于現(xiàn)有大模型無法實(shí)現(xiàn)參數(shù)的實(shí)時(shí)更新，研究團(tuán)隊(duì)設(shè)計(jì)了 CogGPT，一個具有迭代認(rèn)知機(jī)制的 LLM-driven agent。該機(jī)制包括一個記憶保持系統(tǒng)（Memory Retention System），用于蒸餾、存儲和檢索信息，以及一個協(xié)作優(yōu)化框架（Collaborative Refinement Framework），用于自驅(qū)地完成自我認(rèn)知迭代。

比如下面這個例子，CogGPT 扮演的是一個喜歡手工的人，她一開始對紋身并不了解，因此對「紋身是對美的追求」這一觀點(diǎn)保持代表中立的 3 分，在「看過」紋身會對身體造成傷害」和「自制香水紋身貼教程」的一系列短視頻后，她認(rèn)為紋身對身體有傷害，而且不應(yīng)該是美的唯一標(biāo)準(zhǔn)，將自己對這一觀點(diǎn)的看法從中立的 3 分改變?yōu)椴煌獾?2 分，同時(shí)也對自制紋身貼產(chǎn)生了興趣，從而展現(xiàn)出了像人一樣的認(rèn)知迭代能力。

研究團(tuán)隊(duì)還對 CogGPT 和一些通用基線在 CogBench 上做了充分實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明，在 CogBench_a 和 CogBench_v 兩個基準(zhǔn)上，CogGPT 在真實(shí)性（Authenticity）和合理性（Rationality）這兩個核心評估指標(biāo)上的表現(xiàn)都遠(yuǎn)超現(xiàn)有方法，這也進(jìn)一步證明了 CogGPT 可以有效地模仿特定人設(shè)的認(rèn)知迭代過程。

如果智能系統(tǒng)可以像人類一樣持續(xù)學(xué)習(xí)，將會給我們的生活帶來革命性的變化，到時(shí)候，私人助理將能夠提供更高效的定制化服務(wù)，網(wǎng)上沖浪也可能不再是人類獨(dú)有的樂趣。盡管這項(xiàng)研究還處于起步階段，但它已經(jīng)向我們揭示了一個充滿可能性的未來。

值得注意的是，該團(tuán)隊(duì)不久前還開源了 KwaiAgents 系統(tǒng)，提升了 7B/13B 大語言模型的 Agents 相關(guān)能力，自從發(fā)布以來已經(jīng)在 Github 上獲得了 800+star（https://github.com/KwaiKEG/KwaiAgents）。

責(zé)任編輯：張燕妮來源：機(jī)器之心

數(shù)據(jù)AI

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

哈工大聯(lián)合快手提出CogGPT：大模型也需要認(rèn)知迭代