成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

哈工大聯(lián)合快手提出CogGPT:大模型也需要認(rèn)知迭代

人工智能 新聞
從論文中可以看到,這個任務(wù)仿照心理學(xué)領(lǐng)域中的縱向研究,對大模型進(jìn)行持續(xù)性的「心理測試」。

在認(rèn)知科學(xué)領(lǐng)域,人類通過持續(xù)學(xué)習(xí)改變認(rèn)知的過程被稱為認(rèn)知迭代(Cognitive Dynamics)。形象地說,認(rèn)知迭代就像是我們大腦的「軟件更新」過程,手機(jī)應(yīng)用通過不斷的更新來修復(fù) bug 和增加新功能,我們的大腦也通過不斷學(xué)習(xí)新知識、經(jīng)驗(yàn),來改善和優(yōu)化思考方式。

從我們判斷感冒吃什么藥效果好,到一代代數(shù)學(xué)家如何證明費(fèi)馬大定理,無論是個人的心智發(fā)展還是人類文明的進(jìn)步,認(rèn)知迭代都扮演了不可或缺的角色。

圖片

如今,像 GPT-4 等大型語言模型(Large Language Models,LLMs)為通用人工智能(Artificial General Intelligence,AGI)的發(fā)展帶來希望的同時(shí),也暴露出一個顯著的問題 —— 認(rèn)知固化。比如,對于經(jīng)典問題「宇宙的中心在哪里」,不同時(shí)代的人會基于當(dāng)時(shí)的信息給出不同的回答,但對于大模型,它們的參數(shù)在訓(xùn)練完成后就固定下來了,這時(shí)候的大模型就像是一個不能升級的老舊軟件,不能再學(xué)習(xí)新的信息。

雖然我們可以通過 in-context learning 的方式,通過為大模型設(shè)定特定的認(rèn)知背景來模擬相應(yīng)回答,但這種認(rèn)知迭代不是自驅(qū)的,也不能適應(yīng)的未知信息環(huán)境。這就引出了一個問題:怎么才能讓大模型和人類一樣,根據(jù)不斷變化的信息實(shí)現(xiàn)自驅(qū)的認(rèn)知迭代呢?

值得慶幸的是,這個問題已經(jīng)有了初步的答案,哈爾濱工業(yè)大學(xué)與快手科技的研究團(tuán)隊(duì)率先提出了大型語言模型的認(rèn)知迭代(the cognitive dynamics of LLMs)的概念。不僅如此,為了系統(tǒng)建模這個概念,他們給出了形式化的任務(wù)定義和相關(guān)基準(zhǔn) CogBench,并提出了 CogGPT,一個顯式建模大型語言模型的認(rèn)知迭代的 LLM-driven Agent。這就意味著,基于這個研究,以后的大型語言模型將不再是簡單的信息處理工具,而可以進(jìn)一步模擬人類的思考方式,實(shí)現(xiàn)終身學(xué)習(xí)。

圖片


  • 論文鏈接:https://arxiv.org/abs/2401.08438
  • 項(xiàng)目主頁:https://github.com/KwaiKEG/CogGPT

從論文中可以看到,這個任務(wù)仿照心理學(xué)領(lǐng)域中的縱向研究,對大模型進(jìn)行持續(xù)性的「心理測試」。具體來說,這個任務(wù)首先通過動態(tài)信息流建立了持續(xù)變化的信息環(huán)境,然后為大模型設(shè)定了初始人設(shè),通過定期要求它們填寫相同的認(rèn)知問卷,觀察這些模型在持續(xù)接收信息過程中,它們的認(rèn)知是如何發(fā)生變化的。

基于這個任務(wù),研究團(tuán)隊(duì)還提出了基準(zhǔn) CogBench,根據(jù)信息流的類型,可以分為基于長文章的 CogBench_a 和基于短視頻的 CogBench_v,同時(shí)設(shè)立了真實(shí)性(Authenticity)和合理性(Rationality)兩個關(guān)鍵評估指標(biāo),分別用于衡量模型與人類評分的一致性,以及評分理由的合理性,進(jìn)而豐富了大型語言模型的認(rèn)知迭代分析方法。

由于現(xiàn)有大模型無法實(shí)現(xiàn)參數(shù)的實(shí)時(shí)更新,研究團(tuán)隊(duì)設(shè)計(jì)了 CogGPT,一個具有迭代認(rèn)知機(jī)制的 LLM-driven agent。該機(jī)制包括一個記憶保持系統(tǒng)(Memory Retention System),用于蒸餾、存儲和檢索信息,以及一個協(xié)作優(yōu)化框架(Collaborative Refinement Framework),用于自驅(qū)地完成自我認(rèn)知迭代。

比如下面這個例子,CogGPT 扮演的是一個喜歡手工的人,她一開始對紋身并不了解,因此對「紋身是對美的追求」這一觀點(diǎn)保持代表中立的 3 分,在「看過」紋身會對身體造成傷害」和「自制香水紋身貼教程」的一系列短視頻后,她認(rèn)為紋身對身體有傷害,而且不應(yīng)該是美的唯一標(biāo)準(zhǔn),將自己對這一觀點(diǎn)的看法從中立的 3 分改變?yōu)椴煌獾?2 分,同時(shí)也對自制紋身貼產(chǎn)生了興趣,從而展現(xiàn)出了像人一樣的認(rèn)知迭代能力。

圖片

研究團(tuán)隊(duì)還對 CogGPT 和一些通用基線在 CogBench 上做了充分實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在 CogBench_a 和 CogBench_v 兩個基準(zhǔn)上,CogGPT 在真實(shí)性(Authenticity)和合理性(Rationality)這兩個核心評估指標(biāo)上的表現(xiàn)都遠(yuǎn)超現(xiàn)有方法,這也進(jìn)一步證明了 CogGPT 可以有效地模仿特定人設(shè)的認(rèn)知迭代過程。

圖片

如果智能系統(tǒng)可以像人類一樣持續(xù)學(xué)習(xí),將會給我們的生活帶來革命性的變化,到時(shí)候,私人助理將能夠提供更高效的定制化服務(wù),網(wǎng)上沖浪也可能不再是人類獨(dú)有的樂趣。盡管這項(xiàng)研究還處于起步階段,但它已經(jīng)向我們揭示了一個充滿可能性的未來。

值得注意的是,該團(tuán)隊(duì)不久前還開源了 KwaiAgents 系統(tǒng),提升了 7B/13B 大語言模型的 Agents 相關(guān)能力,自從發(fā)布以來已經(jīng)在 Github 上獲得了 800+star(https://github.com/KwaiKEG/KwaiAgents)。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2022-03-16 09:33:13

模型算法智能

2024-03-11 09:27:00

框架模型AI

2024-07-02 12:25:12

2024-07-19 12:48:29

2022-02-28 17:43:27

AI模型訓(xùn)練

2023-04-10 16:34:46

模型文本

2024-03-18 10:38:03

模型算法

2023-08-29 12:49:37

視頻應(yīng)用

2022-11-07 14:48:53

2024-03-04 09:00:00

模型壓縮

2025-06-16 14:39:56

模型開源框架

2024-07-08 08:47:00

2013-11-04 14:46:18

2011-07-27 10:37:28

IT安全安全錯誤

2021-08-31 09:45:15

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)語音

2023-12-04 13:23:00

數(shù)據(jù)訓(xùn)練

2019-09-01 21:20:18

騰訊云大數(shù)據(jù)

2025-05-19 14:56:45

3D模型訓(xùn)練

2025-06-18 09:03:07

2025-03-21 13:25:14

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 黄色精品视频网站 | 久久精品97 | 中国三级黄色录像 | 操久久| 欧美精品成人一区二区三区四区 | av一级久久 | 亚洲精品一区中文字幕乱码 | 成人中文网 | 一区二区三区免费 | 久久精品一级 | 另类亚洲视频 | 琪琪午夜伦伦电影福利片 | 99精品国产一区二区青青牛奶 | 久久午夜国产精品www忘忧草 | 亚洲高清视频在线 | 欧美亚洲成人网 | 欧美a在线 | 日韩精品一区二区三区在线播放 | 亚洲高清免费观看 | 免费观看一级视频 | 亚洲精品电影 | 国产成人av在线播放 | 亚洲一级黄色 | 黑人巨大精品 | 男女性毛片 | 欧美一区二区三区在线看 | 国产精品区一区二区三区 | 久久中文字幕一区 | 亚洲精品乱码久久久久久黑人 | 蜜臀久久99精品久久久久野外 | 欧美久久一区 | 精品国产成人 | 亚洲精品区 | 天天夜夜人人 | 久久综合成人精品亚洲另类欧美 | h漫在线观看 | 一区二区三区四区不卡视频 | 久久精品毛片 | aaa在线| 日本公妇乱淫xxxⅹ 国产在线不卡 | 国产一区二区三区视频 |