成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鵝廠造10億虛擬人格專搞數據合成:讓7B模型數學成績打平GPT4,還能給弱智吧出題

人工智能 新聞
用這些虛擬人格產生的合成數據,能讓7B模型的數學成績暴增15分,打平了GPT-4 Turbo。

10億名“員工”生產數據合成,數量占到了世界人口的13%。

不過這些“員工”并不是真人,而是騰訊利用網絡數據制造出的虛擬人格。

用這些虛擬人格產生的合成數據,能讓7B模型的數學成績暴增15分,打平了GPT-4 Turbo。

圖片

作者觀察到,只要在數據合成prompt中簡單地加入角色信息,就可以讓生成該角色視角下獨特的合成數據。

于是經過研究之后,這個包含10億個(準確說是1,015,863,523個)不同人格信息的Persona Hub應運而生。

除了前面提到的訓練數據,這些人格還能設計出弱智吧風格的邏輯推理問題,也可以拿來做工具開發,甚至打造出游戲NPC、進行社會模擬。

有網友看了表示這實在是泰褲辣,自己以前也做過這樣的實驗,不過只制作了一萬種人格,現在這個項目真的很有趣。

圖片

還有人說,人物角色或將成為合成數據的未來。

圖片

效果如何,接下來就一起來感受下。

數學成績暴增,還能給弱智吧提問

Persona Hub中的這10億種不同的人格,可以用來生成多種類型的文本信息。

圖片

其中也包括生成訓練數據,比如用它們生成的數學文本訓練大模型,可以讓7B模型擁有和GPT-4 Turbo相當的數學能力。

具體來說,作者用Persona Hub中的不同人格生成了107萬條數據,并用其訓練了Qwen2-7B模型,然后在MATH數據集上進行了測試。

結果模型獲得了64.9%的準確率,比原始版本提高了15個百分點,并與1106、0125兩個版本的GPT4-Turbo打成了平手

圖片

在生成訓練數據之外,Persona Hub也能通過模擬用戶提示、創建知識文本等方式來提高模型的能力。

比如讓模型猜測特定的人格,可能給的一段什么樣的prompt。

圖片

或者根據知識、技能、經歷等人格設定,設計一段Quora(美版知乎)風格的知識性文章

圖片

這些生成的內容都能直接或間接用于模型訓練和調整,從而提高模型的知識水平和任務表現。

當然除了幫助模型提高能力,也可以讓Persona Hub當中的角色來設計問題,比如不同風格的邏輯推理題目。

圖片

△機翻,僅供參考

甚至也能用中文設計問題,還學會了弱智吧風格,能夠寫出腦洞大開的提問。

圖片

被賦予了人格的大模型,本質上仍然是大模型,所以大模型有的編程能力,帶人設的模型也同樣具有。

當然,這里的人格設定,變成了程序針對的目標,即模型設計出的程序,需要滿足不同人群的需求。

圖片

更高階地,Persona Hub中的人格與大模型結合后,可以進行游戲NPC的生成。

根據prompt中的游戲背景設定,再結合目標人物的風格,模型合成了三個迥異的人物和他們相應的介紹。

連人物的名字都與目標人設進行了匹配,而且介紹也緊扣游戲設定。

圖片

進一步地,作者還認為,通過利用這些人格來模擬和推斷真實用戶的潛在需求和行為,還為用語言模型模擬現實世界創造了許多新的機會。

Persona Hub中的10億個人格,可以利用強大的語言模型在虛擬世界中維持一個組織良好的虛擬社會,構建出一個超大號的“斯坦福小鎮”。

那么,我們不禁要問,Persona Hub里的這10億種人格,都是怎樣獲得的呢?

從網絡數據中挖掘人格

作者合成人格的方式主要有兩種——由文本生成人格(Text-Persona)和由人格生成人格(Persona-Persona)。

用文本生成人格信息的理論基礎,是作者發現具有特定專業背景和文化背景的人,在閱讀和寫作時會表現出獨特的興趣偏好。

操作上,作者將海量網絡文本數據輸入預訓練語言模型,通過prompt(如“誰可能會閱讀/撰寫/喜歡這段文本?”)引導模型從每段文本中提取一個對應的人格,這里的prompt可以控制輸出人格描述的格式,如純文本或結構化文本。

比如作者給出的實例當中,大模型根據不同類型的文本信息,提取出了三種不同人格:

圖片

當輸入的文本包含大量細節時(如教科書、學術論文等),提取出的人格描述也會更加細致和專業化。

圖片

總之,通過在海量網絡文本上應用文生人格方法,可以獲得數十億乃至更多的人格,覆蓋各個領域、不同粒度的角色。

但仍然可能會遺漏一些在網絡上可見度較低的角色,如兒童、乞丐、幕后工作人員等,為了補充這些角色,作者還提出了人格生人格方法。

這種方法建立在文生人格的基礎之上,從其獲得的人格出發,利用人際關系鏈,根據六度分隔理論,對每個種子角色進行最多6輪的關系擴展,推斷并擴展出其他相關聯的角色。

(六度分隔理論由哈佛大學心理學教授Stanley Milgram于1967年提出,內容是說人和任何一個陌生人之間所間隔的人不會超六個,即最多通過六個人就能認識任何一個陌生人。)

實際操作過程當中,作者會首先選擇要探索的人際關系類型,將種子人格和目標關系類型輸入到模型中,通過prompt引導模型生成對應的相關人格。

比如前面文生人格環節獲得的“兒科護士”人格,就可以衍生出病人、藥商、同事等相關聯的人格。

圖片

這里生成的相關人格可以作為新的種子,進一步擴展人格網絡,經過6輪迭代擴展,可以覆蓋絕大多數相關角色。

不過,由于在生成新的personas的過程中可能會產生一些不合理、不合邏輯,或者與種子關聯性不強的角色描述,所以作者還需要對這些生成的人格進行過濾。

過濾的標準包括但不限于以下幾個方面:

  • 相關性:生成結果是否與種子和目標關系類型相關?反例:兒科護士-宇航員
  • 合理性:生成結果是否合理、合乎邏輯?反例:一個5歲的兒童患者,獨自經營一家跨國公司
  • 特異性:生成結果是否具有特異性,而不是過于籠統?反例:“一個人”
  • 可讀性:生成的描述是否清晰、易于理解?是否包含語法或拼寫等錯誤?

過濾解決了人格描述質量的問題,但生成的人格中仍然可能存在大量相似甚至重復的描述,所以還需要對生成的人格進行去重。

在本項目中,作者使用了兩種去重方法。

一是基于MinHash的去重,作者將每個描述轉化為一組n-grams,使用MinHash算法計算每段描述的signature并比較相似度,超過某個閾值時則認為出現了重復。

另一種是基于嵌入的去重,作者使用大模型將每個描述轉化為一個嵌入向量,并計算嵌入向量之間的相似度,同樣是超過某個閾值時認為出現了重復。

有了這些人格之后,還需要通過一定方式將其與prompt整合,才能實現提高數學能力等效果。

比如在這個場景中,作者嘗試了零樣本、少樣本和人格增強的少樣本三種方式,發現零樣本創造力強但相關性差,少樣本相關性提高了但創造力下降了,人格增強的少樣本則在兩者之間實現了較好的平衡。

圖片

目前,騰訊從這10億虛擬人格中選擇了20萬個,并與它們所生成的數據一起進行了公開。

圖片

作者表示,在解決安全風險等問題之后,還會公開更多的人格和數據信息。

論文地址:https://arxiv.org/abs/2406.20094GitHub:
https://github.com/tencent-ailab/persona-hub

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-02-07 12:39:00

AI數據

2024-05-09 08:33:33

2024-06-11 14:30:18

2025-01-06 12:46:16

模型數據訓練

2023-03-08 08:22:48

虛擬人AI作畫表情遷移

2025-06-18 09:03:07

2020-11-17 06:57:15

存儲互聯網用戶

2022-03-30 16:02:50

數字虛擬人AI元宇宙

2024-07-08 08:38:00

模型推理

2022-09-09 07:33:58

AI虛擬人機器人

2024-01-22 07:10:00

AI視頻

2025-06-10 09:07:00

2024-07-31 15:38:00

2023-05-09 15:41:03

2024-03-25 08:00:00

2024-06-03 10:43:34

2024-04-08 08:05:00

大模型人工智能開源

2024-06-11 09:20:48

2024-07-17 16:12:22

2025-06-18 08:47:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美不卡视频一区发布 | 在线永久看片免费的视频 | 久久久久久国产精品久久 | 国产乱码精品1区2区3区 | 中文字幕在线观看视频网站 | 日本中文在线视频 | 操射视频 | 精品久久久久久中文字幕 | 成人a视频在线观看 | 久久精品91久久久久久再现 | av在线一区二区 | 国产精品久久久久久久久婷婷 | 米奇狠狠鲁| 久久69精品久久久久久国产越南 | 一区二区免费 | 欧美黄在线观看 | 欧美不卡一区二区 | 在线一区二区三区 | 亚洲欧美一区二区三区国产精品 | 在线免费观看毛片 | 丝袜美腿一区二区三区 | 天堂一区 | 久草免费电影 | 日韩免费视频 | 国产丝袜一区二区三区免费视频 | 国产高潮好爽受不了了夜色 | 午夜影院在线观看视频 | 一区二区国产精品 | 精品欧美一区二区三区久久久 | 奇米视频777 | 涩涩视频在线看 | 亚洲精品一区二区三区四区高清 | 国产丝袜一区二区三区免费视频 | 一区二区三区免费观看 | 日本在线一二 | 国产日韩电影 | 五月综合久久 | 九九热在线视频 | 中文字幕一区二区三区四区五区 | 午夜小视频免费观看 | 国产午夜精品久久久久免费视高清 |