涼宮春日、李云龍等32個人物都能扮演，這個聊天機器人很懂劇情，代碼可商用

作者：機器之心 2023-08-24 14:11:43

涼宮春日是谷川流創(chuàng)作的《涼宮春日系列》輕小說及其衍生作品的女主角，設定為高中生。雖然項目名字里只有「涼宮春日」，但「Chat 涼宮春日」可以模仿的人物達到了 32 個，包括李云龍（《亮劍》男主角）、哈利?波特、張牧之（電影《讓子彈飛》男主角）、Sheldon（美劇《生活大爆炸》男主角）等等。

讓 AI 模仿特定人物聊天是 ChatGPT 類大語言模型的一個常見玩法，有些公司還開發(fā)了專門的 APP，如 character.ai。在國內，一個名叫「Chat 涼宮春日」的項目充分地滿足了這種需求。

以下是生成效果：

「Chat涼宮春日」是由李魯魯、冷子昂、陳啟源發(fā)起的Luotuo(駱駝)的子項目之一，在魔搭社區(qū)主辦的Create@AI馬拉松大賽中獲得二等獎（top3）。我們可以在B站上看到他們的項目介紹視頻。

視頻鏈接：https://www.bilibili.com/video/BV1Xh411A7kC/?vd_source=12c1d661b492e88e254fc63d0a861962

近期，項目作者還發(fā)布了系統(tǒng)的技術報告，這份報告介紹了他們打造「Chat 涼宮春日」的過程以及一個支持 32 個人物的 54k 對話數據集的制作過程。同時，他們也在 HuggingFace 上發(fā)布了他們的數據集。

技術報告鏈接：https://arxiv.org/pdf/2308.09597.pdf
GitHub 鏈接：https://github.com/LC1332/Chat-Haruhi-Suzumiya
數據集鏈接：https://huggingface.co/datasets/silk-road/ChatHaruhi-54K-Role-Playing-Dialogue

項目作者之一冷子昂表示，「除了項目本身之外，我們的貢獻者除了我和魯魯都是從社區(qū)拉起來的隊伍，是一個眾人拾柴火焰高的事情，后面我們還會持續(xù)做更多的內容和嘗試，希望社區(qū)的小伙伴可以一起支持我們。」

本項目采用 Apache 2.0 協(xié)議，也就是說，你可以利用項目中的代碼進行商用。但是你仍然需要遵守以下事項：1. 角色本身的版權方的協(xié)議；2. 項目中使用的接口方，比如 OpenAI 的協(xié)議；3. 項目中使用的模型的協(xié)議（比如如果后期采用了 LlaMA 或者 GLM 的模型。）

以下是項目的大體內容。

讓 AI 扮演特定角色有一定難度

用 AI 模型進行角色扮演在游戲、創(chuàng)意產業(yè)等許多領域具有潛在的應用前景。

在開源角色扮演的實現中，開發(fā)者或用戶已經采用了類似的 Prompt，將它們持續(xù)輸入到 ChatGPT 或者作為 system whisper 接入到語言模型中：

I want you to act like {character} from {series}. I want you to respond and answer like {character} using the tone, manner and vocabulary {character} would use. Do not write any explanations. Only answer like {character}. You must know all of the knowledge of {character}. My first sentence is "Hi {character}."

因為 ChatGPT 或 Claude 在訓練的時候已經閱讀過很多故事，再加上更大的語言模型所表現的「智能」行為。用戶們發(fā)現模型往往能在這樣的 prompt 下表現出一定的角色扮演能力。然而，這樣的實現雖然簡單，卻有以下缺點:

這樣的 prompt 使用高度依賴大語言模型本來的記憶。如果大語言模型對于角色的記憶本身是模糊的，則無法模仿特定的角色。
這里的「know all of the knowledge of {character} 」的定義也是模糊的，無法很好地防御大語言模型幻覺效應的產生。
即使是使用這樣的 prompt，聊天機器人的對話風格還是會很大程度受到語言模型的影響，調整 prompt 或許能夠緩解這樣的問題，但是每一個特定的角色都要非常精細地調整 prompt。

這些缺點明顯限制了這種角色扮演聊天機器人的使用。

另一種簡單的思路是將角色對話微調到模型中，作者發(fā)現不少開發(fā)者進行了這樣的嘗試。在擁有足夠多的語料下，語言模型確實有能力掌握一個特定角色的語氣，但是這樣也會帶來新的問題。在一個初步的實驗中，他們發(fā)現微調后的 ChatBot 會產生更多的幻覺效果。并且對于大量的非主角角色，很難形成如此多的語料對模型進行微調。綜上所述，讓語言模型更好地進行角色扮演，模仿輸出角色的經典臺詞是個非瑣碎的問題。

模擬特定角色的大體思路

「Chat 涼宮春日」項目的主要目標是研究自然語言模型能否在對話中扮演來自動漫、影視作品的真實角色。在這個過程中，作者認為一個虛擬角色由三個核心部分構成：

第一，知識與背景：每個虛擬人物都有自己所處在的背景，比如涼宮春日處在一個日本的高中里。所以 ChatBot 需要了解對應故事的設定。這對于大型語言模型的記憶能力是較大的考驗，需要通過外部知識庫的引入去解決。

第二，人格或性格：人格和性格的設定在整部作品中需要是一致的，所以作者希望 ChatBot 所反應的人格和性格，與作品原來的設定也是一致的。

第三，語言習慣：這一點是最容易進行模仿的，只要在大型語言模型上下文中給出合適的例子，語言模型往往會進行模仿輸出。作者希望這樣的文學影視作品的愛好者與 ChatBot 互動時，能夠「復現」文學影視作品的經典橋段，這樣會讓這些作品的愛好者獲得更好的體驗。

「Chat 涼宮春日」項目的關鍵想法，是抽取盡可能多的原劇本，形成角色的記憶數據庫。在用戶給出新的提問時，系統(tǒng)會搜索相關的經典劇情，并且結合人物設定的 prompt，去組合控制語言模型，爭取對角色形成更精確的模仿。同時，受到 CAMEL 和 Baize 項目的啟發(fā)，作者設計了一套自動對話語料生成的系統(tǒng)，對于性格鮮明，但是原本對話較少的角色，他們可以進一步生成符合角色性格設定的語料。這樣就可以生成充分的語料使得微調一個本地的模型成為可能。

完整的開發(fā)計劃如下圖所示:

項目的主要貢獻可以概括為以下幾點：

1、基于大型的語言模型，作者提出了一套完整的角色扮演的算法系統(tǒng)。這套算法可以有效地組織角色的過往記憶，使得語言模型能夠模仿特定影視、動漫角色的語氣和知識進行對話。這套系統(tǒng)可以使用 OpenAI 的 ChatGPT 或者 Claude 這樣的預訓練大模型，也可以使用較小的 7B 規(guī)模的本地模型。

作者提出的算法在扮演涼宮春日，注意用戶的提問和原來的劇情相關但不是完全一致，而「Chat 涼宮春日」的回答基本可以引用原劇情。

2、作者提出了一個角色扮演的數據集，這個數據集包括了超過 30 個不同的中文 / 英文影視角色。通過收集電影、小說、劇本的語料，并進行結構化的抽取，他們收集了超過 23000 條以上的對話信息。這些對話數據可以用來訓練和檢驗角色扮演的語言模型。同時，使用作者提出的算法，借助 GPT3 和 GPT4，他們?yōu)檫@些角色額外模擬生成了超過 27000 條以上的對話。合并形成了 ChatHaruhi-54k 數據集。

3、為了檢驗和比較不同方式形成的角色扮演 ChatBot 的性能，他們使用自動測評和人工測評兩個方式對角色扮演機器人進行了測評（部分測評結果還未公布）。在自動測評中，他們測試角色是否能夠對劇本中的經典的劇情進行響應，給出和原劇本近似的回答。在人工測評中，他們提出了兩個不同的指標，讓被試去評估兩個不同的指標：吻合度：機器人的回答是否符合角色的原來設定；回答質量：機器人的回答的語言質量是否較好。結果發(fā)現，在使用同樣的基礎語言模型的情況下，他們的算法可以給出更好的角色扮演的性能。

下圖是「Chat 涼宮春日」的核心對話系統(tǒng)示意圖，包含 system prompt、為用戶查詢 q 檢索到的角色記憶 D (q, R) 以及規(guī)劃歷史 H。

下圖是項目數據集中涉及的角色數據列表：

在實驗中，作者定性比較了 5 個方案。可以看到，在加入經典對話以及修正 system prompt 之后，使用 ChatGPT 等模型可以有效的使聊天機器人體現特定人物的對話風格。同時，經過微調的 7B 模型也可以有效的將整個系統(tǒng)的 prompt 學習到。

更多細節(jié)請參見原報告：https://github.com/LC1332/Chat-Haruhi-Suzumiya/blob/main/notebook/arxiv_paper.md

責任編輯：張燕妮來源：機器之心

AI 訓練

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

涼宮春日、李云龍等32個人物都能扮演，這個聊天機器人很懂劇情，代碼可商用

讓 AI 扮演特定角色有一定難度

模擬特定角色的大體思路