成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

國產語音對話大模型來了:李開復零一萬物參與,中英雙語多模態,開源可商用

人工智能
模型的訓練一共分為兩個階段,第一階段訓練模態適配器,凍結編碼器和大模型,也就是讓它來學習語音和文本對齊;第二階段凍結編碼器,訓練模態適配器和大模型,來學習多模態對話能力。

首個中英雙語的語音對話開源大模型來了!

這幾天,一篇關于語音-文本多模態大模型的論文出現在arXiv上,署名公司中出現了李開復旗下大模型公司01.ai——零一萬物的名字。

圖片圖片

這篇論文提出了一個中英雙語可商用對話模型LLaSM,同時支持錄音和文本輸入,“混合雙打”也沒有問題:

圖片圖片

論文認為,“語音聊天”才是AI與人之間更方便自然的交互方式,而不僅僅是通過文本輸入。

用上大模型,有網友已經在想象“躺著說話就能寫代碼”的場景了。

圖片圖片

這項研究來自LinkSoul.AI、北大和零一萬物,目前已經開源,也可以在抱抱臉中直接試玩。

圖片圖片

一起來看看它的效果如何。

支持文本語音輸入,手機也可玩

據研究人員表示,LLaSM是第一個支持中英文雙語語音-文本多模態對話的開源可商用對話模型。

那么,就來看看它的語音文本輸入和中英雙語能力如何。

首先來個中英文化碰撞,讓它用英文評價一下李白:

圖片圖片

還可以,正確地說出了李白的朝代。如果看不懂英文,讓它直接翻譯成中文也沒問題:

圖片圖片

接下來再試試中英混合提問,在中文里面摻雜一個“fried food”,模型輸出也不錯:

圖片圖片

再試探一下模型,讓它進行一些評價,看看李白和杜甫哪個更厲害。

可以看出,模型思考一會后給出了非常中立的評價,也具備大模型的基本“端水常識”(手動狗頭)

圖片圖片

當然,不止是電腦,手機也能玩。

我們試著用語音輸入“給我推薦一個菜譜吧”:

可以看到模型準確地輸出了一個“茄子芝士”的菜譜,就是不知道好不好吃。

不過,我們在嘗試的時候也發現,這個模型有時候會出bug。

例如有時候它并不能很好地“聽懂人話”。

要求輸出中英混合的內容,它會假裝看不懂并輸出英文:

圖片圖片

而當中英混合詢問想聽“Taylor Swift的Red”時,模型更是直接出大bug,反反復復輸出一句話,甚至停不下來……

圖片圖片

總體來看,當遇到中英混合的提問或要求時,模型輸出能力還是不太行。

不過分開的話,它的中英文表述能力還是不錯的。

那么,這樣的模型究竟是怎么實現的呢?

做了個什么新模型?

從試玩來看,LLaSM主要有兩個特點:一個是支持中英輸入,另一個是語音文本雙輸入。

要做到這兩點,分別需要在架構和訓練數據上做一些調整。

架構上,LLaSM將當前的語音識別模型和大語言模型做了個整合。

LLaSM由三個部分構成,分別包括自動語音識別模型Whisper、模態適配器和大模型LLaMA。

其中,Whisper負責接收原始語音輸入,并輸出語音特征的向量表示;模態適配器負責對齊語音和文本嵌入;LLaMA則負責理解語音和文本輸入的指令,并生成回復。

圖片圖片

模型的訓練一共分為兩個階段,第一階段訓練模態適配器,凍結編碼器和大模型,也就是讓它來學習語音和文本對齊;第二階段凍結編碼器,訓練模態適配器和大模型,來學習多模態對話能力。

訓練數據上,研究人員整理出了一個包含19.9萬個對話和50.8萬個語音-文本樣本的數據集LLaSM-Audio-Instructions。

而在50.8萬個語音-文本樣本中,有8萬個中文語音樣本,42.8萬個英文語音樣本。

研究人員主要基于WizardLM、ShareGPT和GPT-4-LLM等數據集,通過文本轉語音技術,給這些數據集生成語音包,同時過濾掉無效對話。

圖片圖片

這也是目前最大的中英文語音文本指令遵循數據集,不過目前還在整理中,據研究人員表示,整理完后會進行開源。

不過,論文暫時沒有對比它和其他語音模型或文本模型的輸出效果。

作者介紹

這篇論文來自LinkSoul.AI、北京大學和零一萬物。

共同一作Yu Shu和Siwei Dong均來自LinkSoul.AI,此前曾經在北京智源人工智能研究院工作。

LinkSoul.AI是一家AI初創公司,之前推出過首個開源Llama 2的中文語言大模型。

圖片圖片

作為李開復旗下的大模型公司,零一萬物也在這次研究中有所貢獻。作者Wenhao Huang的Hugging Face主頁顯示,他畢業于復旦大學。

圖片圖片

論文地址:
https://arxiv.org/abs/2308.15930

Demo地址:
https://huggingface.co/LinkSoul/LLaSM-Cllama2

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-01-22 13:59:00

模型訓練

2023-08-04 13:22:46

AI開源

2023-08-14 07:20:10

2024-05-17 16:02:00

2024-03-25 12:40:19

訓練模型

2024-03-07 12:30:56

數據模型

2025-01-08 08:21:16

2025-05-23 09:18:25

2024-10-16 15:07:57

2023-11-14 17:51:28

AI模型

2024-03-14 11:31:52

零一萬物AI框架

2023-10-12 14:40:10

AI模型

2023-06-06 14:09:32

模型開源

2025-04-28 14:04:03

Gemini模型AI

2024-01-29 07:15:00

模型數據

2025-05-14 08:51:00

2025-02-26 13:45:00

2023-08-03 19:11:45

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 伊人电影院av | 欧美日韩国产一区 | 波多野结衣一区二区三区在线观看 | 成人黄色在线视频 | 亚洲视频中文字幕 | 成人av免费网站 | 国产精品区二区三区日本 | 国产综合av| 一级毛片视频 | 久久久久久久久国产成人免费 | 91综合在线视频 | 国产精品一区二区三区在线 | 欧美一级做性受免费大片免费 | 日韩欧美福利视频 | 亚洲成人精品 | 中文字幕1区 | 国产精品一区在线观看 | 在线免费观看a级片 | 久久久www | 99久久精品一区二区毛片吞精 | 亚洲一区二区免费视频 | 精品久| 国产精品久久久久久久岛一牛影视 | 麻豆亚洲 | 国产亚洲精品久久久久动 | 亚洲欧美一区二区三区1000 | 国产精品日韩欧美一区二区三区 | 亚洲视频二区 | 亚洲一在线 | 三级在线免费 | 男女免费视频网站 | 午夜影院中文字幕 | 日韩人体在线 | 日韩精品一区二区三区在线观看 | 三级成人在线观看 | 国产伦一区二区三区视频 | 欧美国产激情二区三区 | 成年人国产在线观看 | 99riav3国产精品视频 | 看av电影 | 91精品久久久久久久 |