成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

能聽懂語音的ChatGPT來了:10小時錄音扔進去,想問什么問什么

人工智能 新聞
類 ChatGPT 模型的輸入框里可以粘貼語音文檔了。

大型語言模型(LLM)正在改變每個行業的用戶期望。然而,建立以人類語音為中心的生成式人工智能產品仍然很困難,因為音頻文件對大型語言模型構成了挑戰。


將 LLM 應用于音頻文件的一個關鍵挑戰是,LLM 受其上下文窗口的限制。在一個音頻文件能夠被送入 LLM 之前,它需要被轉換成文本。音頻文件越長,繞過 LLM 的上下文窗口限制的工程挑戰就越大。但工作場景中,我們往往需要 LLM 幫我們處理非常長的語音文件,比如從一段幾個小時的會議錄音中抽取核心內容、從一段訪談中找到某個問題的答案……

最近,語音識別 AI 公司 AssemblyAI 推出了一個名為 LeMUR 的新模型。就像 ChatGPT 處理幾十頁的 PDF 文本一樣,LeMUR 可以將長達 10 小時的錄音進行轉錄、處理,然后幫用戶總結語音中的核心內容,并回答用戶輸入的問題。

圖片

試用地址:https://www.assemblyai.com/playground/v2/source

LeMUR 是 Leveraging Large Language Models to Understand Recognized Speech(利用大型語言模型來理解識別的語音)的縮寫,是將強大的 LLM 應用于轉錄的語音的新框架。只需一行代碼(通過 AssemblyAI 的 Python SDK),LeMUR 就能快速處理長達 10 小時的音頻內容的轉錄,有效地將其轉化為約 15 萬個 token。相比之下,現成的、普通的 LLM 只能在其上下文窗口的限制范圍內容納最多 8K 或約 45 分鐘的轉錄音頻。

圖片

為了降低將 LLM 應用于轉錄音頻文件的復雜性,LeMUR 的 pipeline 主要包含智能分割、一個快速矢量數據庫和若干推理步驟(如思維鏈提示和自我評估),如下圖所示:

圖片

圖 1:LeMUR 的架構使用戶能夠通過一個 API 調用將長的和 / 或多個音頻轉錄文件發送到 LLM 中。

未來,LeMUR 有望在客服等領域得到廣泛應用。

圖片

LeMUR 解鎖了一些驚人的新可能性,在幾年前,我認為這些都是不可能的。它能夠毫不費力地提取有價值的見解,如確定最佳行動,辨別銷售、預約或呼叫目的等呼叫結果,感覺真的很神奇?!?電話跟蹤和分析服務技術公司 CallRail 首席產品官 Ryan Johnson

LeMUR 解鎖了什么可能性?

將 LLM 應用于多個音頻文本

LeMUR 能夠讓用戶一次性獲得 LLM 對多個音頻文件的處理反饋,以及長達 10 小時的語音轉錄結果,轉化后的文本 token 長度可達 150K 。

圖片

可靠、安全的輸出

由于 LeMUR 包含安全措施和內容過濾器,它將為用戶提供來自 LLM 的回應,這些回應不太可能產生有害或有偏見的語言。

圖片

可補充上下文

在推理時,它允許加入額外的上下文信息,LLM 可以利用這些額外信息在生成輸出時提供個性化和更準確的結果。

圖片

模塊化、快速集成

LeMUR 始終以可處理的 JSON 形式返回結構化數據。用戶可以進一步定制 LeMUR 的輸出格式,以確保 LLM 給出的響應是他們下一塊業務邏輯所期望的格式(例如將回答轉化為布爾值)。在這一流程中,用戶不再需要編寫特定的代碼來處理 LLM 的輸出結果。

試用結果

根據 AssemblyAI 提供的測試鏈接,機器之心對 LeMUR 進行了測試。

LeMUR 的界面支持兩種文件輸入方式:上傳音視頻文件或粘貼網頁鏈接均可。

圖片

我們用 Hinton 近期的一份訪談資料作為輸入,測試 LeMUR 的性能。

圖片

上傳之后,系統提示我們要等一段時間,因為它要先把語音轉成文字。

圖片

轉錄之后的界面如下:

圖片

在頁面右側,我們可以要求 LeMUR 總結采訪內容或回答問題。LeMUR 基本可以輕松地完成任務:

圖片

圖片

如果要處理的語音是一段演講或客服回復,你還能向 LeMUR 征求改進建議。

圖片

不過,LeMUR 似乎目前還不支持中文。感興趣的讀者可以去嘗試一下。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-19 06:08:09

智慧城市物聯網城市服務

2016-08-04 16:30:49

華為

2022-10-20 08:51:40

跳表復雜度索引

2019-07-12 12:57:43

人工智能垃圾分類智能垃圾桶

2023-05-19 07:35:03

ChatGPTOpenAI

2022-05-18 18:31:28

機器人自然語言編程

2015-10-13 10:14:27

HR問題面試

2019-07-01 05:02:34

IP地址子網掩碼 網關

2021-09-05 23:54:55

人工智能機器語言

2013-01-16 16:05:49

語義云App自然語言

2023-05-14 23:39:51

機器人深度學習

2019-02-27 10:18:26

重置Windows 10Windows

2022-11-14 21:34:17

2022-01-23 16:13:06

比特幣加密貨幣暴跌

2015-05-07 14:58:06

編程每周工作80小時

2016-01-18 10:06:05

編程

2023-03-05 19:30:02

人工智能ChatGPT

2017-09-05 08:14:09

深度學習語音合成

2023-03-22 18:17:41

2024-04-08 11:13:27

AIEVI人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美一区二区在线播放 | 日日夜夜精品 | 精品国产欧美一区二区三区成人 | 欧美一区二区三区视频在线观看 | 国产不卡一区 | 午夜精品久久久久久久久久久久久 | 国产精品久久久久婷婷二区次 | 国产一区二区三区精品久久久 | 亚洲最大的黄色网址 | 97中文视频 | 中文福利视频 | 九九热在线免费视频 | 99re视频精品 | 99久久精品免费看国产高清 | 午夜婷婷激情 | 日本三级线观看 视频 | 日韩成人一区二区 | 国产剧情久久 | 国产乱码精品1区2区3区 | 成年人网站在线观看视频 | 亚洲激情一区二区三区 | 亚洲永久 | 精品在线看 | 91精品国产一区二区三区 | 国产精品久久久久久久久久久免费看 | 日韩在线免费看 | 欧美日韩精品一区二区三区视频 | 久久com| 国产视频福利在线观看 | 人人干人人干人人干 | 一区二区三区四区在线视频 | 欧美视频三区 | 亚洲天天干 | 国产丝袜一区二区三区免费视频 | 免费观看一级黄色录像 | 亚洲国产精品精华素 | 黄色一级网 | 成人永久免费视频 | 中文字幕亚洲欧美 | 亚洲精品乱码久久久久久蜜桃91 | 成人亚洲精品久久久久软件 |