OpenAI首次展示音頻模型Voice Engine，生成的聲音太逼真了！

Aceryt

發布于 2024-4-1 15:21

瀏覽

0收藏

3月30日凌晨，OpenAI在官網首次展示了全新自定義音頻模型“Voice Engine”。

用戶只需要提供15秒左右的參考聲音，通過Voice Engine就能生成幾乎和原音一模一樣的全新音頻，在清晰度、語音連貫、音色、自然度等方面比市面上多數產品都強很多。

除了能合成音頻之外，OpenAI還展示了Voice Engine很多其他際商業用途，例如，一位失去聲音表達能力的女孩，在Voice Engine幫助下能像以前一樣正常發音說話。

Voice Engine功能展示

OpenAI并非展示了一些簡單的demo，而是一些實際場景化用例，這也就是說Voice Engine的技術已經非常成熟。

Age of Learning 是一家兒童教育公司，他們一直在使用Voice Engine生成各種有聲讀物。同時還通過與GPT-4的相結合使用，創建實時、個性化的回答與學生互動。

例如，使用一段15秒的參考音頻。就可以生成幾乎一模一樣的語音。

除了語音合成之外，Voice Engine還能提供視頻翻譯功能，可以將一種視頻語音無差別的翻譯成多國語言。

HeyGen是一家AI視頻合成平臺，主要幫助企業開發商品展示的“數字人”。他們通過使用Voice Engine進行視頻翻譯，擴展至多國語言來擴大全球覆蓋受眾。

輸入一段原參考語音，就能將其轉化成中文語音

幫助聲音受損的人恢復聲音：諾曼-普林斯生命科學研究所正在測試一項實驗，正通過Voice Engine幫助那些因腫瘤或神經系統病因，導致語言障礙的患者恢復聲音。

目前，他們已經幫助一位因血管性腦腫瘤，而失去流利語言表達能力的年輕女患者恢復了聲音。

現在這位女患者可以正常與其他人交流了。

OpenAI表示，其實他們在2022年底便開發了Voice Engine，并將其用于支持文本到語音 API 中的預設語音以及 ChatGPT 的語音和朗讀功能。

但出于安全考慮一直沒有全面公測，目前也只是小范圍測試。因為相比文本、視頻，音頻的造假能力太強了幾乎無法分辨出來。

此外，OpenAI首席技術官Mira Murati在前不久接受的采訪時表示，未來Sora生成的視頻會帶聲音的，很可能為其提供聲音的就是Voice Engine。

本文轉自AIGC開放社區作者：AIGC開放社區

原文鏈接:??https://mp.weixin.qq.com/s/ErMhYBEjjDMpJfPlj9NiIw??

標簽

AI 語音

贊

回復

舉報

回復

相關推薦

音頻驅動逼真人像動畫合成！人人都是歌手！

angel ? 4442瀏覽 ? 0回復
OpenAI 推出語音引擎，只需15秒樣本，即能重建任何人的聲音

pangguiyu ? 2813瀏覽 ? 0回復
一張照片+音頻=超逼真數字人視頻！VASA-1模型拉開「實時交互」大幕

duhorse ? 3189瀏覽 ? 0回復
OpenAI首次公開前沿大模型安全：基礎架構、保護措施等

Aceryt ? 4948瀏覽 ? 0回復
開源音頻模型Stable Audio Open，文本生成47秒高清音效

Aceryt ? 4713瀏覽 ? 0回復
Stability AI開源47秒音頻生成模型，蟲鳴鳥叫、搖滾、鼓點都能生成

輕薄滴假象 ? 2860瀏覽 ? 0回復
太逼真了！Gen-3 Alpha重磅發布，Sora最強競爭對手！

Aceryt ? 3144瀏覽 ? 0回復
谷歌“另辟蹊徑”，展示AI視頻生音頻最新進展，效果驚艷！網友：但有一個缺點

51CTO技術棧 ? 2692瀏覽 ? 0回復
耳朵沒錯，是聲音太真了，字節豆包語音合成成果Seed-TTS技術揭秘

輕薄滴假象 ? 3898瀏覽 ? 0回復
曠視開源的AI人像視頻生成太炸了！輸入照片即可模仿任意表情包

輕薄滴假象 ? 3187瀏覽 ? 0回復
OpenAI展示草莓，很快發布“GPT-5”獵戶座！

Aceryt ? 2092瀏覽 ? 0回復
Real-Time Voice Cloning：5 秒解鎖聲音克隆，憑啥斬獲 52.9k Stars？

穿越時空111 ? 4647瀏覽 ? 0回復
NVIDIA AI 推出 Fugatto：一個 25 億參數的音頻模型，可從文本和音頻輸入生成音樂、語音和聲音

Halo咯咯 ? 2558瀏覽 ? 0回復
擊敗99.9%的程序員！o3來了！AGI測試實現躍升！網友：推理scaling law太炸了！一文回顧OpenAI直播帶貨12天

51CTO技術棧 ? 3317瀏覽 ? 0回復
DeepSeek太給力了！自家的大模型秘方開源到底！國產大模型雄起

51CTO技術棧 ? 2787瀏覽 ? 0回復
馬斯克阻止OpenAI營利化慘遭駁回！將秋季開庭判決；法官：收購提議太雙標了！

51CTO技術棧 ? 1849瀏覽 ? 0回復
用 MCP 讓大模型自動批量下載文獻，太香了！

機器學習與數學 ? 5739瀏覽 ? 0回復
剛剛，OpenAI發布新文生圖模型，免費、逼真到難以分辨

Aceryt ? 1807瀏覽 ? 0回復
谷歌推出Veo 2，生成8秒超逼真視頻

Aceryt ? 1569瀏覽 ? 0回復

Aceryt

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

OpenAI首次展示音頻模型Voice Engine，生成的聲音太逼真了！

Voice Engine功能展示

目錄