微軟人工智能語音技術支持 “多情感程度”調節,細膩演繹 “人聲”
IT之家4月12日消息 近期,微軟發布最新語音技術,支持 “情感程度”輕松調節,令智能語音的情感表現力更加細膩可控。
人類的情感很大程度上體現于語音語調的微妙變化,比如一句 “再見”,有時是平靜而含蓄的,有時是開心而輕松的,有時卻是決絕而憤怒的。微軟智能語音能夠把開心(Cheerful)、悲傷(Sad)、憤怒(Angry)、 恐懼(Fearful)、 不滿(Disgruntled)、 嚴厲(Serious)、撒嬌(Affectionate)、溫柔(Gentle)、沮喪(Depressed)、尷尬(Embarrassed)、平靜(Calm)等情感,以百分之一作為一個量化單元,以平靜語氣為零點,讓虛擬人物即刻擁有成千上萬的情感,讓內容創作更加有血有肉。IT之家獲悉,微軟人工智能中文語音如曉曉、云希、云野、曉涵、曉萱、曉墨、曉睿均支持 “情感程度”調節技術,他們年齡、性別、性格各異。
智能語音情感程度可調節演示視頻:
微軟智能語音情感調節以自適應神經網絡為基礎,開發者可以使用 SSML 標簽(語音合成標記語言),輕松控制情感程度。同時,沒有任何編程或 SSML 標簽經驗的大眾用戶也可以通過有聲內容創作平臺使用這一功能。
- <speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="zh-CN"> >voice name="zh-CN-XiaoxiaoNeural"> 快走吧,路上一定要注意安全,早去早回。
面向開發者:微軟智能語音情感程度可調節技術情感程度調節示例 1
面向廣大用戶:微軟智能語音情感程度可調節技術情感程度調節示例 2
此外,通過與自動文本情感分析技術相結合,微軟智能語音技術可自動預測情感類別,智能演繹飽含情緒變化的作品。
微軟智能語音情感程度可調節技術,讓音頻創作就像導演選角一樣,用最適合的聲音、最恰當的情感,演繹更出色的作品,適用于聊天機器人、有聲書朗讀、影視自動配音、游戲等多情景。
AI 有聲內容創作工具 : https://speech.microsoft.com/audiocontentcreation