人工智能:語音合成技術(shù)介紹
1、語音合成概念介紹
語音合成簡單來說就是把文字信息轉(zhuǎn)換為標(biāo)準(zhǔn)語音的過程,最終可以輸出對(duì)應(yīng)的音頻文件。可以實(shí)現(xiàn)讓機(jī)器像人類一樣可以實(shí)時(shí)的說話。涉及的領(lǐng)域有聲學(xué)、語言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)管理等方面的知識(shí)。
2、語音合成的過程
主要包括:獲取輸入的文本→語言處理→韻律處理→聲學(xué)處理→輸出音頻文件。其中語音識(shí)別主要是語言處理、韻律處理、聲學(xué)處理三個(gè)階段的操作。
2.1 語言處理
該階段主要是模擬人類對(duì)大自然語言理解的過程,主要工作有輸入文本分析、分詞、語義分析,目的是讓計(jì)算機(jī)能夠盡可能準(zhǔn)確理解輸入文本的含義并為后面的環(huán)節(jié)做準(zhǔn)備。
2.2 韻律處理
主要是為合成的語音規(guī)劃出音高、音長、音強(qiáng)等語音特征,目的是為了讓合成的語音能表達(dá)確切的語意,使得輸出的音頻文件更符合實(shí)際。
2.3 聲學(xué)處理
這個(gè)階段主要是把前兩個(gè)階段處理結(jié)果合成最終的音頻文件。
3、語音合成使用場(chǎng)景
3.1 智能服務(wù)方面
智能服務(wù)方面主要包括語音機(jī)器人、智能音響等設(shè)備。通過語音合成語音可以輸出形形色色的聲音,比如甜美親切的銀行導(dǎo)航機(jī)器人;呆萌可愛的早教機(jī)器人;智能音響也極大豐富了我們的日常生活比如通知智能音響可以播放歌曲、相聲、新聞、講故事等實(shí)用功能。
3.2 APP應(yīng)用方面
手機(jī)APP應(yīng)用就更加廣泛了,比如手機(jī)閱讀器的聽書功能、地圖的導(dǎo)航播報(bào)功能、手機(jī)自帶的語音助手、視頻剪輯通過文字直接轉(zhuǎn)換音頻文件等方面應(yīng)用非常廣泛。