僅需十行代碼,用Python創(chuàng)建語音模擬器
1、簡介
使用Python、pyttsx3和SpeechRecognition庫能快速創(chuàng)建語音模擬器。
用Python逐步創(chuàng)建語音模擬器
2、項目要求
首先,在機器上安裝Python,如果設(shè)備上已經(jīng)安裝了Python,請?zhí)^這一步驟。
要安裝Python,請訪問Python官方網(wǎng)站:https://www.python.org/downloads/并下載它。
接下來,安裝SpeechRecognition和pyttsx3庫。在命令提示符或終端中輸入以下命令:
pip install SpeechRecognition
pip install pyttsx3
SpeechRecognition:用于錄制聲音并將其轉(zhuǎn)換為文本。
pyttsx3:將文本轉(zhuǎn)換為聲音。
3、編碼步驟
步驟1
導(dǎo)入庫。示例代碼如下:
import speech_recognition as sr
import pyttsx3
為什么要使用“as sr”:簡化代碼。例如,可以使用sr.Recognizer()來代替speech_recognition.Recognizer()。
步驟2
rec = sr.Recognizer()
rec = sr.Recognizer()這行代碼創(chuàng)建了一個名為rec的新的Recognizer對象。
步驟3
with sr.Microphone() as src:
print("Say something...")
audio = rec.listen(src)
text = rec.recognize_google(audio)
with sr.Microphone() as src:這行代碼指示計算機監(jiān)聽麥克風(fēng)。麥克風(fēng)現(xiàn)在被稱為src。
print("Say something..."):這行代碼指示計算機打印一條消息,內(nèi)容是“Say something...(說點什么...)”。這是對使用者說話的提醒。
audio = rec.listen(src):這行代碼告訴計算機聽一段時間麥克風(fēng)的聲音,并將錄制的聲音存儲為audio。
text = rec.recognize_google(audio):這行代碼告訴計算機使用Google語音識別技術(shù)將錄制的聲音(audio)轉(zhuǎn)換為文本。文本將以text形式存儲。
步驟4
engine = pyttsx3.init()
這行代碼指示計算機激活語音合成器,用于將文本轉(zhuǎn)換為聲音。
步驟5
engine.say(text)
這行代碼指示計算機使用語音生成器(engine)朗讀剛剛說過的文本(text)。這就像按下錄音設(shè)備上的“播放”按鈕,就能聽到剛剛錄制的內(nèi)容。
步驟6
engine.runAndWait()
這行代碼指示計算機在繼續(xù)下一步之前等待語音生成器(engine)朗讀完文本(text)。這就像等待錄音播放完畢后再關(guān)閉設(shè)備。
步驟7
運行程序并說些什么。
注意:
如果程序無法運行,請嘗試執(zhí)行以下操作:
pip install setuptools
4、完整代碼
import speech_recognition as sr
import pyttsx3
rec = sr.Recognizer()
with sr.Microphone() as src:
print("Say something...")
audio = rec.listen(src)
text = rec.recognize_google(audio)
engine = pyttsx3.init()
engine.say(text)
engine.runAndWait()