前言
本篇文章主要介紹,如何利用Python來實現將文字轉成語音。將文字轉成語音主要有兩種不同的實現方法:先將文字轉成語音,然后再通過讀取語音實現發音、直接調用系統內置的語音引擎實現發音,后一種方法的實現主要利用第三方庫。
環境
Python版本:Anaconda 4.4.10
操作系統:win10
注意:在使用第三方庫的時候,不同的操作系統和Python版本代碼可能有所差別。
調用api
可以調用第三方的語音合成api生成音頻文件,然后再播放音頻文件即可,這里我使用的是百度語音合成api。
1、注冊賬號創建應用
在使用之前,需要先注冊一個百度賬號,然后再創建一個語音合成的api,需要拷貝AppID、API Key、Secret Key后面調用接口的時候需要使用。
2、調用語音合成接口
python調用百度語音合成api接口詳細文檔:http://yuyin.baidu.com/docs/tts/196
3、安裝百度提供的Python庫:
如果已安裝pip,執行pip install baidu-aip即可。
如果已安裝setuptools,執行python setup.py install即可。
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis('你好嗎?', 'zh', 1, {
'vol': 5,
})
# 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼
if not isinstance(result, dict):
with open('auido.mp3', 'wb') as f:
f.write(result)
播放音頻文件
安裝playsound:pip install playsound
from playsound import playsound
playsound("auido.mp3")
利用系統內置語音引擎實現發音
1. Pyttsx
Pyttsx是一個跨平臺將文字轉成語音的第三方庫,它對操作系統內置的語音引擎實現了包裝。
Pyttsx安裝
Python2:pip install pyttsx
Python3:pip install pyttsx3
代碼
import pyttsx3
engine = pyttsx3.init()
engine.say("Good")
engine.runAndWait()
pyttsx默認使用的是讀取英文引擎,如果需要讀取中文時需要修改語言設置,不然可能會報錯或者無法發音,首先我們需要參考系統支持的語言類型和參數,通過以下代碼可以查看
engine = pyttsx3.init()
voices = engine.getProperty("voices")
for item in voices:
print(item.id,item.languages)