python語音合成并播放_使用Python實現文字轉語音并生成wav文件的例子

目前手邊的一些工作，需要實現聲音播放功能，而且僅支持wav聲音格式。

現在，一些網站上支持文字轉語音功能，但是生成的都是MP3文件，這樣還需要額外的軟件來轉成wav文件，十分麻煩。

后來，研究Python，發現Python可以很容易的實現上面的功能。

步驟如下，

1。使用百度語音實現TTS（Text To Speech），生成mp3文件;

2。使用pydub和ffmpeg實現mp3轉wav格式。

下面，先上簡單的示例代碼，然后對代碼作簡單的分析。

#!/usr/bin/python -tt

# -*- coding: utf-8 -*-

from aip import AipSpeech

from pydub import AudioSegment

# Step 1, Using baidu AI to generate mp3 file from text

#input your APP_ID/API_KEY/SECRET_KEY

APP_ID = 'Your_APP_ID'

API_KEY = 'Your_API_KEY'

SECRET_KEY = 'Your_Secret_Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result = client.synthesis('你好百度, good morning', 'zh', 1, { 'vol': 5,'per':4 })

if not isinstance(result, dict):

with open('test.mp3', 'wb') as f:

f.write(result)

# Step 2, convert the mp3 file to wav file

sound = AudioSegment.from_mp3('test.mp3')

sound.export("test.wav", format="wav")

運行上面的python代碼，就會生成test.mp3和test.wav，使用命令“aplay test.wav”，可以測試播放聲音。

下面對代碼做解析，

1。在運行之前，需要安裝下面的庫，

1.1 安裝百度AI模塊，安裝命令“pip install baidu-aip”

1.2 安裝pydub，pydub是python的一個音頻處理庫處理，能對wav格式的音頻直接進行處理，安裝命令“pip install pydub”

1.3 安裝ffmpeg，可以實現對mp3格式的處理，安裝命令“sudo apt-get install ffmpeg”

2。需要注冊百度的應用開發者賬戶，

大家可以對上述代碼進行進一步的優化，以實現自己想要的功能。

下面是完整的Python代碼，大家可以拿來使用，

#!/usr/bin/python -tt

# -*- coding: utf-8 -*-

"""

module: baiduVoiceGenerate

platform: Linux

description: Generate Speech from Text, and convert the audio to wav file.

Precondition: Please install below module before run this progrom,

1. pip install baidu-aip

2. pip install pydub

3. sudo apt-get install ffmpeg

creater: Guangwei Jiang

create time: 2018-11-21

"""

from aip import AipSpeech

from pydub import AudioSegment

import time

#input your own APP_ID/API_KEY/SECRET_KEY

APP_ID = '14891501'

API_KEY = 'EIm2iXtvDSplvR5cyHU8dAeM'

SECRET_KEY = '4KkGGzTq2GVrBEYPLXXWEEIoyLL1F6Zt '

print("baiduVoiceGenerate: V1.0, by Guanagwei_Jiang, 20181121")

str = raw_input("請輸入要轉成語音的文字： ")

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

result = client.synthesis(str, 'zh', 1, { 'vol': 5,'per':4 })

if not isinstance(result, dict):

with open('temp.mp3', 'wb') as f:

f.write(result)

sound = AudioSegment.from_mp3('temp.mp3')

sound.export(time.strftime("%Y%m%d_%H%M%S", time.localtime())+".wav", format="wav")

以上這篇使用Python實現文字轉語音并生成wav文件的例子就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持我們。

時間： 2019-08-07

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/396974.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/396974.shtml
英文地址，請注明出處：http://en.pswp.cn/news/396974.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！