文字轉語音
Python語音合成之第三方庫gTTs/pyttsx3/speech橫評(內附使用方法)_python_腳本之家
代碼示例
from gtts import gTTStts = gTTS('你好你在哪兒!',lang='zh-CN')tts.save('hello.mp3')import pyttsx3engine = pyttsx3.init() #創建對象"""語速"""rate = engine.getProperty('rate') #獲取當前語速的詳細信息print(rate) #打印當前語速engine.setProperty('rate',200) #重設語速engine.say('Hello world!')engine.say('My current speaking rate is '+str(rate))engine.runAndWait()engine.stop()engine.save_to_file('你好,世界!明天你要去哪兒玩','test.mp3')engine.runAndWait()
相比之下gtts播報效果好一些,局限新大點,pyttsx3出了播報效果差點其他還行,靈活性比較好
語音轉字幕,用的是whisper
whisper現有還不錯的語音識別,里面有很多模型,看網上很多教程寫的很雜,很蒙。此處簡化操作。
import whisper
whisper_model = whisper.load_model("tiny")
result = whisper_model.transcribe(r"D:\xy_fs_try\video_to_deal\audio_realize\hello.mp3")
print(", ".join([i["text"] for i in result["segments"] if i is not None]))
此處需要安裝ffmpeg ,不知道安裝方法的自己去搜索。此處還有坑就是安裝torch的問題,卸載原有的torch 安裝一下命令即可
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118