關于python 語音轉字幕，字幕轉語音大雜燴

文字轉語音

Python語音合成之第三方庫gTTs/pyttsx3/speech橫評(內附使用方法)_python_腳本之家

代碼示例

 from gtts import gTTStts = gTTS('你好你在哪兒！',lang='zh-CN')tts.save('hello.mp3')import pyttsx3engine = pyttsx3.init() #創建對象"""語速"""rate = engine.getProperty('rate') #獲取當前語速的詳細信息print(rate) #打印當前語速engine.setProperty('rate',200) #重設語速engine.say('Hello world!')engine.say('My current speaking rate is '+str(rate))engine.runAndWait()engine.stop()engine.save_to_file('你好，世界！明天你要去哪兒玩','test.mp3')engine.runAndWait()

相比之下gtts播報效果好一些，局限新大點，pyttsx3出了播報效果差點其他還行，靈活性比較好

語音轉字幕，用的是whisper

whisper現有還不錯的語音識別，里面有很多模型，看網上很多教程寫的很雜，很蒙。此處簡化操作。

import whisper
whisper_model = whisper.load_model("tiny")
result = whisper_model.transcribe(r"D:\xy_fs_try\video_to_deal\audio_realize\hello.mp3")
print(", ".join([i["text"] for i in result["segments"] if i is not None]))

此處需要安裝ffmpeg ,不知道安裝方法的自己去搜索。此處還有坑就是安裝torch的問題，卸載原有的torch 安裝一下命令即可

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/166452.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/166452.shtml
英文地址，請注明出處：http://en.pswp.cn/news/166452.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！