背景介紹
我就說Github上面能找到好東西吧
事情是這樣的
我最近在用PC端的剪映剪輯視頻
需要用到它的語音轉字幕功能
轉完之后,導出的時候
發現 赫然有一項字幕識別的會員權益
我尋思看看什么價格
不貴的話就充了
好家伙,這不看不知道,一看嚇一跳
599?一年?
連續包年首年也需要399的啊喂!
我…就用個轉字幕,其他功能基本上都用不上的
真不劃算啊
但凡250以內我還考慮一下
手動加字幕,那也有點太累了
尋找替代方案
Github 上去搜搜
關鍵字:
語音轉文本, 語音轉字幕, voice to srt
反正用這幾個關鍵字結合搜索了一下
大概有了點認知,目前市面上比較流行的語音轉文本的方案
基本上都是基于 openai
的 whisper
模型的,可以離線運行
發現神器:妙幕SmartSub
最終篩選出來這個應用
妙幕SmartSub
是個跨平臺客戶端工具,完全開源免費,在Github上已經有 2.6k
的 star 了
截止到現在已經有 194個commit
了,更新頻率很高,上次提交是在 一周前
界面樣式也還挺好看,視頻和音頻都支持
做了模型整合,也有適合國內寶寶體質的鏡像模型
還支持接入百度火山deepseek等大模型服務對字幕進行翻譯
這是官方的特性
如何選擇模型
就是它了!
下載安裝
下載也很方便, Realease頁面有不同系統的安裝包,下載安裝即可
https://github.com/buxuku/SmartSub/releases
作者也很貼心的加上了夸克網盤的下載鏈接
使用教程
安裝之后打開,先下載幾個模型
模型的選擇和注意事項上文已經提到過,更詳細的請查看官方 Github 倉庫說明文檔
如果遇到下載比較慢的情況,建議切換至國內模型鏡像站點
模型下載完之后,上傳你的視頻或者音頻,在左側菜單欄選擇模型,開始任務
我用的 large-v3-turbo-q8_0
模型,親測效果巨好,5分多鐘音頻 22秒 就識別完成了,又快又準
校對與導出
識別完成之后可以點擊校對按鈕,彈出校對模塊
這里會在播放的時候,實時定位到哪一行字幕。
太細節了吧!!!
校對無誤后點擊保存
字幕文件默認跟你導入的音視頻文件在一個根目錄下
字幕導入剪映
接下來打開剪映,選擇文本 - 導入本地字幕
將校對完成后的字幕文件 .srt 拖入剪映字幕中
完活兒~
如果對您有所幫助,還請不要忘了點個關注呦