【開源軟件推薦】 SmartSub,一個可以快速識別視頻/音頻字幕的工具

背景介紹

我就說Github上面能找到好東西吧

事情是這樣的

我最近在用PC端的剪映剪輯視頻

需要用到它的語音轉字幕功能

轉完之后,導出的時候

發現 赫然有一項字幕識別的會員權益

我尋思看看什么價格

不貴的話就充了

好家伙,這不看不知道,一看嚇一跳

599?一年?

連續包年首年也需要399的啊喂!

我…就用個轉字幕,其他功能基本上都用不上的

真不劃算啊

但凡250以內我還考慮一下

手動加字幕,那也有點太累了

尋找替代方案

Github 上去搜搜

關鍵字:

語音轉文本, 語音轉字幕, voice to srt

反正用這幾個關鍵字結合搜索了一下

大概有了點認知,目前市面上比較流行的語音轉文本的方案

基本上都是基于 openaiwhisper 模型的,可以離線運行

發現神器:妙幕SmartSub

最終篩選出來這個應用

妙幕SmartSub

是個跨平臺客戶端工具,完全開源免費,在Github上已經有 2.6k 的 star 了

截止到現在已經有 194個commit 了,更新頻率很高,上次提交是在 一周前

界面樣式也還挺好看,視頻和音頻都支持

做了模型整合,也有適合國內寶寶體質的鏡像模型

還支持接入百度火山deepseek等大模型服務對字幕進行翻譯

這是官方的特性

如何選擇模型

就是它了!

下載安裝

下載也很方便, Realease頁面有不同系統的安裝包,下載安裝即可

https://github.com/buxuku/SmartSub/releases

作者也很貼心的加上了夸克網盤的下載鏈接

使用教程

安裝之后打開,先下載幾個模型

模型的選擇和注意事項上文已經提到過,更詳細的請查看官方 Github 倉庫說明文檔

如果遇到下載比較慢的情況,建議切換至國內模型鏡像站點

模型下載完之后,上傳你的視頻或者音頻,在左側菜單欄選擇模型,開始任務

我用的 large-v3-turbo-q8_0 模型,親測效果巨好,5分多鐘音頻 22秒 就識別完成了,又快又準

校對與導出

識別完成之后可以點擊校對按鈕,彈出校對模塊

這里會在播放的時候,實時定位到哪一行字幕。

太細節了吧!!!

校對無誤后點擊保存

字幕文件默認跟你導入的音視頻文件在一個根目錄下

字幕導入剪映

接下來打開剪映,選擇文本 - 導入本地字幕

將校對完成后的字幕文件 .srt 拖入剪映字幕中

完活兒~


如果對您有所幫助,還請不要忘了點個關注呦

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/915222.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/915222.shtml
英文地址,請注明出處:http://en.pswp.cn/news/915222.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

自動駕駛仿真領域常見開源工具

自動駕駛仿真領域常見開源工具1、目錄1.1 自動駕駛仿真領域常見開源2、地圖&場景2.1、場景播放器-Esmini4、被測對象-智駕軟件4.1、Autoware4.4、端到端模型-VAD4.5、端到端模型-UniAD4.6、端到端模型-ThinkTwice4.7、端到端模型-TCP5、評價方法5.1、Leaderboard5.2、Bench…

GPU算力租用平臺推薦,價格便宜且有羊毛薅,最低只要0.49/小時!

1.趨動云,這是我近期一直在用的,使用體驗還不錯,推薦給大家 網址:https://platform.virtaicloud.com/gemini_web/auth/register?inviteCode5f74065eac6d8867eac5c82194e2683a 是否選擇一個算力平臺我認為有幾點需要考慮&#xff…

python學智能算法(二十五)|SVM-拉格朗日乘數法理解

引言 前序學習進程中,已經對最佳超平面的求解有了一定認識。 剛好在此梳理一下: 函數距離 首先有函數距離F,也可以稱為函數間隔F: Fmin?i1...myi(w?xib)F \min_{i1...m}y_{i}(w \cdot x_{i}b)Fi1...mmin?yi?(w?xi?b) 幾何距離 然后…

vscode 源碼編譯

windows 環境 下載安裝 build tools Visual Studio Build Tools 勾選 C 因為安裝詳細信息里是 v143,所以單個組件里也要追加兩個 143 的勾選 點擊安裝,安裝好重啟下電腦 Electron 安裝失敗:connect ETIMEDOUT 20.205.243.166:443 為防Ele…

讀取和寫入json,xml文件

一、JSON文件操作? 1. 核心類?? ??QJsonDocument??:表示整個JSON文檔,提供解析(fromJson())和序列化(toJson())功能。 ??QJsonObject??:存儲鍵值對集合,支持嵌套對象和數…

深度學習×第10卷:她用一塊小濾鏡,在圖像中找到你

🌈【第一節 她看到的是像素點,卻試圖拼出你整張臉】📸 圖像是什么?她從未見過你,但看見的是你的一片光斑圖像,在神經網絡的眼里,是一個個數字格子。這些格子,每個都有 0~255 的亮度…

計算機組成原理中的RAM:核心技術深度解析

摘要:本文深度剖析RAM在計算機體系中的核心地位,結合2025年最新技術標準與實測數據,涵蓋DRAM工作原理、主流技術對比、非易失性存儲革新及未來發展趨勢,為硬件開發者和系統架構師提供權威技術參考。一、RAM基礎原理與系統交互機制…

C語言—深入理解指針(詳)

深入理解指針(詳解)前言一、指針是什么1、指針的定義2、指針的大小二、指針類型1、類型2、不同類型的意義三、野指針1、野指針形成原因2、如何避免野指針四、指針的運算1、 指針整數2、指針-指針3、指針的關系運算五、const修飾指針1、consr修飾變量2、c…

小談相機的學習過程

前言博主本人并非專職相機開發,還涉及系統的其他幾個模塊,雖然都屬于owner,但是都還在學習探索的一個過程,自認為掌握還不夠細致,此篇文章僅梳理,總結,印證自己近五年相機模塊的一個學習過程&am…

CentOS7 內網服務器yum修改

1、首先確定的內網服務器是有yum源代理服務器的2、修改 /etc/yum.conf 配置文件,增加代理ip和端口號proxyhttp://ip.ip.ip.ip:port3、備份源是文件sudo cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak4、修改配置文件 vi CentOS-Base…

基于單片機自行車自動防盜報警系統設計

摘 要 本文闡述了自行車防盜報警系統原理,介紹如何用stc89c52單片機實現防盜報警,分析各個部分的工作原理,并給出了原理圖和源程序。此設計電路由震動傳感器、單片機、無線超再生發射/接收電路、LED顯示器和蜂鳴器組成。由于超再生接收是一種…

【深度學習】神經網絡反向傳播算法-part4

七、反向傳播算法反向傳播Back Propagation 簡稱 BP 。 訓練神經網絡的核心算法之一,通過計算損失函數,相對于每個權重參數的梯度,來優化神經網絡的權重1. 前向傳播前向傳播是把數據經過各層神經元的運算并逐層向前傳輸,知道輸出層…

CTF之服務器端模板注入(SSTI)與賽題

概念定義服務器端模板注入(Server-Side Template Injection)服務端接受攻擊者的輸入,將其作為Web應用內容的一部分,在進行代碼編譯渲染的過程中,進行了語句的拼接,執行了所插入的惡意內容,從而導致信息泄露、代碼執行、…

除了某信,就是這款軟件來替代了!

引言 哈嘍,我是小索奇。有時候會有一個普遍的需求,想在幾個設備之間傳個文件或者發個消息,除了微信,想一想你還能用什么軟件? 今天就是為了解決這個問題,給大家介紹一款軟件 Localsend 來解決。 內容模塊…

Vue2.x封裝預覽PDF組件

一、為什么用PDFObject插件? PDFObject 是一個輕量級的 JavaScript 庫,主要用于在網頁中嵌入和預覽 PDF 文件。它通過簡單的 API 調用,可以在瀏覽器中實現 PDF 文件的顯示,而無需依賴任何插件。以下將詳細介紹 PDFObject 的特點、…

undefined reference to ‘end‘

相關問題: 一、undefined reference to _exit undefined reference to ‘end‘ warning: _close is not implemented and will always fail 一、環境: ubuntu24.04實體機、 arm-none-eabi-gcc gcc version 13.2.1 20231009 (15:13.2.rel1-2) 二…

nginx定制http頭信息

修改http響應頭信息,相關Nginx模塊:ngx_http_headers_moduleexpires語法:expires [modified] time;expires [modified] time;默認值:expires off;作用域:http, server, location, if in location用途:控制緩…

主機安全---開源wazuh安裝

Wazuh 簡介 Wazuh 是一款免費開源的終端安全監控平臺,支持威脅檢測、完整性監控、事件響應和合規性管理,適用于企業級安全運維場景。其核心組件包括: Wazuh Indexer:基于 OpenSearch 的日志存儲與檢索組件。Wazuh Server&#x…

GaussDB 數據庫架構師修煉(四) 備份容量估算

1 影響備份容量關鍵要素業務總數據量備份數據保留周期備份周期備份數據的壓縮比平均每天的新增數據量平均每天新增日志數據量2 備份容量的估算方法公式備份容量C = 自動全量備份容量C1 + 自動差量備份容量C2 + 自動日志歸檔 容量C3 &#xff…

《R for Data Science (2e)》免費中文翻譯 (第0章) --- Introduction

寫在前面 本系列推文為《R for Data Science (2e)》的中文翻譯版本。所有內容都通過開源免費的方式上傳至Github,歡迎大家參與貢獻,詳細信息見: Books-zh-cn 項目介紹: Books-zh-cn:開源免費的中文書籍社區 r4ds-zh-cn…