AI一鍵音頻轉文字工具 速度超快,支持實時轉換,無需聯網,本地整合包下載

read-normal-img

這是 CapsWriter-Offline ,一個 PC 端的語音輸入、字幕轉錄工具。可用實現簡單一鍵將音頻文件轉換成文字的懶人工具。

兩個功能:

1、實時轉換,按下鍵盤上的 大寫鎖定鍵,錄音開始,當松開 大寫鎖定鍵 時,就會識別你的錄音,并將識別結果立刻輸入

2,離線轉換,將音視頻文件拖動到客戶端打開,即可轉錄生成 srt 字幕

特性

完全離線、無限時長、低延遲、高準確率、中英混輸、自動阿拉伯數字、自動調整中英間隔

熱詞功能:可以在 hot-en.txt hot-zh.txt hot-rule.txt 中添加三種熱詞,客戶端動態載入

日記功能:默認每次錄音識別后,識別結果記錄在 年份/月份/日期.md ,錄音文件保存在 年份/月份/assets

關鍵詞日記:識別結果若以關鍵詞開頭,會被記錄在 年份/月份/關鍵詞-日期.md,關鍵詞在 keywords.txt 中定義

轉錄功能:將音視頻文件拖動到客戶端打開,即可轉錄生成 srt 字幕

服務端、客戶端分離,可以服務多臺客戶端

編輯 config.py ,可以配置服務端地址、快捷鍵、錄音開關……

本地離線整合包

請確保電腦上安裝了?Microsoft Visual C++ Redistributable 運行庫

服務端載入模型所用的 onnxruntime 只能在 Windows 10 及以上版本的系統使用

服務端載入模型需要系統內存 4G,只能在 64 位系統上使用

額外打包了 32 位系統可用的客戶端,在 Windows 7 及以上版本的系統可用

官方程序和模型分離開,需要單獨下載模型

我已經把模型和軟件打包好,無需單獨下載模型,下載整合包,解壓即用。

完整整合包下載:AI一鍵音頻轉文字工具 速度超快,支持實時轉換,無需聯網,本地整合包下載

read-normal-img

功能:熱詞

read-normal-img

如果你有專用名詞需要替換,可以加入熱詞文件。規則文件中以 # 開頭的行以及空行會被忽略,可以用作注釋。

中文熱詞請寫到 hot-zh.txt 文件,每行一個,替換依據為拼音,實測每 1 萬條熱詞約引入 3ms 延遲

英文熱詞請寫到 hot-en.txt 文件,每行一個,替換依據為字母拼寫

自定義規則熱詞請寫到 hot-rule.txt 文件,每行一個,將搜索和替換詞以等號隔開,如 毫安時??=??mAh

你可以在 core_client.py 文件中配置是否匹配中文多音字,是否嚴格匹配拼音聲調。

檢測到修改后,客戶端會動態載入熱詞,效果示例:

例如 hot-zh.txt 有熱詞「我家鴿鴿」,則所有識別結果中的「我家哥哥」都會被替換成「我家鴿鴿」

例如 hot-en.txt 有熱詞「ChatGPT」,則所有識別結果中的「chat gpt」都會被替換成「ChatGPT」

例如 hot-rule.txt 有熱詞「毫安時 = mAh」,則所有識別結果中的「毫安時」都會被替換成「mAh」

功能:日記、關鍵詞

默認每次語音識別結束后,會以年、月為分類,保存錄音文件和識別結果:

錄音文件存放在「年/月/assets」文件夾下

識別結果存放在「年/月/日.md」Markdown 文件中

例如今天是2023年6月5號,示例:

語音輸入任一句話后,錄音就會被保存到 2023/06/assets 路徑下,以時間和識別結果命名,并將識別結果保存到 2023/06/05.md 文件中,方便我日后查閱

例如我在 keywords.txt 中定義了關鍵詞「健康」,用于隨時記錄自己的身體狀況,吃完飯后我可以按住 CapsLock 說「健康今天中午吃了大米炒飯」,由于識別結果以「健康」關鍵詞開頭,這條識別記錄就會被保存到 2023/06/05-健康.md 中

例如我在 keywords.txt 中定義了關鍵詞「重要」,用于隨時記錄突然的靈感,有想法時我就可以按住 CapsLock 說「重要,xx問題可以用xxxx方法解決」,由于識別結果以「重要」關鍵詞開頭,這條識別記錄就會被保存到 2023/06/05-重要.md 中

read-normal-img

功能:轉錄文件

在服務端運行后,將音視頻文件拖動到客戶端打開,即可轉錄生成四個同名文件:

json 文件,包含了字級時間戳

txt 文件,包含了分行結果

merge.txt 文件,包含了帶標點的整段結果

srt 文件,字幕文件

如果生成的字幕有微小錯誤,可以在分行的 txt 文件中修改,然后將 txt 文件拖動到客戶端打開,客戶端檢測到輸入的是 txt 文件,就會查到同名的 json 文件,結合 json 文件中的字級時間戳和 txt 文件中修正結果,更新 srt 字幕文件。

修改配置

你可以編輯 config.py ,在開頭部分有注釋,指導你修改服務端、客戶端的:

連接的地址和端口,默認是 127.0.0.1 和 6006

鍵盤快捷鍵

是否要保存錄音文件

要移除識別結果末尾的哪些標點,(如果你想把句尾的問號也刪除掉,可以在這邊加上)

read-normal-img

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/40576.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/40576.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/40576.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

TaskDisplayArea、ActivityStack、Task以及ActivityRecord之間的關系

目錄 一、TaskDisplayArea、ActivityStack、TaskRecord以及ActivityRecord關系圖 二、TaskDisplayArea、ActivityStack、Task以及ActivityRecord相關代碼 1、ActivityRecord 2、Task 3、ActivityStack 4、TaskDisplayArea 前言:對TaskDisplayArea、ActivitySt…

go語言day08 泛型 自定義錯誤處理 go:協程

泛型: 拋錯誤異常 實現error接口類型 用java語言解釋的話,實現類需要重寫error類型的抽象方法Error().這樣就可以自定義異常處理。 回到go語言,在Error()方法中用*argError 這樣一個指針類來充當error接口的實現類。 在f2()方法中定義返回值…

CONFIG_FEATURE_MOUNT_NFS

CONFIG_FEATURE_MOUNT_NFS是一個Linux內核配置選項,它允許系統支持掛載NFS文件系統。如果您在編譯內核或構建根文件系統時遇到關于NFS支持的問題,您可能需要檢查這個配置選項是否被啟用。在某些情況下,例如使用BusyBox作為工具集時&#xff0…

漏洞分析|OpenSSH漏洞(CVE-2024-6387)

一、網傳漏洞POC信息 漏洞編號:CVE-2024-6387 漏洞名稱:OpenSSH regreSSHion 漏洞 POC上傳者(作者不確定):7etsuo 發布日期:2024-07-01 漏洞類型:遠程代碼執行(RCE)…

昇思MindSpore學習筆記3-03熱門LLM及其他AI應用--基于MobileNetv2的垃圾分類

摘要: MindSpore AI框架使用MobileNetv2模型開發垃圾分檢代碼。檢測本地圖像中的垃圾物體,保存檢測結果到文件。記錄了開發過程和步驟,包括環境準備、數據下載、加載和預處理、模型搭建、訓練、測試、推理應用等。 1、實驗目的 了解垃圾分…

解決pip默認安裝位置在C盤方法

新版python中使用pip命令將opencv庫安裝到base環境中 首先我們打開命令控制窗口,激活base環境,輸入conda activate base 然后檢查一下自己base環境中是否安裝opencv庫,輸入conda list 往下找,找到o開頭的地方,發現是…

達夢數據庫 頁大小與數據庫字段長度的關系

對于達夢數據庫實例而言,頁大小 (page_size)、簇大小 (extent_size)、大小寫敏感 (case_sensitive)、字符集 (charset) 這四個參數,一旦確定無法修改;如果過程中發現這些數據設置的不對,只能是重新新建數據庫實例,而不…

GraphQL與RESTful API的區別和優勢

GraphQL GraphQL是一種用于API設計的語言和查詢協議,由Facebook于2015年推出。它允許客戶端向服務器指定他們需要的數據字段,而不是像RESTful API那樣請求整個資源然后過濾數據。在GraphQL中,客戶端發送一個單一的請求,而服務器返…

通過npm安裝OpenLayers庫,vue3+ts環境下OpenLayers實現加載本地高德離線地圖并添加標記點、標記點氣泡及標記點氣泡按鈕事件

在Vue 3和TypeScript的環境下使用OpenLayers來加載高德地圖的離線瓦片,并添加標記點、標記點氣泡以及處理氣泡上的按鈕事件,涉及到幾個步驟。首先,需要明確高德地圖的瓦片數據格式和如何配置OpenLayers以使用這些瓦片。接著,我們需…

零信任沙箱是什么?零信任沙箱有什么作用?

零信任沙箱是什么?零信任沙箱有什么作用? 在當今數字化時代,數據安全已成為各行各業的核心關注點。零信任沙箱作為一種新興的安全技術,不僅適用于政府和金融等關鍵領域,其實用性覆蓋了更廣泛的場景,如醫療…

數智化配補調:零售品牌增長新引擎

隨著科技的不斷進步和消費者需求的日益個性化、多元化,傳統服裝行業正面臨著前所未有的挑戰與機遇。在這個快速變化的時代,如何精準把握市場脈搏,實現庫存的高效管理,成為了服裝品牌生存與發展的關鍵。數智化配補調策略應運而生&a…

mysql定時備份數據庫

文章目錄 核心目標思路具體方法一、編寫腳本二、修改文件屬性三、找一個mysqldump文件四、把.sh放到定時器里 其它:windows的腳本 核心目標 解決數據庫定時備份的工作。centos環境。 思路 用centos的crontab定時執行腳本。 具體方法 一、編寫腳本 編寫backup_…

精準控制:Eureka服務續約間隔配置全指南

精準控制:Eureka服務續約間隔配置全指南 在微服務架構中,服務的發現與注冊是確保服務間有效通信的關鍵。Eureka,作為Netflix開源的服務發現框架,提供了一種優雅的方式來實現服務的注冊與發現。然而,服務續約間隔的配置…

vue單獨部署到寶塔教程

配置反向代理 注意:如果目標網站是https則寫https否則寫http 2.關于解決部署后無法刷新,直接報錯404 location / { try_files $uri $uri/ /index.html; }

程序員魚皮的保姆級寫簡歷指南第三彈,簡歷常見問題和建議匯總

大家好,我是程序員魚皮。做知識分享這些年來,我看過太多簡歷、也幫忙修改過很多的簡歷,發現很多同學是完全不會寫簡歷的、會犯很多常見的問題,不能把自己的優勢充分展示出來,導致錯失了很多面試機會,實在是…

PostgreSQL LIMIT 子句

PostgreSQL LIMIT 子句 PostgreSQL 是一種功能強大的開源對象關系數據庫管理系統,廣泛用于各種應用中。在處理大量數據時,我們通常只需要檢索部分記錄,而不是整個數據集。這時,LIMIT 子句就變得非常有用。本文將詳細介紹 Postgre…

代碼隨想錄Day74(圖論Part10)

94. 城市間貨物運輸| (Bellman_ford隊列優化版 / SPFA) 題目:94. 城市間貨物運輸 I (kamacoder.com) 思路: Bellman_ford 算法 每次都是對所有邊進行松弛,其實是多做了一些無用功。 只需要對 上一次松弛的時候更新過的…

p6spy 組件打印完整的 SQL 語句、執行耗時

一、前言 我們來配置一下 Mybatis Plus 打印 SQL 功能(包括執行耗時),一方面可以了解到每個操作都具體執行的什么 SQL 語句, 另一方面通過打印執行耗時,也可以提前發現一些慢 SQL,提前做好優化&#xff0c…

layui中添加上下文提示彈窗

<p context-tip"自定義上下文提示信息">段落內容...</p> <div context-tip"自定義上下文提示信息">div內容...</div>// 懸浮提示 $("body").on("mouseenter", "*[context-tip]", function () {v…

操作系統僵尸進程、CFS、上下文切換

進程 Linux的進程調度 CFS 完全公平調度算法 權重和nice值 權重&#xff1a;權重越大&#xff0c;分配的時間比例越大&#xff0c;就相當于進程的優先級越高。 進程的時間 C P U 總時間 ? 進程的權重 / 就緒隊列所有進程權重之和 進程的時間 CPU總時間 * 進程的權重/就緒…