【聲音轉文字CapsWriter】聲音隨時轉化為文字,CapsWriter提高工作效率

文章目錄

    • 前言
    • 1. 軟件與模型下載
    • 2. 本地使用測試
    • 3. 異地遠程使用
      • 3.1 內網穿透工具下載安裝
      • 3.2 配置公網地址
      • 3.3 修改config文件
      • 3.4 異地遠程訪問服務端
    • 4. 配置固定公網地址
      • 4.1 修改config文件
    • 5. 固定tcp公網地址遠程訪問服務端

前言

今天我要給大家安利一個神器——CapsWriter-Offline。這款工具可以用聲音搞定所有文字輸入的工作,絕對是一個不可錯過的寶藏應用!它不僅能讓你的語音瞬間變成文字,還能通過結合cpolar內網穿透技術實現遠程訪問和使用其強大的功能。

無論是整理會議錄音、進行高效的聊天輸入,還是處理其他復雜的文本轉換任務,CapsWriter-Offline都能輕松應對。而且最重要的是,它的操作非常簡單,上手幾乎零門檻!

接下來的內容中,我會詳細介紹如何在Windows系統中安裝并使用這款工具,并且告訴你一些實用的小技巧和注意事項。相信我,掌握了這些方法后,你的工作效率將會有質的飛躍!

image-20240910164231263

1. 軟件與模型下載

本例演示環境為Windows11,另外需要準備一個麥克風。

首先,我們需要下載CapsWriter-Offline的64位版本,可以使用服務端、客戶端。然后需要下載models.zip模型文件。

下載地址:Releases · HaujetZhao/CapsWriter-Offline (github.com)

image-20240910164525004

將軟件和模型下載好后進行解壓,然后將解壓好的模型文件夾models復制到解壓好的CapsWriter-Offline的文件夾中并替換原有的同名文件夾。

image-20240910164649325

2. 本地使用測試

現在我們首先雙擊打開服務端(start_server),會彈出窗口對模型進行加載,加載完成后會提示開始服務:

image-20240910164924307

這時我們在雙擊打開客戶端(start_client),會彈出窗口連接服務端并檢測音頻輸入設備:

image-20240910165106716

顯示連接成功即可開始使用了。

軟件在Windows系統中默認使用大小寫切換鍵caps lock進行語音輸入(可以在配置文件中進行修改),一直按住說話,松手即可識別語音并在聊天軟件對話窗口等界面進行輸出:

image-20240910165630286

可以看到對語音的識別非常準確,連標點符號也是。

除了支持無限時長語音的轉寫,作者在更新后,軟件現在還支持文件轉錄字幕。即在客戶端可以轉寫音視頻文件為 srt 字幕了,只需將音視頻文件拖動到客戶端 exe 上打開即可。大家感興趣的話,可以自行嘗試。

3. 異地遠程使用

此時,我們已經可以在本地的Windows系統電腦中使用CapsWriter-Offline進行語音轉文字了,但也僅能在本地局域網中的設備上使用,如果想在異地也能遠程使用在本地部署的工具應該怎么辦呢?

很簡單,只要在本地電腦上安裝一個cpolar內網穿透工具就能輕松實現公網環境遠程訪問內網部署的服務了,無需公網IP,也不用設置路由器那么麻煩,接下來就介紹一下如何安裝cpolar內網穿透!

3.1 內網穿透工具下載安裝

安裝cpolar步驟:

Cpolar官網地址: https://www.cpolar.com

點擊進入cpolar官網,點擊免費使用注冊一個賬號,并下載最新版本的Cpolar

img

登錄成功后,點擊下載Cpolar到本地并安裝(一路默認安裝即可)本教程選擇下載Windows版本。

image-20240319175308664

Cpolar安裝成功后,在瀏覽器上訪問http://localhost:9200,使用cpolar賬號登錄,登錄后即可看到Cpolar web 配置界面,結下來在web 管理界面配置即可。

img

3.2 配置公網地址

接下來配置一下修改CapsWriter-Offline客戶端文件需要用到的公網地址,

登錄后,點擊左側儀表盤的隧道管理——創建隧道,

創建一個 CapsWriter-Offline 的公網TCP地址隧道

  • 隧道名稱:可自定義命名,本例中使用123
  • 協議:選擇tcp
  • 本地地址:6016
  • 端口類型:選擇隨機臨時TCP端口
  • 地區:選擇China VIP

點擊創建

image-20240910170829126

隧道創建成功后,點擊左側的狀態——在線隧道列表,查看所生成的公網訪問地址,可以看到生成了tcp公網地址,復制即可。

image-20240910172519802

3.3 修改config文件

現在我們可以在異地使用另一臺Windows系統電腦,下載好CapsWriter-Offline軟件(無需下載模型文件)。

進入CapsWriter-Offline文件夾,使用vscode打開config文件對客戶端配置進行修改:

image-20240910171815011

我們需要對客戶端配置中的地址和端口進行修改,使用剛才cpolar生成的公網地址7.tcp.vip.cpolar.cn替換127.0.0.1,使用公網地址后的端口10906替換6016,保存文件即可。

image-20240910172026442

1725960417305

3.4 異地遠程訪問服務端

在本地電腦服務端(start_server)運行的前提下,現在使用這臺異地電腦雙擊打開客戶端(start_client),可以看到通過使用cpolar生成的公網地址異地也能遠程訪問本地服務端,使用它進行語音轉文字啦!

image-20240910173355703

小結

如果我們需要經常異地遠程訪問本地配置的服務,由于剛才創建的是隨機的公網地址,24小時會發生變化。可以把地址設置成固定的TCP地址,不僅能夠享受更多功能和更快的帶寬,而且不用每次都重新創建隧道來訪問,下面演示一下如何創建一個固定的tcp公網地址來解決這個問題。

4. 配置固定公網地址

我們接下來為CapsWriter-Offline配置固定的TCP公網地址,該地址不會變化,方便查看且無需每天重復修改訪問地址。

登錄cpolar官網,點擊左側的預留,選擇保留的TCP地址,地區選擇China VIP,填寫一個備注(自己能記住就行)點擊保留

image-20240910173831545

保留成功后復制這個tcp地址:

image-20240910173928682

返回登錄Cpolar web UI管理界面,點擊左側儀表盤的隧道管理——隧道列表,找到所要配置的隧道:123,點擊右側的編輯:

image-20240910174033107

修改隧道信息,將保留成功的二級子域名配置到隧道中

  • 端口類型:選擇固定TCP端口
  • 預留的TCP地址:填寫剛才保留成功的tcp地址:3.tcp.vip.cpolar.cn:12635

點擊更新(注意,點擊一次更新即可,不需要重復提交)

image-20240910174221000

4.1 修改config文件

然后我們需要再次對客戶端配置中的地址和端口進行修改,使用剛才配置的固定tcp公網地址3.tcp.vip.cpolar.cn替換7.tcp.vip.cpolar.cn,使用固定公網地址后的端口12635替換10906,保存文件即可。

image-20240910174459160

5. 固定tcp公網地址遠程訪問服務端

同樣在本地電腦服務端(start_server)運行的前提下,現在使用這臺異地電腦雙擊打開客戶端(start_client),現在就可以通過使用cpolar配置的固定tcp公網地址遠程訪問本地服務端使用它進行語音轉文字啦!不用每天修改公網地址,也能獲得更快的訪問速度。

891e7db64b7693d85f1ae5d0e056ef7

希望這篇文章能幫助你更好地了解CapsWriter-Offline的強大功能以及它與cpolar內網穿透技術結合后的無限可能。如果你對這款工具感興趣或者有任何疑問,歡迎在評論區留言交流哦!別忘了分享給你的朋友們,讓他們也一起來體驗這種高效便捷的工作方式吧!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/894792.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/894792.shtml
英文地址,請注明出處:http://en.pswp.cn/news/894792.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用 Python 編程語言來實現機器學習小項目教程案例

以下是一個簡單的機器學習小項目教程案例,使用 Python 編程語言和 Scikit-learn 庫來實現一個分類任務。我們將使用經典的鳶尾花(Iris)數據集來訓練一個分類器,預測鳶尾花的種類。 項目目標 使用機器學習算法對鳶尾花數據集進行分類,預測鳶尾花的類別(Setosa、Versicolor…

DKG(Distributed Key Generation)協議

一、DKG是什么 DKG(分布式密鑰生成)提供了一種去中心化的方法,使各個參與方在不相互信任的情況下生成共享密鑰,以確保安全通信和多方參與的機密性。 DKG技術的關鍵思想是使用多方計算(secure multiparty computation)和秘鑰共享(secret sharing)的概念。 秘鑰共享 則…

十二、Docker Compose 部署 SpringCloudAlibaba 微服務

一、部署基礎服務 0、項目部署結構 項目目錄結構如下: /home/zhzl_hebei/ ├── docker-compose.yml └── geochance-auth/└── Dockerfile└── geochance-auth.jar └── geochance-system/└── Dockerfile└── geochance-system.jar └── geochance-gateway/…

使用 Docker(Podman) 部署 MongoDB 數據庫及使用詳解

在現代開發環境中,容器化技術(如 Docker 和 Podman)已成為部署和管理應用程序的標準方式。本文將詳細介紹如何使用 Podman/Docker 部署 MongoDB 數據庫,并確保其他應用程序容器能夠通過 Docker 網絡成功連接到 MongoDB。我們將逐步…

Games104——游戲引擎Gameplay玩法系統:基礎AI

這里寫目錄標題 尋路/導航系統NavigationWalkable AreaWaypoint NetworkGridNavigation Mesh(尋路網格)Sparse Voxel Octree Path FindingDijkstra Algorithm迪杰斯特拉算法A Star(A*算法) Path Smoothing Steering系統Crowd Simu…

Win11非虛擬機安裝ISE14.7

官網下載6.18GB 的 Full Installer for Windows 7/XP/Server解壓后運行安裝程序不勾選Enable WebTalk to send software, IP ...安裝程序卡死在ISE:Configure WebTalk,此時打開任務管理器,在詳情中找到xwebtalk,右鍵結束任務。安裝程序繼續進…

從0開始達芬奇(3.8)

剪視頻有主次之分,主就是Aroll,次就是Broll。 智能媒體夾: 媒體池的智能媒體夾部分可以很好區分主次。這個相當于智能搜索,當有大量的素材時,可以為這些素材標明信息,下次使用不需要反復看,直…

【Elasticsearch】parent aggregation

在Elasticsearch中,Parent Aggregation是一種特殊的單桶聚合,用于選擇具有指定類型的父文檔,這些類型是通過一個join字段定義的。以下是關于Parent Aggregation的詳細介紹: 1.基本概念 Parent Aggregation是一種聚合操作&#x…

自學Java-面向對象編程入門

自學Java-面向對象編程入門 一、靜態方法的注意事項二、簡易版電影信息展示系統1、測試類2、電影類3、電影操作類 一、靜態方法的注意事項 1、靜態方法中可以直接訪問靜態成員,不可以直接訪問實例成員 2、實例方法中既可以直接訪問靜態成員,也可以直接訪…

python算法和數據結構刷題[3]:哈希表、滑動窗口、雙指針、回溯算法、貪心算法

回溯算法 「所有可能的結果」,而不是「結果的個數」,一般情況下,我們就知道需要暴力搜索所有的可行解了,可以用「回溯法」。 回溯算法關鍵在于:不合適就退回上一步。在回溯算法中,遞歸用于深入到所有可能的分支&…

【自學筆記】Python的基礎知識點總覽-持續更新

提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 文章目錄 Python基礎知識總覽1. Python簡介2. 安裝與環境配置3. 基本語法3.1 變量與數據類型3.2 控制結構3.3 函數與模塊3.4 文件操作 4. 面向對象編程(OOP&#…

文件上傳到騰訊云存儲、簽名及設置過期時間

將文件上傳到騰訊云對象存儲(COS,Cloud Object Storage)可以通過騰訊云提供的 SDK 實現。以下是詳細的步驟和示例代碼,幫助您完成文件上傳操作。 步驟 注冊騰訊云賬號并創建存儲桶: (1)登錄騰訊…

基于Java(SpringBoot)+MySQL+Vue實現的平行志愿錄取系統

基于spring bootvue實現的平行志愿錄取系統 1.項目簡介 這兩天干上高考出成績,有不少親戚家的孩子今年高考,和我詢問關于報志愿的問題。老家河北今年是采用所謂的平行志愿。我看了很多的資料才明白什么叫所謂的“平行志愿”。 整個流程好像很是復雜。…

chrome瀏覽器chromedriver下載

chromedriver 下載地址 https://googlechromelabs.github.io/chrome-for-testing/ 上面的鏈接有和當前發布的chrome瀏覽器版本相近的chromedriver 實際使用感受 chrome瀏覽器會自動更新,可以去下載最新的chromedriver使用,自動化中使用新的chromedr…

Redis常見數據類型與編碼方式

??前言?? 本小節圍繞Redis中常見的數據類型與編碼方式展開。 🍉歡迎點贊 👍 收藏 ?留言評論 🍉博主將持續更新學習記錄收獲,友友們有任何問題可以在評論區留言 🍉博客中涉及源碼及博主日常練習代碼均已上傳GitHu…

win編譯openssl

一、perl執行腳本 1、安裝perl腳本 perl安裝 2、配置perl腳本 perl Configure VC-WIN32 no-asm no-shared --prefixE:\openssl-x.x.x\install二、編譯openssl 1、使用vs工具編譯nmake 如果使用命令行nmake編譯會提示“無法打開包括文件: “limits.h”“ 等錯誤信息 所以…

【Kubernetes Pod間通信-第2篇】使用BGP實現Pod到Pod的通信

Kubernetes中Pod間的通信 本系列文章共3篇: 【Kubernetes Pod間通信-第1篇】在單個子網中使用underlay網絡實現Pod到Pod的通信【Kubernetes Pod間通信-第2篇】使用BGP實現Pod到Pod的通信(本文介紹)【Kubernetes Pod間通信-第3篇】Kubernetes中Pod與ClusterIP服務之間的通信…

< 自用文兒 > 下載 MaxMind GeoIP Databases 對攻擊的 IP 做 地理分析

起因 兩個 VPM/VPS,安裝了 fail2ban 去攔截密碼窮舉攻擊。每天的記錄都在增長,以前復制屏幕輸出就行,一屏的內容還容易粘貼出來的。昨天已經過 500 條,好奇 fail2ban 是如何存儲這些內容的?就發現它在使用 SQLite3 數…

SpringCloudGateWay和Sentinel結合做黑白名單來源控制

假設我們的分布式項目,admin是8087,gateway是8088,consumer是8086 我們一般的思路是我們的請求必須經過我們的網關8088然后網關轉發到我們的分布式項目,那我要是沒有處理我們繞過網關直接訪問項目8087和8086不也是可以&#xff1…

C#面試常考隨筆12:游戲開發中常用的設計模式【C#面試題(中級篇)補充】

C#面試題(中級篇),詳細講解,幫助你深刻理解,拒絕背話術!-CSDN博客 簡單工廠模式 優點: 根據條件有工廠類直接創建具體的產品 客戶端無需知道具體的對象名字,可以通過配置文件創建…