FunASR的Java實現Paraformer實時語音識別 | 一款無需聯網的本地實時字幕軟件

0. 開發背景

我們在看直播時,沒有視頻字幕,可能看慣了視頻字幕,來到直播中缺少字幕會感覺不習慣,特別是對于聽力障礙的人群,只能依賴于字幕,那么這個軟件可以解決直播,在線會議等場景中無字幕的情況。此外,我們還可以用于人機交互中,以及智能呼叫中心系統中(實時語音質檢)。因此,開發一款可以運行在普通CPU中的實時字幕軟件很有必要。

1. 使用技術棧

該軟件使用JavaFX開發,為何是使用Java來開發桌面應用軟件,因此作者我熟悉Java,對于其它開發語言沒那么熟悉,所以選擇了Java作為開發語言。
為了能夠在內網或者是斷開網絡的情況下使用,這里不是調用云API方式實現,而是采用了本地電腦算力進行推理,并且不要求使用GPU,只需普通的CPU就可以進行實時語音識別,同時占用的資源很低。
模型采用國內大廠阿里巴巴達摩院開源的Paraformer-Streaming流式模型,導出為onnx格式,然后使用onnxruntime推理框架來推理。可以對模型進行int8規格的量化,使得占用的資源更少,推理的速度更快,關鍵是量化后模型精度基本不受影響。

2. 功能介紹

具體功能:

  1. 可以背景顏色透明,防止遮擋其它窗口。當鼠標停留在上面時,會顯示半透明狀態,方便用戶設置軟件。
  2. 可以設置顯示的字體大小和字體顏色。
  3. 可以拖動顯示的位置,默認在主屏幕的下方居中顯示,如果你還有副屏,可以把字體顯示拖動到副屏中。

3. 軟件效果演示

Java開發的實時語音識別項目 | 實時語音識別 | 內網可用實時語音識別項目 | 開源的實時語音識別模型 | FunASR

4. 其它

項目已經開源,點擊這里訪問項目源碼,如果無法訪問,可以點擊這里。
博客:點擊這里。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/95629.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/95629.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/95629.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

從機器學習的角度實現 excel 中趨勢線:揭秘梯度下降過程

1. 引言:Excel 的“一鍵魔法”背后藏著什么智慧?在 Excel 中,我們只需右鍵 → 添加趨勢線,一條完美的直線就出現了。它快得像魔法,但魔法背后,是數學的嚴謹。今天,我們不關心 Excel 內部用了什么…

關于上拉電阻

上拉電阻的作用:輔助浮空狀態輸出高電平 其實就是確定這根線的電平,不能讓他處于一種未知的狀態。 其次也可以起到限制電流的作用,防止損壞原件 那么上拉電阻如何取值? 首先來看一下驅動能力。 因為線上是一定有寄生電容的&am…

PiscCode構建Mediapipe 手勢識別“剪刀石頭布”小游戲

在計算機視覺與人機交互領域,手勢識別是一個非常有趣的應用場景。本文將帶你用 Mediapipe 和 Python 實現一個基于攝像頭的手勢識別“剪刀石頭布”小游戲,并展示實時手勢與游戲結果。 1. 項目概述 該小游戲能夠實現: 實時檢測手勢&#xff0…

【VoNR】VoNR 不等于 VoLTE on 5G

博主未授權任何人或組織機構轉載博主任何原創文章,感謝各位對原創的支持! 博主鏈接 本人就職于國際知名終端廠商,負責modem芯片研發。 在5G早期負責終端數據業務層、核心網相關的開發工作,目前牽頭6G技術研究。 博客內容主要圍繞…

計算機網絡:網絡設備在OSI七層模型中的工作層次和傳輸協議

OSI七層模型(物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層、應用層)中,不同網絡設備因功能不同,工作在不同層次。以下是典型網絡設備的工作層次及核心功能:1. 物理層(第1層) 核心功能&a…

RSA-e和phi不互素

1.題目import gmpy2 import libnum p 1656713884642828937525841253265560295123546793973683682208576533764344166170780019002774068042673556637515136828403375582169041170690082676778939857272304925933251736030429644277439899845034340194709105071151095131704526…

基于單片機蒸汽壓力檢測/蒸汽余熱回收

傳送門 👉👉👉👉單片機作品題目速選一覽表🚀 👉👉👉👉單片機作品題目功能速覽🚀 🔥更多文章戳👉小新單片機-CSDN博客&#x1f68…

https 協議與 wss 協議有什么不同

HTTPS 是用于網頁數據傳輸的安全協議,而 WSS 是用于實時雙向通信(如聊天、直播)的安全協議,二者的設計目標、應用場景、底層邏輯均存在本質區別。以下從 7 個核心維度展開對比,并補充關鍵關聯知識,幫助徹底…

主流分布式數據庫集群選型指南

以下是關于主流分布式可擴展數據庫集群的詳細解析,涵蓋技術分類、代表產品及適用場景,幫助您高效選型:一、分布式數據庫核心分類 1. NewSQL 數據庫(強一致性 分布式事務)產品開發方核心特性適用場景TiDBPingCAPHTAP架…

#T1359. 圍成面積

題目描述編程計算由“*”號圍成的下列圖形的面積。面積計算方法是統計*號所圍成的閉合曲線中水平線和垂直線交點的數目。如下圖所示,在1010的二維數組中,有“*”圍住了15個點,因此面積為15。輸入1010的圖形。輸出輸出面積。樣例輸入數據 10 0…

Hive on Tez/Spark 執行引擎對比與優化

在大數據開發中,Hive 已經成為最常用的數據倉庫工具之一。隨著業務數據規模的不斷擴大,Hive 默認的 MapReduce 執行引擎 顯得笨重低效。為了提升查詢性能,Hive 支持了 Tez 和 Spark 作為底層執行引擎。本文將帶你對比 Hive on Tez 與 Hive on Spark 的區別,并分享調優經驗。…

深入理解 Next.js 的路由機制

深入理解 Next.js 的路由機制 作者:碼力無邊在上一篇文章中,我們成功創建并運行了第一個 Next.js 應用。當你打開項目文件夾時,你可能會注意到一個名為 pages 的目錄。這個目錄看似普通,但它卻是 Next.js 路由系統的核心。今天&am…

modbus_tcp和modbus_rtu對比移植AT-socket,modbus_tcp雜記

modbus_rtu通信時沒有連接過程&#xff0c;主機和從機各自初始化自身串口就行了&#xff0c;而rtu需要確定從機ID。注:在TCP連接中&#xff0c;不同的網卡有不同的IP&#xff0c;port對應具體的程序。/* 先讀取數據 */for (i 0; i < len; i){if (pdPASS ! xQueueReceive(re…

Docker Compose 詳解:從安裝到使用的完整指南

在現代容器化應用開發中&#xff0c;Docker Compose 是一個不可或缺的工具&#xff0c;它能夠幫助我們輕松定義和運行多容器的 Docker 應用程序。 一、什么是 Docker Compose&#xff1f; Docker Compose 是 Docker 官方提供的一個工具&#xff0c;用于定義和運行多容器 Dock…

springboot配置多數據源(mysql、hive)

MyBatis-Plus 不能也不建議同時去“控制” Hive。它從設計到實現都假定底層是 支持事務、支持標準 SQL 方言 的 關系型數據庫&#xff08;MySQL、PostgreSQL、Oracle、SQL Server 等&#xff09;&#xff0c;而 Hive 兩者都不完全符合。如果操作兩個數據源都是mysql或者和關系數…

2025年上海市星光計劃第十一屆職業院校技能大賽高職組“信息安全管理與評估”賽項交換部分前6題詳解(僅供參考)

1.北京總公司和南京分公司有兩條裸纖采用了骨干鏈路配置,做必要的配置,只允許必要的Vlan 通過,不允許其他 Vlan 信息通過包含 Vlan1,禁止使用 trunk鏈路。 骨干鏈路位置??:總公司 SW 與分公司 AC 之間的兩條物理鏈路(Ethernet 1/0/5-6 必要 VLAN??: ?總公司:Vlan…

學習nginx location ~ .*.(js|css)?$語法規則

引言 nginx作為一款高性能的Web服務和反向代理服務&#xff0c;在網站性能優化中扮演著重要的角色。其中&#xff0c;location指令的正確配置是優化工作的關鍵之一。 這篇記錄主要解析location ~ .*\.(js|css)?$這一特定的語法規則&#xff0c;幫助大家理解其在nginx配置中的…

Nmap網絡掃描工具詳細使用教程

目錄 Nmap 主要功能 網絡存活主機發現 (ARP Ping Scan) 綜合信息收集掃描 (Stealth SYN Service OS) 全端口掃描 (Full Port Scan) NSE 漏洞腳本掃描 SMB 信息枚舉 HTTP 服務深度枚舉 SSH 安全審計 隱蔽掃描與防火墻規避 Nmap 主要功能 Nmap 主要有以下幾個核心功能…

Spring Boot 3.x 的 @EnableAsync應用實例

語法結構使用 EnableAsync 其實就像為你的應用穿上一件時尚的外套&#xff0c;簡單又高效&#xff01;只需在你的配置類上添加這個注解&#xff0c;輕松開啟異步之旅。代碼如下&#xff1a;想象一下&#xff0c;你的應用一瞬間變得靈活無比&#xff0c;像一個跳舞的機器人&…

Nginx Tomcat Jar包開機啟動自動配置

一、Nginx配置1、創建systemd nginx 服務文件vi /usr/lib/systemd/system/nginx.service### 內容[Unit] DescriptionThe nginx HTTP and reverse proxy server Afternetwork.target[Service] Typeforking ExecStartPre/mnt/nginx/sbin/nginx -t ExecStart/mnt/nginx/sbin/nginx…