麥克風和電腦內播放聲音實時識別轉文字軟件FunASR整合包V5下載

我基于FunASR制作的實時語音識別轉文字軟件當前更新到V5版本。軟件可以實時識別麥克風聲音和電腦內播放聲音轉為文字。

FunASR軟件介紹

FunASR 是一款基礎語音識別工具包和開源 SOTA 預訓練模型,支持語音識別、語音活動檢測、文本后處理等。

我使用FunASR制作了一款實時語音識別轉文字軟件,當前版本為V4版本,由于前幾天分享過另一個音視頻識別轉文字軟件faster-whisper《音頻視頻轉文字軟件faster-whisper 1.1.1整合包下載,精準快速語音轉錄工具》,那個軟件已經很好用了,所以當前軟件版本我刪除了文件識別功能,只保留了實時語音識別功能。

FunASR在2月5日剛更新過,我基于最新版制作了當前版本實時語音識別軟件整合包

如果需要同時有識別文件和實時識別功能的話,請用V3版本,鏈接《實時語音識別轉文字軟件V3版,批量音頻視頻錄音轉文字提取工具》

FunASR實時語音識別整合包V5軟件使用說明

軟件下載解壓后直接雙擊【啟動軟件.exe】即可啟動。軟件操作界面比較簡單

首先選擇識別內容保存位置,識別結果輸出文件格式為txt

塊長度和上下文長度決定了最終的識別效果,塊長度值越大,相同語速下每段識別出的內容的字數越多,上下文長度值建議是塊長度值的1/2,這兩個值越大,識別出的文字內容越準確,但是延遲也越高,這個可以自行測試效果,選擇合適的值

音量閾值就是用于屏蔽低音噪音的,如果說話人環境比較嘈雜,可以設置該值,屏蔽掉低音噪音部分,值越大,屏蔽的聲音分貝越高,也就是屏蔽的聲音越多

翻譯工具國內用戶用百度,國外用戶用谷歌,免費申請百度翻譯API可以查看下面教程《最新百度翻譯api免費申請AppId和AppSecret流程,每月免費100萬字符》

如果你想翻譯成的目標語言在列表里沒有,可自行設置語言代碼,百度翻譯和Google翻譯語言代碼參考下面文章《百度翻譯谷歌翻譯API語言代碼名稱對照表》,將所需要的語言代碼填入目標語言輸入框里即可

由于軟件是收集一定長度的識別文本之后再將文本提交到翻譯工具進行翻譯,然后收到返回翻譯結果再進行顯示,所以翻譯文本和識別的文本有時間差,不會同步顯示

待翻譯文本長度的意思就是一次性提交給翻譯工具的文本長度,軟件并不是每次識別出內容之后都提交給翻譯工具的,而是收集到一定長度的文本內容之后再發送給翻譯工具進行翻譯。發送給翻譯工具的文本越短,翻譯結果越不準確,發送的文本越長,翻譯工具越能綜合上下文意思翻譯的更準確,但是收集的文本越長等待時間也就越長,可自行取舍。一個英文字母算一個字符,一個漢字也算一個字符,如果是類似英語語言這個值建議大一點

軟件支持識別電腦內播放的聲音或是麥克風等外部輸入的聲音。如果需要識別電腦內播放的聲音,需要先進行電腦設置,鼠標右鍵點擊電腦屏幕右下角音量喇叭圖標,選擇 【聲音】,點擊錄制選項卡,鼠標右鍵點擊【立體聲混音】,選擇【設置為默認設備】,如果立體聲混音沒啟動的話,需要先啟用,然后運行軟件開始處理,就可以實時識別電腦播放聲音了。

如果想同時接收麥克風聲音和電腦內播放聲音,可在軟件音頻源中選擇電腦播放聲音,電腦聲音設置里-錄制-麥克風,點擊鼠標右鍵,選擇麥克風屬性,勾選【偵聽此設備】

字幕文本顯示長度就是前端實時顯示語音識別出的文本的字幕字符長度

如果無法使用的話,可以勾選顯示調試窗口查看報錯信息

軟件使用視頻教程:電腦實時語音識別轉文本工具FunASR整合包視頻使用教程-諾瓦小站

注意事項

本軟件只支持識別中英文,不支持識別其它語言

軟件運行路徑中不要出現中文及空格,否則會報錯

軟件只支持win10或win11,不支持其他版本Windows系統,也不支持手機和MAC

有部分Win11用戶發現軟件無法檢測到音頻,也就是電腦立體聲混音沒有音頻輸入,可以安裝voicemeeter虛擬聲卡解決。在【1 HARDWARE INPUT】設置硬件聲音輸入設備,在【VIRTUAL INPUT】選中【B】,在【HARDWARE OUT】選擇聲音輸出設備,然后打開電腦系統-聲音-錄制,將默認設備選擇為VoiceMeeter VAIO3 Output,VoiceMeeter點擊下載>>

電腦實時語音識別轉文字軟件V5版本下載鏈接

麥克風電腦內播放聲音實時識別轉文字軟件FunASR整合包V5下載-諾瓦小站

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/85385.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/85385.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/85385.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

子串題解——和為 K 的子數組【LeetCode】

謹記: 數組不是單調的話,不要用滑動窗口,考慮用前綴和 寫法一:兩次遍歷 代碼的核心思想是通過 前綴和 和 哈希表 來高效地統計符合條件的子數組個數。具體步驟如下: 計算前綴和數組 s: s[i] 表示 nums 的前…

硬件服務器基礎

1、硬件服務器基礎 2、服務器后面板 3、組件 3.1 CPU 3.2 內存 3.3 硬盤 3.4 風扇 4、服務器品牌 4.1 配置 4.2 CPU 架構 4.2.1 CPU 命名規則 4.2.2 服務器 CPU 和家用 CPU 的區別 4.2.3 CPU 在主板的位置 4.2.4 常見 CPU 安裝方式 4.3 內存中組件 4.3.1 內存的分類 4.3.1.1 …

OpenWebUI(1)源碼學習構建

1. 前言 通過docker鏡像拉取安裝就不介紹了,官方的命令很多。本節主要擼一擼源碼,所以,本地構建 2. 技術框架和啟動環境 后端python,前端svelte 環境要求:python > 3.11 ,Node.js > 20.10 3. 源…

三方接口設計注意事項

前言 隨著業務系統間集成需求的增加,三方接口設計已成為現代軟件架構中的關鍵環節。一個設計良好的三方接口不僅能夠提供穩定可靠的服務,還能確保數據安全、提升系統性能并支持業務的持續發展。 一、設計原則 1. 統一接口原則 三方接口設計應遵循統一…

CSS篇-5

1. 內聯元素可以實現浮動嗎? 是的,內聯元素完全可以實現浮動。在 CSS 中,任何元素都可以被設置為浮動(float)。 當一個元素被設置了 float 屬性后,無論它本身是塊級元素還是內聯元素,它都會表現出類似于塊級元素的特性: 生成塊級框(Block-level box):浮動元素會生…

RocketMQ 學習

消息隊列 參考官方文檔:https://rocketmq.apache.org/zh/docs/ 基本概念 主題(Topic):是消息傳輸和消息存儲的頂級容器,不是實際的消息容器,而是一個邏輯上的概念,用于區分不同業務消息的標識&…

Conda更換鏡像源教程:加速Python包下載

Conda更換鏡像源教程:加速Python包下載 為什么要更換conda鏡像源? Conda作為Python的包管理和環境管理工具,默認使用的是國外鏡像源,在國內下載速度往往較慢。通過更換為國內鏡像源,可以顯著提高包下載速度&#xff…

PCIe—TS1/TS2 之Polling.Active(一)

前文 訓練序列有序集用于比特對齊、符號對齊以及交換物理層參數。2.5GT/s和5GT/s速率時,訓練序列有序集不會加擾,只用8b/10b 編碼。但到8GT/s及以上速率時,采用128b/130b編碼,符號有可能加擾有可能不加擾,具體…

【HarmonyOS Next之旅】DevEco Studio使用指南(二十八) -> 開發云對象

目錄 1 -> 開發流程 2 -> 創建云對象 3 -> 開發云對象 4 -> 調試云對象 4.1 -> 前提條件 4.2 -> 通過本地調用方式調試云對象 4.3 -> 通過遠程調用方式調試云對象 5 -> 部署云對象 1 -> 開發流程 除去傳統的云函數,您還可在端云…

基于51單片機的音樂盒汽車喇叭調音量proteus仿真

地址: https://pan.baidu.com/s/1l3CSSMi4uMV5-XLefnKoSg 提取碼:1234 仿真圖: 芯片/模塊的特點: AT89C52/AT89C51簡介: AT89C51 是一款常用的 8 位單片機,由 Atmel 公司(現已被 Microchip 收…

實驗設計與分析(第6版,Montgomery)第5章析因設計引導5.7節思考題5.8 R語言解題

本文是實驗設計與分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅玨生譯) 第5章析因設計引導5.7節思考題5.8 R語言解題。主要涉及方差分析&#xff0c;正態假設檢驗&#xff0c;殘差分析&#xff0c;交互作用圖。 (a) dataframe<-data.frame( Lightc(580,568…

[藍橋杯]分考場

題目描述 nn 個人參加某項特殊考試。 為了公平&#xff0c;要求任何兩個認識的人不能分在同一個考場。 求是少需要分幾個考場才能滿足條件。 輸入描述 輸入格式&#xff1a; 第一行&#xff0c;一個整數 nn (1≤n≤1001≤n≤100)&#xff0c;表示參加考試的人數。 第二行…

C++: STL簡介與string類核心技術解析及其模擬實現

目錄: 一.STL二.string類一、創建對象的6種構造方式二、常用接口解析1. 容量操作2. 元素訪問3. 修改操作4. 字符串操作 三.string模擬實現一、設計基礎&#xff1a;類結構與資源管理二、拷貝控制&#xff1a;深拷貝的三種實現1. 傳統深拷貝2. 現代寫法&#xff08;推薦&#xf…

Python進階【四】:XML和JSON文件處理

Python提供了多種處理XML和JSON文件的方式&#xff0c;讓我們來看看最常用的方法。 一、處理JSON文件 JSON在Python中處理起來非常簡單&#xff0c;因為它的結構與Python的字典(dict)和列表(list)幾乎一致。 常用模塊&#xff1a;json模塊 優點&#xff1a;Python標準庫自帶…

Golang | 搜索哨兵-對接分布式gRPC服務

哨兵&#xff08;centennial&#xff09;負責接待客人&#xff0c;直接與調用方對接。哨兵的核心組件包括service HUB和connection pool。service HUB用于與服務中心通信&#xff0c;獲取可提供服務的節點信息。connection pool用于緩存與index worker的連接&#xff0c;避免每…

CSS3實現的賬號密碼輸入框提示效果

以下是通過CSS3實現輸入框提示效果的常用方法&#xff0c;包含浮動標簽和動態提示兩種經典實現方案&#xff1a; 一、浮動標簽效果 <div class"input-group"><input type"text" required><label>用戶名</label> </div><…

maven編譯時跳過test過程

如果代碼里有無法在打包環境中測試的部分&#xff0c;則直接運行mvn clean package&#xff0c;因為測試失敗&#xff0c;會導致打包失敗。目前有兩種方式可以跳過測試&#xff1a; 1. mvn clean package -DskipTests&#xff0c;這會跳過執行階須&#xff0c;但仍會生成測試所…

美業+智能體,解鎖行業轉化新密碼(2/6)

摘要&#xff1a;中國美業市場近年蓬勃發展&#xff0c;規模持續擴大&#xff0c;預計不久將突破萬億級別&#xff0c;但同時也面臨著諸多挑戰&#xff0c;如獲客成本攀升、服務質量不穩定、難以滿足消費者多元化個性化需求等。智能體技術的出現為美業帶來了新的發展機遇&#…

設計模式——責任鏈設計模式(行為型)

摘要 責任鏈設計模式是一種行為型設計模式&#xff0c;旨在將請求的發送者與接收者解耦&#xff0c;通過多個處理器對象按鏈式結構依次處理請求&#xff0c;直到某個處理器處理為止。它包含抽象處理者、具體處理者和客戶端等核心角色。該模式適用于多個對象可能處理請求的場景…

react/vue移動端項目,刷新頁面404的原因以及解決辦法

一 、 項目 移動端 二、背景 1、問題描述&#xff1a;react/vue移動端項目&#xff0c;正常的頁面操作跳轉&#xff0c;不會出現404的問題&#xff0c;但是一旦刷新&#xff0c;就會出現404報錯 2、產生原因&#xff1a; React Router是客戶端的路由&#xff0c;當再次刷新時…