中文語音標注工具FunASR(語音識別)

全稱?A Fundamental End-to-End Speech Recognition Toolkit(一個語音識別工具)

可能大家用過whisper(openAi),它【標注英語的確很完美】,【但中文會出現標注錯誤】或搞了個沒說的詞替換上去,所以要人工核對,麻煩。

FunASR作用:能【準確】識別語音,并轉成【文字、標出聲調】


他的原理,就不講了,俺是搞大數據的,python這東西就勉強能寫個爬蟲和接口,機器學習和ai相關的算法是0基礎。


直接實戰吧

首先,沖他這句話,我要給他點個贊!!!很是感動。

分2個步驟,安裝和模型

安裝:

目前只支持cpu方式(等gpu版本出來了,那速度更上一層樓)

我們這里是用作標注,標注是對每一句進行標注,所以很,就【采用實時模型】。

ps:離線的模型太牛了,可以一次性標注幾十小時的,感覺適合翻譯有聲閱讀,感覺應用場景比較少

中文實時語音聽寫服務CPU版本部署

docker安裝,不是我吹,docker是目前世界上最好的部署方法。

我建了一個文件夾fun_asr_docker_service 所有的命令默認都在這個文件夾下操作

有docker的同學-可以忽略下面這個

1.安裝docker(可以忽略)
curl -O https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/shell/install_docker.sh
sudo bash install_docker.sh
2.啟動docker鏡像

拉取鏡像(大概將近4GB)

sudo docker pull \registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.5

名字挺長的,改個名

sudo docker tag registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-online-cpu-0.1.5 fun_asr

建立模型文件夾(對項目不熟悉的新手別亂改名哈--這個是阿里教程里的

mkdir -p ./funasr-runtime-resources/models

啟動鏡像(命令會進去鏡像里面)

sudo docker run -p 10096:10095 -it --privileged=true \-v $PWD/funasr-runtime-resources/models:/workspace/models \fun_asr
3.啟動服務

然后在docker鏡像里面執行

cd FunASR/runtime
nohup bash run_server_2pass.sh \--download-model-dir /workspace/models \--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \--model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx ?\--online-model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx ?\--punc-dir damo/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx \--itn-dir thuduj12/fst_itn_zh \--certfile 0 \--hotword /workspace/models/hotwords.txt > log.out 2>&1 &
服務參數說明(具體是啥意思,看這個表)
# 如果您想關閉ssl,增加參數:--certfile 0
# 如果您想使用時間戳或者nn熱詞模型進行部署,請設置--model-dir為對應模型:
#   damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx(時間戳)
#   damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx(nn熱詞)
# 如果您想在服務端加載熱詞,請在宿主機文件./funasr-runtime-resources/models/hotwords.txt配置熱詞(docker映射地址為/workspace/models/hotwords.txt):
#   每行一個熱詞,格式(熱詞 權重):阿里巴巴 20
--download-model-dir 模型下載地址,通過設置model ID從Modelscope下載模型
--model-dir  modelscope model ID 或者 本地模型路徑
--online-model-dir  modelscope model ID 或者 本地模型路徑
--quantize  True為量化ASR模型,False為非量化ASR模型,默認是True
--vad-dir  modelscope model ID 或者 本地模型路徑
--vad-quant   True為量化VAD模型,False為非量化VAD模型,默認是True
--punc-dir  modelscope model ID 或者 本地模型路徑
--punc-quant   True為量化PUNC模型,False為非量化PUNC模型,默認是True
--itn-dir modelscope model ID 或者 本地模型路徑
--port  服務端監聽的端口號,默認為 10095
--decoder-thread-num  服務端線程池個數(支持的最大并發路數),腳本會根據服務器線程數自動配置decoder-thread-num、io-thread-num
--io-thread-num  服務端啟動的IO線程數
--model-thread-num  每路識別的內部線程數(控制ONNX模型的并行),默認為 1,其中建議 decoder-thread-num*model-thread-num 等于總線程數
--certfile  ssl的證書文件,默認為:../../../ssl_key/server.crt,如果需要關閉ssl,參數設置為0
--keyfile   ssl的密鑰文件,默認為:../../../ssl_key/server.key
--hotword   熱詞文件路徑,每行一個熱詞,格式:熱詞 權重(例如:阿里巴巴 20),如果客戶端提供熱詞,則與客戶端提供的熱詞合并一起使用,服務端熱詞全局生效,客戶端熱詞只針對對應客戶端生效。

啟動成功

4.客戶端測試

下載測試的打包文件(這里面包含了所有的客戶端demo源文件)

wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/sample/funasr_samples.tar.gz

瀏覽器測試

其他測試demo方法參考:

https://github.com/alibaba-damo-academy/FunASR/blob/main/runtime/docs/SDK_tutorial_online_zh.md#html-client

模型:

中文模型有【2個常用】

paraformer-zh(非實時,會生成時間戳)

paraformer-zh-online(實時,不會生成時間戳)

參考:

GitHub - alibaba-damo-academy/FunASR: A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models.

阿里達摩院開源大型端到端語音識別工具包FunASR | 彌合學術與工業應用之間的差距 - 知乎

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/214041.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/214041.shtml
英文地址,請注明出處:http://en.pswp.cn/news/214041.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Fiddler】IDEA配置Fiddler

由于遇上了個迷之請求,接口調用正常,OkHttpClient調用正常,RestTemplate調用失敗,所以想看看發送的報文是怎樣的,所以就下了個Fiddler 問題 下載安裝,以及如何安裝證書,網上太多相同文章了&…

APP備案,最新獲取安卓簽名文件中MD5等信息方法

1.通過簽名文件獲取SHA1和SHA256 直接通過cmd執行命令 keytool -list -v -keystore xxxxx/xxx/xx/xxx.keystore輸入后回車會提示輸入密碼庫口令,直接輸入Keystore密碼(輸入過程中終端上不會顯示,輸完回車就行) 2.獲取md5 由于…

redis集群(cluster)筆記

1. 定義: 由于數據量過大,單個Master復制集難以承擔,因此需要對多個復制集進行集群,形成水平擴展每個復制集只負責存儲整個數據集的一部分,這就是Redis的集群,其作用是提供在多個Redis節點間共享數據的程序…

IDEA啟動失敗報錯解決思路

IDEA啟動失敗報錯解決思路 背景:在IDEA里安裝插件失敗,重啟后直接進不去了,然后分析問題解決問題的過程記錄下來。方便下次遇到快速解決。也是一種解決問題的思路,分享出去。 啟動報錯信息 Internal error. Please refer to https…

加索引后 sql loader-951

加索引后 sql loader-951 現象解決過程最終解決 現象 之前使用sqlldr正常,加表索引后使用sqlldr時 報錯 SQL Loader-951 解決過程 百度,說可能是鎖表(或者表未提交) 查看沒有對應未commit數據,且沒有鎖表。查看對應…

【筆記 Python 01】基本數據類型、基本類型

文章目錄 類型是否可轉換基本類型匯總集合 set【創建】【添加元素】【刪除】【清空】【差集】【交集】【并集】【update 批量更新】【set → numpy】 元組 tuple ()【描述】【優點】【元組的創建】【元組的插入】【刪除元組】 字典 dict {}【創建空列表】【創建列表】【字典的獲…

ke14--10章-1數據庫JDBC介紹

注冊數據庫(兩種方式),獲取連接,通過Connection對象獲取Statement對象,使用Statement執行SQL語句。操作ResultSet結果集 ,回收數據庫資源. 需要語句: 1Class.forName("DriverName");2Connection conn DriverManager.getConnection(String url, String user, String…

抖音各加密參數說明和獲取(含代碼)

?X-Bogus:X-Bogus是一種防數據包偽造的一個參數, 又稱為x偽造,主要用于反爬蟲,這個是某節公司下面基礎服務,這個反爬蟲機制幾乎用在了它所有的產品中,不過,只要是能正常使用,這些東…

什么是Non EC

今天在填一個表單時,里面有個Non EC的選項,不解其意。原來是歐盟成員國國民的意思,因為歐盟法規各方面比較嚴厲,所以會單列出來,作為一個條件。 互聯網查詢結果如下: Non-EC是指非歐盟(EU&#…

PHP基礎 - 常量字符串

常量 在PHP中,常量是一個簡單值的標識符,定義后默認是全局變量,可以在整個運行的腳本的任何地方使用。常量由英文字母、下劃線和數字組成,但數字不能作為首字母出現。 PHP中定義常量的方式是使用define()函數,其語法如下: bool define( string $name, mixed $value [,…

使用人工智能優化常見業務流程

在現代商業環境中,人工智能(AI)正在改變企業的運營方式。將人工智能集成到業務流程中可以提高效率和準確性,從而節省大量時間和成本。 這使員工能夠專注于更具戰略性的任務。人工智能在商業中的應用范圍從自動化日常任務到提供高級分析,以做…

【mysql-5.7.26-1.el7.x86_64.rpm-bundle.tar安裝】linux安裝mysql5.7

之前安裝的時候遇到了很多問題,浪費了一些時間。整理出這份教程,照著做基本一遍過。 這是安裝包: 鏈接:https://pan.baidu.com/s/1gBuQBjA4R5qRYZKPKN3uXw?pwd1nuz 1.下載安裝包,上傳到linux。我這里就放到downloads目錄下面…

郵政快遞單號查詢入口,刪除不需要的單號

批量查詢郵政快遞單號的物流信息,并刪除不需要的單號。 所需工具: 一個【快遞批量查詢高手】軟件 郵政快遞單號若干 操作步驟: 步驟1:運行【快遞批量查詢高手】軟件,第一次使用的伙伴記得先注冊,然后登錄…

SimpleSQL

游戲和應用中的SQL集成 simpleSQL可將數據庫存儲集成到您的游戲或項目中。創建水平地圖鏈接,存儲球員的統計資料,保持庫存規格,以及更多! 請注意,simpleSQL是本地數據庫解決方案,不能連接到服務器數據庫 將SQLite數據庫附加到場景中的管理器 無需移動移動設備上的文件! 使…

LeetCode力扣每日一題(Java):20、有效的括號

一、題目 二、解題思路 1、我的思路 我看到題目之后&#xff0c;想著這可能是力扣里唯一一道我能秒殺的題目了 于是一波操作猛如虎寫出了如下代碼 public boolean isValid(String s) {char[] c s.toCharArray();for(int i0;i<c.length;i){switch (c[i]){case (:if(c[i]…

玩法題材創新的跑酷游戲,廣告變現不止帶來收益 | TopOn變現干貨

跑酷游戲是一類永不落伍的游戲。從遠古的紅白機到現代的PC、手機&#xff0c;經典作品層出不窮&#xff0c;而提起手機端的跑酷游戲&#xff0c;相信大部分玩家腦海里的第一印象便是《神廟逃亡》和《地鐵跑酷》這兩款經典游戲&#xff0c;在上躥下跳、左右挪移間躲避障礙&#…

2023年12月7日:QT實現登陸界面

#include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(parent) {//窗口設置this->resize(600,500);//重新設置窗口大小this->setWindowTitle("QQ-盜版");//設置窗口名為QQ-盜版this->setWindowIcon(QIcon("D:\\Qt\\funny\\pi…

VOS3000 在安裝AXB時需要幾個步驟

安裝 VOS3000 AXB 模板需要按照以下步驟進行操作&#xff1a; 首先&#xff0c;確保你已經在服務器上安裝了 CentOS 或者其他 Linux 操作系統&#xff0c;并且已經完成了基本的系統設置和網絡配置。 下載 VOS3000 軟件包&#xff0c;并解壓縮到服務器上的指定目錄中。 進入…

[虛擬機]使用VM打開虛擬機電腦重啟解決方案。

問題&#xff1a;打開虛擬機點擊啟動后&#xff0c;電腦會自動重啟。&#xff08;WINDOWS10 20版本&#xff09; 解決步驟&#xff1a; 1、對Windows功能進行操作。 上圖三個啟用。 上圖一個取消。 再次打開后&#xff0c;不報警&#xff0c;顯示下圖問題&#xff1a; 繼續解…

直流電和交流電

直流電&#xff08;Direct Current&#xff0c;簡稱DC&#xff09;和交流電&#xff08;Alternating Current&#xff0c;簡稱AC&#xff09;是電流的兩種基本形式。 1. 直流電 直流電是指電流方向始終保持不變的電流。在直流電中&#xff0c;電子只能沿著一個方向移動。直流電…