語音識別數據集

目錄

Voice Activity Detection

自己采集:

1. ASR Resources(語音識別資源)

2. LM Resources(語言模型資源)

這是一個數據表:

噪聲數據集:


Voice Activity Detection

自己采集:

自己分別采集有有聲音的,沒有聲音的

多人說話的,

在語音識別(ASR)中,ASR ResourcesLM Resources 各自有不同的含義和作用。下面是它們的詳細解釋:

1. ASR Resources(語音識別資源)

ASRAutomatic Speech Recognition,即 自動語音識別。是將語音信號轉化為文本。包括:

  • 音頻數據集:用于訓練ASR模型的語音數據,如包含不同口音、環境噪音、語速等的多樣化音頻文件。

  • 聲學模型:用于將音頻信號轉換為音素(語音單元)或詞的模型,通常通過深度神經網絡(如DNN、CNN、RNN)進行訓練。

  • 詞典:包含音素與詞匯的映射關系,幫助ASR系統從音頻信號識別出正確的詞。

  • 標注數據:通常包括每個音頻片段與其對應的正確轉錄文本,這些數據用于訓練和評估ASR模型。

2. LM Resources(語言模型資源)

LMLanguage Model(語言模型)的縮寫。語言模型在語音識別中的作用是根據上下文來預測詞語的出現概率,從而提高識別的準確性。LM Resources 指的是構建和使用語言模型所需的各種資源,主要包括:

  • 語言建模語料庫:用于訓練語言模型的文本數據集。它包含大量的文本,幫助模型學習語言的結構、語法和常見的詞組搭配。

  • 預訓練語言模型:例如3-gram、5-gram等n-gram模型或更復雜的神經網絡語言模型(如RNN、LSTM、Transformer),用于捕捉詞語之間的統計關系。

  • 詞匯表:包含所有模型可能識別的詞匯,可以是訓練語言模型時的一個子集,幫助限制可能出現的詞的范圍。

總結

  • ASR Resources 主要關注與語音信號和音頻處理相關的資源,用來從語音轉化為文本。

  • LM Resources 主要關注文本數據和語言結構,用來提高語音識別的上下文理解和準確性。

這兩者結合,能顯著提高語音識別系統的整體效果。

這是一個數據表:

名稱小時數語言數鏈接許可證md5sum
Bible.is53,1381,596https://live.bible.is/bible/EN1ESV/MAT/1獨特的ea404eeaf2cd283b8223f63002be11f9
globalrecordings.net9,7436,171Global Recordings NetworkCC BY-NC-SA 4.03c5c0f31b0abd9fe94ddbe8b1e2eb326
VoxLingua1076,628107https://bark.phon.ioc.ee/voxlingua107/CC BY 4.05dfef33b4d091b6d399cfaf3d05f2140
Common Voice30,329120Common VoiceCC05e30a85126adf74a5fd1496e6ac8695d
MLS50,7098openslr.orgCC BY 4.0a339d0e94bdf41bba3c003756254ac4e
總計150,5476,171+

可以直接下載的:

MLS

Common Voice

噪聲數據集:

https://github.com/snakers4/silero-vad/wiki/Quality-Metrics#sample-rate-comparison

?

DatasetDuration, hoursDomain
ESC-502.7Environmental noise
AliMeeting test43Far/near meetings speech
Earnings 2139Calls
MSDWild80Noisy speech
AISHELL-4 test12.7Meetings
VoxConverse test43.5Noisy speech
Libriparty test4Noisy speech
Private noise0.5Noisy calls without speech
Private speech3.7Speech
Multi-Domain Validation17Multi

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/91704.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/91704.shtml
英文地址,請注明出處:http://en.pswp.cn/web/91704.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux線程同步與互斥(上)

目錄 前言 1.互斥 1.先來見一種現象(數據不一致問題) 2.如何解決上述問題 3.理解為什么數據會不一致&&認識加鎖的接口 4.理解鎖 5.鎖的封裝 前言 在前面對線程的概念和控制的學習過程中,我們知道了線程是共享地址空間的&#…

Codeforces Global Round 27

ABC 略D將每個數拆成x*2的整數次冪&#xff0c;一個直接的想法是盡量把2的整數次冪給大的數。那么所有乘上2的整數次冪的數構成的序列單調遞減&#xff0c;反證法&#xff0c;如果序列中存在i j 使得a[i]<a[j]&#xff0c;那么我們不如把給a[i]乘的2的冪給a[j]乘。#include …

深入 Go 底層原理(二):Channel 的實現剖析

1. 引言"Do not communicate by sharing memory; instead, share memory by communicating." (不要通過共享內存來通信&#xff0c;而應通過通信來共享內存。) 這是 Go 語言并發設計的核心哲學。而 channel 正是實現這一哲學的核心工具。Channel 為 Goroutine 之間的…

Golang 語言的編程技巧之類型

1、介紹Golang 語言是一門靜態類型的編程語言&#xff0c;我們在編寫代碼時&#xff0c;為了提升代碼的靈活性&#xff0c;有時會使用空接口類型&#xff0c;對于空接口類型的變量&#xff0c;一般會通過類型斷言判斷變量的類型&#xff0c;而且可能還會遇到遇到類型轉換的場景…

計數組合學7.11(RSK算法)

7.11 RSK算法 在對稱函數理論中&#xff0c;有一個非凡的組合對應關系&#xff0c;稱為RSK算法。&#xff08;關于縮寫RSK的含義以及其他名稱&#xff0c;請參閱本章末尾的注釋。&#xff09;這里我們僅介紹RSK算法的最基本性質&#xff0c;從而能夠給出舒爾函數一些基本性質的…

國產嵌入式調試器之光? RT-Trace 初體驗!

做過嵌入式開發的工程師肯定都知道有這么個玩意兒 —— J-Trace&#xff0c;與我們日常使用的普通調試器不同點在于&#xff0c;它在基本的下載/調試代碼之上還具有非常強大的代碼運行跟蹤能力&#xff0c;從而實現代碼覆蓋率的分析、指令回溯、CPU 資源監控等一系列強大的功能…

SLAM中的非線性優化-2D圖優化之零空間實戰(十六)

終于有時間更新實戰篇了&#xff0c;本節實戰幾乎包含了SLAM后端的所有技巧&#xff0c;其中包括&#xff1a;舒爾補/先驗Factor/魯棒核函數/FEJ/BA優化等滑動窗口法的相關技巧&#xff0c;其中構建2D輪式里程計預積分以及絕對位姿觀測的10幀滑動窗口&#xff0c;并邊緣化最老幀…

知識隨記-----Qt 實戰教程:使用 QNetworkAccessManager 發送 HTTP POST

文章目錄Qt 網絡編程&#xff1a;使用 QNetworkAccessManager 實現 HTTP POST 請求概要整體架構流程技術名詞解釋技術細節注意事項&#xff1a;Qt 網絡編程&#xff1a;使用 QNetworkAccessManager 實現 HTTP POST 請求 概要 本文介紹如何使用 Qt 框架的網絡模塊&#xff08;…

wordpress批量新建產品分類

1、下載安裝插件&#xff1a;bulk-category-import-export2、激活插件后&#xff0c;左側點擊插件下的導入&#xff0c;選擇product categories&#xff0c;點擊下一步3、這里可以選擇導入的分類列表文件&#xff0c;可以選擇分隔符&#xff0c;CSV文件默認為‘&#xff0c;’要…

CentOS 鏡像源配置與 EOL 后的應對策略

引言 本文將詳細介紹如何使用 阿里云開源鏡像站 配置 CentOS 的各類軟件源&#xff0c;包括基礎源、歷史歸檔源&#xff08;vault&#xff09;、ARM 架構源、Stream 版本以及調試信息源&#xff08;debuginfo&#xff09;&#xff0c;并重點講解在 CentOS 8 停止維護后&#x…

CTF實戰:用Sqlmap破解表單輸入型SQL注入題(輸入賬號密碼/usernamepassword)

目錄 引言 步驟1&#xff1a;用Burp Suite捕獲表單請求 步驟2&#xff1a;用Sqlmap獲取數據庫名稱 參數解釋&#xff1a; 輸出示例&#xff08;根據題目環境調整&#xff09;&#xff1a; 步驟3&#xff1a;獲取目標數據庫中的表名 參數解釋&#xff1a; 輸出示例&#…

質數時間(二分查找)

題目描述如果把一年之中的某個時間寫作 a 月 b 日 c 時 d 分 e 秒的形式&#xff0c;當這五個數都為質數時&#xff0c;我們把這樣的時間叫做質數時間&#xff0c;現已知起始時刻是 2022 年的 a 月 b 日 c 時 d 分 e 秒&#xff0c;終止時刻是 2022 年的 u 月 v 日 w 時 x 分 y…

Python訓練Day29

浙大疏錦行 類的裝飾器裝飾器思想的進一步理解&#xff1a;外部修改、動態類方法的定義&#xff1a;內部定義和外部定義

新手DBA實戰指南:如何使用gh-ost實現MySQL無鎖表結構變更

新手DBA實戰指南:如何使用gh-ost實現MySQL無鎖表結構變更 作為DBA,大表結構變更(DDL)一直是令人頭疼的問題。傳統的ALTER TABLE操作會鎖表,嚴重影響業務連續性;而常見的pt-online-schema-change工具雖然能實現在線變更,但依賴觸發器機制,在高并發場景下性能表現不佳。本…

OSPF綜合

一、實驗拓撲二、實驗需求1、R4為ISP&#xff0c;其上只配置IP地址&#xff1b;R4與其他所直連設備間均使用公有IP&#xff1b; 2、R3-R5、R6、R7為MGRE環境&#xff0c;R3為中心站點&#xff1b; 3、整個OSPF環境IP基于172.16.0.0/16劃分&#xff1b;除了R12有兩個環回&#x…

技術面試知識點詳解 - 從電路到編程的全棧面經

技術面試知識點詳解 - 從電路到編程的全棧面經 目錄 模擬電路基礎數字電路原理電源設計相關編程語言基礎數據庫與并發網絡協議基礎算法與數據結構 模擬電路基礎 1. 放大電路類型判斷 這是模擬電路面試的經典題目&#xff0c;通過電壓放大倍數判斷放大電路類型&#xff1a; …

LangGraph認知篇-Command函數

Command簡述 在 LangGraph 中&#xff0c;Command 是一個極具實用性的功能&#xff0c;它能夠將控制流&#xff08;邊&#xff09;和狀態更新&#xff08;節點&#xff09;巧妙地結合起來。這意味著開發者可以在同一個節點中&#xff0c;既執行狀態更新操作&#xff0c;又決定下…

【目標檢測】小樣本度量學習

小樣本度量學習&#xff08;Few-Shot Metric Learning&#xff09;通常用于分類任務?&#xff08;如圖像分類&#xff09;&#xff0c;但它也可以與目標檢測&#xff08;Object Detection&#xff09;結合&#xff0c;解決小樣本目標檢測&#xff08;Few-Shot Object Detectio…

cmd怎么取消關機命令

在 Windows 的命令提示符&#xff08;CMD&#xff09;中取消已計劃的關機操作&#xff0c;可以通過 shutdown 命令的 ?**-a**? 參數實現。以下是具體步驟&#xff1a;?操作方法??打開 CMD?按下 Win R 組合鍵&#xff0c;輸入 cmd 并回車&#xff0c;打開命令提示符窗口。…

網易云音樂硬剛騰訊系!起訴SM娛樂濫用市場支配地位

企查查APP顯示&#xff0c;近日&#xff0c;法院公開杭州樂讀科技有限公司、杭州網易云音樂科技有限公司起訴SM ENTERTAINMENT CO. 、卡斯夢&#xff08;上海&#xff09;文化傳播有限公司等開庭信息&#xff0c;案由涉及濫用市場支配地位糾紛。公告顯示&#xff0c;該案件計劃…