語音識別數據集

Voice Activity Detection

自己采集：

1. ASR Resources（語音識別資源）

2. LM Resources（語言模型資源）

這是一個數據表：

噪聲數據集：

自己分別采集有有聲音的，沒有聲音的

多人說話的，

在語音識別（ASR）中，ASR Resources 和 LM Resources 各自有不同的含義和作用。下面是它們的詳細解釋：

ASR 是 Automatic Speech Recognition，即 自動語音識別。是將語音信號轉化為文本。包括：

LM 是 Language Model（語言模型）的縮寫。語言模型在語音識別中的作用是根據上下文來預測詞語的出現概率，從而提高識別的準確性。LM Resources 指的是構建和使用語言模型所需的各種資源，主要包括：

語言建模語料庫：用于訓練語言模型的文本數據集。它包含大量的文本，幫助模型學習語言的結構、語法和常見的詞組搭配。
預訓練語言模型：例如3-gram、5-gram等n-gram模型或更復雜的神經網絡語言模型（如RNN、LSTM、Transformer），用于捕捉詞語之間的統計關系。
詞匯表：包含所有模型可能識別的詞匯，可以是訓練語言模型時的一個子集，幫助限制可能出現的詞的范圍。

總結：

這兩者結合，能顯著提高語音識別系統的整體效果。

名稱	小時數	語言數	鏈接	許可證	md5sum
Bible.is	53,138	1,596	https://live.bible.is/bible/EN1ESV/MAT/1	獨特的	ea404eeaf2cd283b8223f63002be11f9
globalrecordings.net	9,743	6,171	Global Recordings Network	CC BY-NC-SA 4.0	3c5c0f31b0abd9fe94ddbe8b1e2eb326
VoxLingua107	6,628	107	https://bark.phon.ioc.ee/voxlingua107/	CC BY 4.0	5dfef33b4d091b6d399cfaf3d05f2140
Common Voice	30,329	120	Common Voice	CC0	5e30a85126adf74a5fd1496e6ac8695d
MLS	50,709	8	openslr.org	CC BY 4.0	a339d0e94bdf41bba3c003756254ac4e
總計	150,547	6,171+

可以直接下載的：

MLS

Common Voice

https://github.com/snakers4/silero-vad/wiki/Quality-Metrics#sample-rate-comparison

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/91704.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/91704.shtml
英文地址，請注明出處：http://en.pswp.cn/web/91704.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！