聲學建模中用于構音障礙語音識別的特征選擇意義
原文:Significance of Feature Selection for Acoustic Modeling in Dysarthric Speech Recognition
引言
背景
- 構音障礙是由運動言語系統的神經損傷引起的,導致發音不清晰。
- 自動語音識別系統對構音障礙語音無效,因其聲學差異性大。
- 本文基于HMM構建音素模型,分析不同特征集的識別準確率。
相關工作
特征提取方法
PLP與MFCC的應用
- 使用12個PLP系數和速度、加速度系數形成39維聲學特征向量。
- MFCC結合能量、速度和加速度系數用于構音障礙語音識別。
- 傳統12個MFCC系數在無速度和加速度特征時提供最佳精度。
其他研究
- RASTA-PLP方法應用于幀長為25ms、重疊為10ms的構音障礙語音。
- 比較基于倒譜特征和感知線性預測系數的不同參數性能。
- 研究節奏指標區分健