音頻分類研究的重點,一方面在于音頻特征的提取和選擇,通常來說數據集和特征集在分類系統中有著極為重要的作用,離開了對數據集的處理、對特征集中特征的提取和選擇,分類結果必將產生巨大誤差。對于提高音頻分類系統的分類準確度和保證數據集的可用性來說,對音頻數據進行預處理、提取并選擇出對分類準確率有益的特征是必要的,但這部分的研究工作大多集中在數據挖掘領域,在音頻信號分類領域往往受到忽視。另一方面在于分類算法的改進和優化,分類算法的運行效率和分類準確率等直接影響著分類系統的性能,但提高分類準確率和減少計算時間是一對矛盾問題,通過對目前已有分類算法的分析不難發現,仍然存在著諸如分類準確率低、算法復雜度高等問題。
在音頻分類研究中,如何選擇出對分類結果有益的和有害的特征量,如何選擇和優化分類算法,對于提高音頻分類系統的整體性能意義重大。綜合來看,目前已有的研究中仍存在以下問題:1.用于分類的音頻特征雖五花八門,但沒有統一有效的標準可依,且用于分類的音頻特征量有待增加;2.大多數已有的研究中,只是直接使用所提取的音頻特征集進行分類實驗,忽略了對音頻特征集的篩選問題,且缺乏對相關特征選擇算法的研究;3.現存算法雖然在音頻分類研究中取得了一定成就,但仍存在缺點和不足,不同分類算法對不同分類對象的分類準確率仍有待提高。
本文采用小波和濾波器組理論對音頻信號進行處理,運行環境為MATLAB R2018A,主要內容如下:
使用濾波器樹結構建立聽覺濾波器組
小波濾波器組
分解音頻信號(Decomposition of an audio signal into tonal, transient and residual layers)
相位恢復和相位差分
使用具有不同時頻分辨率的group lasso shrinkage進行音頻分解
幾個濾波器組 CQT, ERBLET and AUDLET filterbanks
濾波器組同步壓縮變換和逆變換
用Gabor乘子近似緩慢時變系統
工學博士,擔任《Mechanical System and Signal Processing》審稿專家,擔任
《中國電機工程學報》優秀審稿專家,《控制與決策》,《系統工程與電子技術》,《電力系統保護與控制》,《宇航學報》等EI期刊審稿專家。
擅長領域:現代信號處理,機器學習,深度學習,數字孿生,時間序列分析,設備缺陷檢測、設備異常檢測、設備智能故障診斷與健康管理PHM等。