基于特征融合的電子鼻多任務深度學習模型研究
原論文地址:https://www.sciencedirect.com/science/article/pii/S0925400524009365
引用此論文(GB/T 7714-2015):
- NI W, WANG T, WU Y, et al. Multi-task deep learning model for quantitative volatile organic compounds analysis by feature fusion of electronic nose sensing[J]. Sensors and Actuators B: Chemical, 2024, 417: 136206. DOI:10.1016/j.snb.2024.136206.
論文作者學術主頁:https://www.researchgate.net/profile/Tao-Wang-261
1. 研究背景與意義
電子鼻(Electronic Nose, E-nose)技術通過模擬生物嗅覺系統,實現對復雜氣體混合物的識別與定量分析,廣泛應用于食品檢測、環境監測和健康診斷等領域。然而,傳統神經網絡在電子鼻模式識別中的應用存在訓練效率低、忽略氣體響應序列時空特性等問題。為此,本文提出結合特征融合與多任務深度學習(MTL)的新型方法,在充分保留響應序列的空間與時間特性的基礎上,同時實現氣體類型分類與濃度回歸預測。
2. 實驗系統與數據采集
2.1 無人化氣體測試系統
本研究采用研究團隊開發的先進氣體測試平臺G919,結合自復原調理電路與自動控制腳本,采集了大規模的氣體響應數據集。傳感器陣列包含八個不同類型的氣敏元件。
2.2 測試對象與實驗設計
選取了十二種常見揮發性有機化合物(VOCs),如乙醇、丙酮、甲醇、甲苯等。氣體濃度設置在10–100 ppm,單一氣體實驗重復十五次,其中十二次用于訓練,三次用于驗證。響應定義為空氣電阻與目標氣體電阻之比(R0/Rg)。
圖1 (a) 八個傳感器對NBA氣體的原始電阻曲線;(b-d) 八個傳感器對NBA、BAC、NHE氣體的響應曲線。
3. 數據處理與特征融合
3.1 時間序列圖像轉換
為充分保留氣體響應的時空特性,本文采用GAF(Gramian Angular Fields)、MTF(Markov Transition Fields)與GADF(Gramian Angular Difference Fields)方法,將響應時間序列分別轉換為三種不同特征的圖像。
圖2 (a) 單通道圖像生成流程;(b) 多通道圖像融合示意;? 傳統灰度圖像示例。
通過三種圖像堆疊生成三通道輸入,形成每個樣本2880×2880的大型圖像。隨后采用Lanczos重采樣與高斯濾波技術壓縮圖像至不同尺寸(96×96至4×4),顯著減少數據量同時保留關鍵信息。
3.2 特征壓縮與增強
壓縮圖像后僅保留原數據的3.9%,大幅提升訓練與驗證效率,同時維持模型性能。
4. 多任務神經網絡結構設計
4.1 MTL-CNN-LSTM模型架構
本文提出的神經網絡結構包含共享卷積層(Conv+BN),分支卷積池化層(Conv+BN+MP),以及融合長短期記憶(LSTM)單元的多任務輸出模塊。
圖3 (a) 多任務共享層示意;(b) LSTM模塊結構;? 含LSTM的分支層;(d) 不含LSTM的對照結構。
其中,卷積網絡主要提取空間特征,LSTM模塊用于捕捉時間依賴性,顯著提升模型對氣體響應序列的理解能力。
4.2 訓練策略
訓練過程使用Adam優化器,batch size為256,分類任務采用log-loss損失函數,回歸任務采用均方誤差(MSE)損失函數。每種圖像尺寸下均訓練200輪(epochs)。
5. 結果分析與討論
5.1 MTL-CNN與MTL-CNN-LSTM性能比較
圖4 多通道特征融合與多任務學習流程總覽。
LSTM嵌入后,模型在不同圖像尺寸下均表現出更高的分類準確率與回歸R2得分。
圖5 (a) 不同圖像尺寸下分類準確率與回歸R2得分對比;(b) 分類與回歸損失對比;?(d) 不同模型訓練與驗證時間對比。
在圖像尺寸10×10時,CNN-LSTM模型在分類任務中達到95.31%的準確率,在回歸任務中達到0.9510的R2得分,且標準誤更小,表明模型訓練穩定性更好。
5.2 訓練過程與學習曲線
圖6 (a) 5折交叉驗證分類準確率曲線;(b) 分類任務訓練損失曲線;? 回歸任務R2得分曲線;(d) 回歸任務MSE曲線。
5.3 混淆矩陣與回歸預測分析
圖7 (a)(b) 10×10圖像訓練下CNN與CNN-LSTM模型的氣體分類混淆矩陣;?(d) CNN與CNN-LSTM模型氣體濃度回歸滴水圖(Teardrop Diagram)。
CNN-LSTM模型在高濃度區域的回歸預測準確性尤其突出,優于傳統CNN模型。
6. 結論
本文提出了基于GAF-MTF特征融合與CNN-LSTM結構的多任務深度學習框架,成功實現了氣體類型分類與濃度預測的同步高效完成。在數據壓縮至僅3.9%的條件下,仍能取得95%以上的分類準確率與0.95以上的回歸R2得分,驗證了特征融合與時空聯合建模策略在電子鼻模式識別領域的巨大潛力。