基于大規模測量與多任務深度學習的電子鼻系統實現目標識別、濃度預測與狀態判斷
原論文地址:https://www.sciencedirect.com/science/article/abs/pii/S0925400521014830
引用此論文(GB/T 7714-2015):
- WANG T, ZHANG H, WU Y, et al. Target discrimination, concentration prediction, and status judgment of electronic nose system based on large-scale measurement and multi-task deep learning[J]. Sensors and Actuators B: Chemical, 2022, 351: 130915. DOI:10.1016/j.snb.2021.130915.
論文作者學術主頁:https://www.researchgate.net/profile/Tao-Wang-261
1. 研究背景與意義
電子鼻(Electronic Nose, E-nose)系統作為一種仿生檢測技術,模擬生物嗅覺原理,通過多傳感器陣列和模式識別算法,實現對復雜氣味的識別與分析,廣泛應用于生物醫學診斷、工業排放監測與食品質量評估等領域。傳統電子鼻模式識別依賴人工特征提取與獨立模型訓練,存在特征信息丟失、訓練流程復雜且泛化能力弱等問題。針對以上瓶頸,本文提出結合大規模自動化測量與多任務卷積神經網絡(MTL-CNN)的方法,旨在實現電子鼻系統的目標氣體識別、濃度預測與狀態判斷三任務同步完成,簡化訓練與應用流程,提升系統性能與適應性。
2. 系統設計與實驗方法
2.1 電子鼻硬件構建
本研究中,傳感器陣列與數據采集電路分離設計(如圖1所示)。陣列板采用圓盤結構,搭載八種商用MOS氣敏傳感器(MQ系列),通過線束連接至采集板。采集板采用八路惠斯通電橋與高精度放大器(AD620),輸出至16位ADC(ADS1115),并由32位微控制器(MCU)進行數據采集與433 MHz無線傳輸。
圖1 電子鼻傳感器陣列(a)與數據采集板(b)實物圖,及氣體測量系統內部結構示意圖(c)。
2.2 自動化測量系統開發
為實現大規模、長時程、無人干預的氣體測試,本文開發了基于Alwhales Auto Script(AAS)腳本語言的自動化控制系統,結合內外雙層密封腔體、溫控加熱板、微量注射泵、自動門控及環境監測模塊,實現全過程編程控制。
圖2 基于AAS腳本的自動化氣體測量系統架構示意。
2.3 氣體響應實驗
選取十二種典型揮發性有機化合物(VOCs)作為測試目標(包括甲醇、乙醇、乙二醇等),通過控制注射量和加熱溫度設定氣體濃度區間(10-100 ppm),分別進行十輪獨立響應測試,累計采集逾千萬級數據點,涵蓋各濃度與狀態。
2.4 數據處理與標簽構建
所有傳感器響應數據經基線跟蹤算法(BTA)實時校正。依據固定時間窗對響應曲線分段,分別標注氣體類型、濃度值與工作狀態(Idle/Response/Recovery),形成多標簽訓練集。
圖4 乙醇響應實驗中傳感器陣列數據及其三任務標簽示意。
3. 多任務卷積神經網絡(MTL-CNN)模型設計
3.1 基礎CNN結構
典型CNN包含卷積層、池化層與全連接層,用于特征提取、降維與分類(如圖3a所示)。
3.2 雙區塊共享MTL-CNN架構
本文設計的MTL-CNN模型具有獨特的雙區塊知識共享結構(如圖3b所示):初始卷積池化塊共享至三任務,隨后分支進行任務特定優化。目標氣體識別與濃度預測任務之間設有額外共享區塊,以強化相關任務的信息交互,提升模型性能與穩定性。
圖3 (a)典型CNN結構圖;(b)本研究中MTL-CNN雙區塊共享結構示意。
4. 訓練過程與參數優化
4.1 批次大小(Batch Size)影響分析
通過調整Batch Size(10-5000)進行訓練優化,發現當Batch Size為700時,三任務收斂速度最快、交叉驗證準確率最高。
圖5 不同Batch Size下三任務準確率與標準誤對比。
4.2 輸入數據長度(Data Length)優化
研究不同輸入長度對模型表現的影響,確定以4秒(8數據點)為最佳輸入單元,兼顧響應過程有效性與實時性。
圖6 不同數據長度下三任務準確率與標準誤對比。
4.3 樣本規模(Sample Volume)對性能的影響
通過控制訓練樣本比例(0.001-0.9),驗證大樣本量(>0.5)顯著提升泛化能力與輸出穩定性。
圖7 訓練與交叉驗證準確率隨樣本量變化趨勢。
圖8 樣本量對三任務準確率與標準差的影響統計。
5. 最終模型性能評估與對比分析
5.1 MTL-CNN綜合性能
最終模型在5折交叉驗證中取得氣體類型識別95.2%、濃度預測92.1%、狀態判斷97.3%的平均準確率。
圖9 (a)模型訓練損失下降曲線;(b)迭代次數與交叉驗證準確率關系;(c)氣體分類混淆矩陣;(d)濃度預測混淆矩陣。
5.2 與傳統算法對比
將MTL-CNN與8種主流模式識別算法(如SVM、KNN、RF等)進行性能與訓練時間對比,結果表明,MTL-CNN在準確率、實時性與多任務集成方面均優于傳統方法。
圖10 傳統模式識別流程(a)與MTL-CNN流程(b)對比。
圖11 (a)不同算法在三任務上的性能對比;(b)不同算法訓練與驗證所耗時間對比。
6. 結論
本文提出基于大規模自動化測量與多任務卷積神經網絡(MTL-CNN)融合的電子鼻系統模式識別新策略,首次實現了僅用4秒原始數據同時完成氣體類型識別、濃度預測與工作狀態判斷,且準確率穩定在95%左右,驗證了大數據驅動與深度學習結合在氣體傳感領域的巨大潛力。該研究為智能電子鼻系統的快速響應、多功能集成與實際應用奠定了堅實基礎。