基于延遲估計與多模型預測的化工生產過程不合格事件預警方法研究
摘要
化工生產過程中,污染物濃度如SO?和H?S對生產過程的控制至關重要。本文旨在通過數據分析與模型預測,提出一種基于延遲估計與特征提取的多模型預測方法,優化閾值設置,及時預警潛在的不合格事件。
在數據處理階段,我們首先進行了數據的預處理、基本統計分析、百分位數計算與閾值選擇,結合閾值敏感性分析評估了閾值變化對合格率的影響。通過這一過程,確定了不同百分位數的閾值,并使用多種閾值組合選擇方法,以最大化合格率。同時,應用三種先進的異常檢測方法——ROC曲線優化、One-Class SVM和高斯混合模型(GMM),對SO?和H?S濃度的異常閾值進行了對比研究。
針對延時分析模型,我們提出了兩種方法:互相關分析和差分響應法,用于估計輸入反應物流量變化對SO?和H?S濃度響應的延遲。互相關分析通過計算輸入與輸出之間的相關系數,識別最大相關性對應的延遲時間;而差分響應法通過識別輸入信號中的顯著變化點,驗證延遲的準確性。
針對預測模型的構建,我們結合延遲估計與特征提取,采用分類模型預測是否發生不合格事件,并利用回歸模型預測不合格事件的發生時間。通過對模型準確率、精確率、召回率和F1分數的評估,驗證了預測模型的有效性與性能。
最后,我們的研究提出了一種基于延遲估計和特征提取的多模型預測方法,能夠有效預測不合格事件并提供提前預警。該方法為化工生產過程中的控制策略設計提供了新的思路和技術支持。
關鍵詞:延遲估計;閾值設置;多模型預測;分類模型;回歸模型
一、模型假設
為了方便模型的建立與模型的可行性,我們這里首先對模型提出一些假設,使得模型更加完備,預測的結果更加合理。
1、假設化工生產過程中,SO?和H?S的濃度受多個反應過程參數的影響,且污染物濃度的變化與輸入流量、反應條件等因素緊密相關。
2、假設輸入數據(包括反應物流量和污染物濃度)是準確和及時獲取的,且數據質量良好,沒有遺漏或異常值。
3、假設在實際應用中,延遲和閾值的設置會根據實際生產過程和數據反饋進行適當調整,以應對不同生產環境和操作條件下的變化。
二、模型的建立與求解
5.1?閾值確定
在本次分析中,我們主要目的是通過數學方法分析并確定化工廠脫硫工藝中的污染物SO?和H?S濃度的閾值,并為生產過程中的控制提供理論支持。分析過程包括數據的預處理、統計分析、百分位數分析、閾值選擇、敏感性分析等步驟,旨在通過精確的控制閾值保證產品質量。
5.1.1?數據預處理
首先,加載了輸入輸出數據,其中輸入數據包含工藝參數,而輸出數據則是
?和
?的濃度。數據清洗過程中,我們需要確保數據結構的正確性,例如去除表頭行,確保每個數據項都是數值型數據。通過這些預處理步驟,我們確保了分析數據的質量。
這些統計量幫助我們理解數據的基本分布特性,例如污染物濃度的波動范圍與離散程度。
SO2統計信息:
最小值: -5.2016
最大值: 13.9642
平均值: -0.0000
標準差: 1.0000
H2S統計信息:
最小值: -5.9891
最大值: 7.6372
平均值: 0.0000
標準差: 1.0000
從SO?和H?S的統計信息來看,SO?濃度的最小值為-5.2016,最大值為13.9642,表明SO?濃度在測量過程中存在一定的波動,涵蓋了負值和正值,這可能與測量誤差或數據處理中的異常值有關。SO?的平均值接近零,標準差為1,表明其濃度波動相對較小,數據相對集中。對于H?S,最小值為-5.9891,最大值為7.6372,同樣存在負值,可能是由于數據異常或測量誤差導致。H?S的平均值為0,標準差也為1,顯示其濃度在整體上呈現較為均勻的分布,波動幅度不大。整體來看,SO?和H?S的數據呈現出一定的波動性和異常值的存在,可能需要進一步的數據清洗和異常值處理。
百分位數?SO2閾值 ? ? ? ? ??H2S閾值 ? ? ? ? ?
----------------------------------------
50 0.1648 ? ? ? ? ?-0.0037 ? ? ? ?
75 0.6439 ? ? ? ? ?0.5057 ? ? ? ??
80 0.7398 ? ? ? ? ?0.6331 ? ? ? ??
85 0.8356 ? ? ? ? ?0.8878 ? ? ? ??
90 1.0273 ? ? ? ? ?1.0151 ? ? ? ??
95 1.4106 ? ? ? ? ?1.5245 ? ? ? ??
97 1.6022 ? ? ? ? ?1.7792 ? ? ? ??
98 1.8897 ? ? ? ? ?2.1612 ? ? ? ??
99 2.2730 ? ? ? ? ?2.6706 ? ? ? ??
通過計算不同百分位數組合對應的合格率,我們可以選擇最優的閾值組合。我們進一步嘗試不同的百分位數組合,如
?、
?、
?等,以找出使得合格率最大化的閾值組合。
不同閾值組合下的結果:
SO2閾值?H2S閾值 ? ? ?SO2百分位數 ? ? ? ??H2S百分位數 ? ? ? ? 合格率
-----------------------------------------------------------------
0.8356 0.8878 ? ? 85 ? ? ? ? ? ? ?85 ? ? ? ? ? ? ?0.7448
0.8356 1.0151 ? ? 85 ? ? ? ? ? ? ?90 ? ? ? ? ? ? ?0.7645
0.8356 1.5245 ? ? 85 ? ? ? ? ? ? ?95 ? ? ? ? ? ? ?0.8173
0.8356 1.7792 ? ? 85 ? ? ? ? ? ? ?97 ? ? ? ? ? ? ?0.8305
0.8356 2.1612 ? ? 85 ? ? ? ? ? ? ?98 ? ? ? ? ? ? ?0.8406
0.8356 2.6706 ? ? 85 ? ? ? ? ? ? ?99 ? ? ? ? ? ? ?0.8490
1.0273 0.8878 ? ? 90 ? ? ? ? ? ? ?85 ? ? ? ? ? ? ?0.7890
1.0273 1.0151 ? ? 90 ? ? ? ? ? ? ?90 ? ? ? ? ? ? ?0.8092
1.0273 1.5245 ? ? 90 ? ? ? ? ? ? ?95 ? ? ? ? ? ? ?0.8633
1.0273 1.7792 ? ? 90 ? ? ? ? ? ? ?97 ? ? ? ? ? ? ?0.8765
1.0273 2.1612 ? ? 90 ? ? ? ? ? ? ?98 ? ? ? ? ? ? ?0.8866
1.0273 2.6706 ? ? 90 ? ? ? ? ? ? ?99 ? ? ? ? ? ? ?0.8949
1.4106 0.8878 ? ? 95 ? ? ? ? ? ? ?85 ? ? ? ? ? ? ?0.8403
1.4106 1.0151 ? ? 95 ? ? ? ? ? ? ?90 ? ? ? ? ? ? ?0.8613
1.4106 1.5245 ? ? 95 ? ? ? ? ? ? ?95 ? ? ? ? ? ? ?0.9171
1.4106 1.7792 ? ? 95 ? ? ? ? ? ? ?97 ? ? ? ? ? ? ?0.9305
1.4106 2.1612 ? ? 95 ? ? ? ? ? ? ?98 ? ? ? ? ? ? ?0.9409
5.2.2?多模型對比?
除了互相關分析,我們還采用了差分響應分析法來進一步驗證延遲的估計結果。該方法通過分析輸入信號的顯著變化,并觀察輸出信號的響應,來估計延遲。具體地,首先對輸入信號進行差分處理,計算輸入信號的變化幅度(即每個時刻與前一時刻的差值)。然后,設置一個閾值,識別輸入信號中大于該閾值的顯著變化點,這些變化點被認為是輸入信號的脈沖。
通過選擇顯著變化點(脈沖點),我們分析對應的輸出響應。在每個脈沖點之后,我們計算輸出信號的變化,并通過與基線(脈沖點前的輸出值的均值)進行比較,確定響應達到最大值時的延遲。具體來說,我們通過以下步驟來計算延遲:
1.計算輸入信號的差分:
2.選擇差分超過某個閾值的變化點作為顯著變化點。
3.對于每個顯著變化點,記錄輸出信號的響應,計算其與基線的差異。
4.找到響應的最大變化位置,并將其作為延遲估計。
對于每個輸入信號,我們選擇了?5?個以上的顯著變化點,并確保它們之間有足夠的間隔(至少?50?個時間單位)。對于每個選定的脈沖點,我們計算輸出信號的最大響應,并將這些響應時間作為延遲估計的候選值。如果選定的延遲值超過了?3?個有效值,我們取這些延遲的中位數作為最終的延遲估計結果。
在互相關分析法和差分響應法的基礎上,我們結合兩種方法的結果來得到更為可靠的延遲估計。為了合并兩種方法的結果,我們給每種方法分配了不同的權重,通常互相關分析法的權重較大,脈沖響應法的權重較小。綜合延遲估計可以通過加權平均計算得到:
其中,
?和
?是互相關法和脈沖響應法的權重,通常
?。通過這種加權方式,我們得到了每個輸入信號對
?和
?的綜合響應延遲估計。
綜合延時估計結果:
輸入變量?輸出變量? ? ? ?互相關法延時? ? ? ? ??脈沖響應法延時? ? ? ? ?綜合估計延時? ? ? ? ?
---------------------------------------------------------------------------------
IN1 OUT1 ? ? ? 0 ? ? ? ? ? ? ? 144 ? ? ? ? ? ? 43 ? ? ? ? ? ??
IN1 OUT2 ? ? ? 0 ? ? ? ? ? ? ? 129 ? ? ? ? ? ? 39 ? ? ? ? ? ??
IN2 OUT1 ? ? ? 4 ? ? ? ? ? ? ? ? ? ? ? ? ??
IN2 OUT2 ? ? ? 40 ? ? ? ? ? ? ?121 ? ? ? ? ? ? 64 ? ? ? ? ? ??
IN3 OUT1 ? ? ? 25 ? ? ? ? ? ? ? ? ? ? ? ??
IN3 OUT2 ? ? ? 0 ? ? ? ? ? ? ? 126 ? ? ? ? ? ? 38 ? ? ? ? ? ??
IN4 OUT1 ? ? ? 10 ? ? ? ? ? ? ?128 ? ? ? ? ? ? 45 ? ? ? ? ??