實驗所用 TE 仿真過程的數據集是網上公開的數據集,該數據集中的訓練集和測試集分別包含 20 種故障工況和一種正常工況數據,其中所采集的每個樣本信號包含 41 個測量變量和 11 個控制變量,所以每個時刻采集到的樣本有 52 個觀測變量。
TE 仿真實驗過程中每隔 3 分鐘采集一組樣本,訓練集樣本收集過程中每種工況的仿真時間為 25 小時,剛開始系統正常運行 1 小時,然后引入故障,正常樣本是由系統在無干擾的情況下運行 25 小時采集的,每種工況分別在 500 種不同隨機數下進行仿真實驗,采集到的訓練集數據中每種工況共有 250000 個樣本;測試集樣本收集過程中每種工況運行的時間為 48 小時,加干擾的實驗中前 8 個小時系統是正常運行,之后開始引入故障,同樣每種工況分別在 500 種不同隨機數下進行仿真實驗,采集到的測試集數據中每種工況共有 480000 個樣本。
TE 過程是復雜、強耦合的化工過程,TE 過程產生的數據具有非線性、高維、非平穩分布、時序性等特點。目前,基于深度學習對于 TE 過程的故障診斷技術研究工作大部分是基于自動編碼器及自動編碼器的改進算法,雖然相較于傳統數據驅動方法,其更適用于對復雜非線性、高維度化工過程數據的研究,但是,這些方法對于具有時間序列關系數據的分析表現并不是很理想,很難提取出數據中時序相關性的信息。由于故障的演變是一個持續的過程,當前時刻的化工過程運行狀態與前面時刻過程狀態有很強的相關性。因此,充分挖掘數據之間的時序關系對故障診斷技術的研究有很大的幫助。
鑒于此,采用長短時記憶網絡LSTM的TE過程故障診斷,運行環境為MATLAB R2021B。
function processed = helperPreprocess(mydata,limit)H = size(mydata);processed = {};for ind = 1:limit:Hx = mydata(ind:(ind+(limit-1)),4:end);processed = [processed; x'];end
end通過知乎學術咨詢獲取代碼:
https://www.zhihu.com/consult/people/792359672131756032?isMe=1
擅長領域:現代信號處理,機器學習,深度學習,數字孿生,時間序列分析,設備缺陷檢測、設備異常檢測、設備智能故障診斷與健康管理PHM等。