2025認證杯二階段C題完整論文講解+多模型對比

基于延遲估計與多模型預測的化工生產過程不合格事件預警方法研究

摘要

化工生產過程中,污染物濃度如SO?和H?S對生產過程的控制至關重要。本文旨在通過數據分析與模型預測,提出一種基于延遲估計與特征提取的多模型預測方法,優化閾值設置,及時預警潛在的不合格事件。

在數據處理階段,我們首先進行了數據的預處理、基本統計分析、百分位數計算與閾值選擇,結合閾值敏感性分析評估了閾值變化對合格率的影響。通過這一過程,確定了不同百分位數的閾值,并使用多種閾值組合選擇方法,以最大化合格率。同時,應用三種先進的異常檢測方法——ROC曲線優化、One-Class SVM和高斯混合模型(GMM),對SO?和H?S濃度的異常閾值進行了對比研究。

針對延時分析模型,我們提出了兩種方法:互相關分析和差分響應法,用于估計輸入反應物流量變化對SO?和H?S濃度響應的延遲。互相關分析通過計算輸入與輸出之間的相關系數,識別最大相關性對應的延遲時間;而差分響應法通過識別輸入信號中的顯著變化點,驗證延遲的準確性。

針對預測模型的構建,我們結合延遲估計與特征提取,采用分類模型預測是否發生不合格事件,并利用回歸模型預測不合格事件的發生時間。通過對模型準確率、精確率、召回率和F1分數的評估,驗證了預測模型的有效性與性能。

最后,我們的研究提出了一種基于延遲估計和特征提取的多模型預測方法,能夠有效預測不合格事件并提供提前預警。該方法為化工生產過程中的控制策略設計提供了新的思路和技術支持。

關鍵詞:延遲估計;閾值設置;多模型預測;分類模型;回歸模型

一、模型假設

為了方便模型的建立與模型的可行性,我們這里首先對模型提出一些假設,使得模型更加完備,預測的結果更加合理。

1、假設化工生產過程中,SO?和H?S的濃度受多個反應過程參數的影響,且污染物濃度的變化與輸入流量、反應條件等因素緊密相關。

2、假設輸入數據(包括反應物流量和污染物濃度)是準確和及時獲取的,且數據質量良好,沒有遺漏或異常值。

3、假設在實際應用中,延遲和閾值的設置會根據實際生產過程和數據反饋進行適當調整,以應對不同生產環境和操作條件下的變化。

二、模型的建立與求解

5.1?閾值確定

在本次分析中,我們主要目的是通過數學方法分析并確定化工廠脫硫工藝中的污染物SO?和H?S濃度的閾值,并為生產過程中的控制提供理論支持。分析過程包括數據的預處理、統計分析、百分位數分析、閾值選擇、敏感性分析等步驟,旨在通過精確的控制閾值保證產品質量。

5.1.1?數據預處理

首先,加載了輸入輸出數據,其中輸入數據包含工藝參數,而輸出數據則是
?和
?的濃度。數據清洗過程中,我們需要確保數據結構的正確性,例如去除表頭行,確保每個數據項都是數值型數據。通過這些預處理步驟,我們確保了分析數據的質量。

圖片

這些統計量幫助我們理解數據的基本分布特性,例如污染物濃度的波動范圍與離散程度。

SO2統計信息:

最小值: -5.2016

最大值: 13.9642

平均值: -0.0000

標準差: 1.0000

H2S統計信息:

最小值: -5.9891

最大值: 7.6372

平均值: 0.0000

標準差: 1.0000

從SO?和H?S的統計信息來看,SO?濃度的最小值為-5.2016,最大值為13.9642,表明SO?濃度在測量過程中存在一定的波動,涵蓋了負值和正值,這可能與測量誤差或數據處理中的異常值有關。SO?的平均值接近零,標準差為1,表明其濃度波動相對較小,數據相對集中。對于H?S,最小值為-5.9891,最大值為7.6372,同樣存在負值,可能是由于數據異常或測量誤差導致。H?S的平均值為0,標準差也為1,顯示其濃度在整體上呈現較為均勻的分布,波動幅度不大。整體來看,SO?和H?S的數據呈現出一定的波動性和異常值的存在,可能需要進一步的數據清洗和異常值處理。

圖片

圖片

百分位數?SO2閾值 ? ? ? ? ??H2S閾值 ? ? ? ? ?

----------------------------------------

50 0.1648 ? ? ? ? ?-0.0037 ? ? ? ?

75 0.6439 ? ? ? ? ?0.5057 ? ? ? ??

80 0.7398 ? ? ? ? ?0.6331 ? ? ? ??

85 0.8356 ? ? ? ? ?0.8878 ? ? ? ??

90 1.0273 ? ? ? ? ?1.0151 ? ? ? ??

95 1.4106 ? ? ? ? ?1.5245 ? ? ? ??

97 1.6022 ? ? ? ? ?1.7792 ? ? ? ??

98 1.8897 ? ? ? ? ?2.1612 ? ? ? ??

99 2.2730 ? ? ? ? ?2.6706 ? ? ? ??

圖片

圖片

通過計算不同百分位數組合對應的合格率,我們可以選擇最優的閾值組合。我們進一步嘗試不同的百分位數組合,如
?、
?、
?等,以找出使得合格率最大化的閾值組合。

不同閾值組合下的結果:

SO2閾值?H2S閾值 ? ? ?SO2百分位數 ? ? ? ??H2S百分位數 ? ? ? ? 合格率

-----------------------------------------------------------------

0.8356 0.8878 ? ? 85 ? ? ? ? ? ? ?85 ? ? ? ? ? ? ?0.7448

0.8356 1.0151 ? ? 85 ? ? ? ? ? ? ?90 ? ? ? ? ? ? ?0.7645

0.8356 1.5245 ? ? 85 ? ? ? ? ? ? ?95 ? ? ? ? ? ? ?0.8173

0.8356 1.7792 ? ? 85 ? ? ? ? ? ? ?97 ? ? ? ? ? ? ?0.8305

0.8356 2.1612 ? ? 85 ? ? ? ? ? ? ?98 ? ? ? ? ? ? ?0.8406

0.8356 2.6706 ? ? 85 ? ? ? ? ? ? ?99 ? ? ? ? ? ? ?0.8490

1.0273 0.8878 ? ? 90 ? ? ? ? ? ? ?85 ? ? ? ? ? ? ?0.7890

1.0273 1.0151 ? ? 90 ? ? ? ? ? ? ?90 ? ? ? ? ? ? ?0.8092

1.0273 1.5245 ? ? 90 ? ? ? ? ? ? ?95 ? ? ? ? ? ? ?0.8633

1.0273 1.7792 ? ? 90 ? ? ? ? ? ? ?97 ? ? ? ? ? ? ?0.8765

1.0273 2.1612 ? ? 90 ? ? ? ? ? ? ?98 ? ? ? ? ? ? ?0.8866

1.0273 2.6706 ? ? 90 ? ? ? ? ? ? ?99 ? ? ? ? ? ? ?0.8949

1.4106 0.8878 ? ? 95 ? ? ? ? ? ? ?85 ? ? ? ? ? ? ?0.8403

1.4106 1.0151 ? ? 95 ? ? ? ? ? ? ?90 ? ? ? ? ? ? ?0.8613

1.4106 1.5245 ? ? 95 ? ? ? ? ? ? ?95 ? ? ? ? ? ? ?0.9171

1.4106 1.7792 ? ? 95 ? ? ? ? ? ? ?97 ? ? ? ? ? ? ?0.9305

1.4106 2.1612 ? ? 95 ? ? ? ? ? ? ?98 ? ? ? ? ? ? ?0.9409

5.2.2?多模型對比?

除了互相關分析,我們還采用了差分響應分析法來進一步驗證延遲的估計結果。該方法通過分析輸入信號的顯著變化,并觀察輸出信號的響應,來估計延遲。具體地,首先對輸入信號進行差分處理,計算輸入信號的變化幅度(即每個時刻與前一時刻的差值)。然后,設置一個閾值,識別輸入信號中大于該閾值的顯著變化點,這些變化點被認為是輸入信號的脈沖。

通過選擇顯著變化點(脈沖點),我們分析對應的輸出響應。在每個脈沖點之后,我們計算輸出信號的變化,并通過與基線(脈沖點前的輸出值的均值)進行比較,確定響應達到最大值時的延遲。具體來說,我們通過以下步驟來計算延遲:

1.計算輸入信號的差分:

2.選擇差分超過某個閾值的變化點作為顯著變化點。
3.對于每個顯著變化點,記錄輸出信號的響應,計算其與基線的差異。
4.找到響應的最大變化位置,并將其作為延遲估計。
對于每個輸入信號,我們選擇了?5?個以上的顯著變化點,并確保它們之間有足夠的間隔(至少?50?個時間單位)。對于每個選定的脈沖點,我們計算輸出信號的最大響應,并將這些響應時間作為延遲估計的候選值。如果選定的延遲值超過了?3?個有效值,我們取這些延遲的中位數作為最終的延遲估計結果。

在互相關分析法和差分響應法的基礎上,我們結合兩種方法的結果來得到更為可靠的延遲估計。為了合并兩種方法的結果,我們給每種方法分配了不同的權重,通常互相關分析法的權重較大,脈沖響應法的權重較小。綜合延遲估計可以通過加權平均計算得到:

其中,
?和
?是互相關法和脈沖響應法的權重,通常
?。通過這種加權方式,我們得到了每個輸入信號對
?和
?的綜合響應延遲估計。

綜合延時估計結果:

輸入變量?輸出變量? ? ? ?互相關法延時? ? ? ? ??脈沖響應法延時? ? ? ? ?綜合估計延時? ? ? ? ?

---------------------------------------------------------------------------------

IN1 OUT1 ? ? ? 0 ? ? ? ? ? ? ? 144 ? ? ? ? ? ? 43 ? ? ? ? ? ??

IN1 OUT2 ? ? ? 0 ? ? ? ? ? ? ? 129 ? ? ? ? ? ? 39 ? ? ? ? ? ??

IN2 OUT1 ? ? ? 4 ? ? ? ? ? ? ? ? ? ? ? ? ??

IN2 OUT2 ? ? ? 40 ? ? ? ? ? ? ?121 ? ? ? ? ? ? 64 ? ? ? ? ? ??

IN3 OUT1 ? ? ? 25 ? ? ? ? ? ? ? ? ? ? ? ??

IN3 OUT2 ? ? ? 0 ? ? ? ? ? ? ? 126 ? ? ? ? ? ? 38 ? ? ? ? ? ??

IN4 OUT1 ? ? ? 10 ? ? ? ? ? ? ?128 ? ? ? ? ? ? 45 ? ? ? ? ??

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/81276.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/81276.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/81276.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

前端精度問題全解析:用“挖掘機”快速“填平精度坑”的完美解決方案

寫在前面 “為什么我的計算在 React Native 中總是出現奇怪的精度問題?” —— 這可能是許多開發者在作前端程序猿的朋友們都會遇到的第一個頭疼問題。本文將深入探討前端精度問題的根源,我將以RN為例,并提供一系列實用解決方案,讓你的應用告別計算誤差。 一、精度問題的…

2024 睿抗機器人開發者大賽CAIP-編程技能賽-本科組(國賽) 解題報告 | 珂學家

前言 題解 2024 睿抗機器人開發者大賽CAIP-編程技能賽-本科組(國賽)。 國賽比省賽難一些,做得汗流浹背,T_T. RC-u1 大家一起查作弊 分值: 15分 這題真的太有意思,看看描述 在今年的睿抗比賽上,有同學的提交代碼如下&#xff1…

hghac和hgproxy版本升級相關操作和注意事項

文章目錄 環境文檔用途詳細信息 環境 系統平臺:N/A 版本:4.5.6,4.5.7,4.5.8 文檔用途 本文檔用于高可用集群環境中hghac組件和hgproxy組件替換和升級操作 詳細信息 1.關閉服務 所有數據節點都執行 1、關閉hgproxy服務 [roothgdb01 tools]# system…

userfaultfd內核線程D狀態問題排查

問題現象 運維反應機器上出現了很多D狀態進程,也kill不掉,然后將現場保留下來進行排查。 排查過程 都是內核線程,先看下內核棧D在哪了,發現D在了userfaultfd的pagefault流程。 uffd知識補充 uffd探究 uffd在firecracker與e2b的架構下使…

深入解析:構建高性能異步HTTP客戶端的工程實踐

一、架構設計原理與核心優勢 HTTP/2多路復用技術的本質是通過單一的TCP連接并行處理多個請求/響應流,突破了HTTP/1.1的隊頭阻塞限制。在異步編程模型下,這種特性與事件循環機制完美結合,形成了高性能網絡通信的黃金組合。相較于傳統同步客戶…

根據臺賬批量制作個人表

1. 前期材料準備 1)要有 人員總的信息臺賬 2)要有 個人明白卡模板 2. 開始操作 1)打開 人員總的信息臺賬,選擇所需要的數據模塊; 2)點擊插入,選擇數據透視表,按流程操作&…

《AI大模型應知應會100篇》第65篇:基于大模型的文檔問答系統實現

第65篇:基于大模型的文檔問答系統實現 📚 摘要:本文詳解如何構建一個基于大語言模型(LLM)的文檔問答系統,支持用戶上傳 PDF 或 Word 文檔,并根據其內容進行智能問答。從文檔解析、向量化、存儲到…

RTK哪個品牌好?2025年RTK主流品牌深度解析

在測繪領域,RTK 技術的發展日新月異,選擇一款性能卓越、穩定可靠的 RTK 設備至關重要。2025 年,市場上涌現出眾多優秀品牌,本文將深入解析幾大主流品牌的核心競爭力。 華測導航(CHCNAV):技術創…

SpringCloud微服務開發與實戰

本節內容帶你認識什么是微服務的特點,微服務的拆分,會使用Nacos實現服務治理,會使用OpenFeign實現遠程調用(通過黑馬商城來帶你了解實際開發中微服務項目) 前言:從谷歌搜索指數來看,國內從自201…

pgsql14自動創建表分區

最近有pgsql的分區表功能需求,沒想到都2025年了,pgsql和mysql還是沒有自身支持自動創建分區表的功能 現在pgsql數據庫層面還是只能用老三樣的辦法來處理這個問題,每個方法各有優劣 1. 觸發器 這是最傳統的方法,通過創建一個觸發…

math toolkit for real-time development讀書筆記一三角函數快速計算(1)

一、基礎知識 根據高中知識我們知道,很多函數都可以用泰勒級數展開。正余弦泰勒級數展開如下: 將其進一步抽象為公式可知: 正弦和余弦的泰勒級數具有高度結構化的模式,可拆解為以下核心特征: 1. 符號交替特性 正弦級…

uni-app 中適配 App 平臺

文章目錄 前言? 1. App 使用的 Runtime 架構:**WebView 原生容器(plus runtime)**📌 技術棧核心: ? 2. WebView Native 的通信機制詳解(JSBridge)📤 Web → Native 調用&#xf…

SpringBoot基礎(靜態資源導入)

靜態資源導入 在WebMvcAutoConfiguration自動配置類中 有一個添加資源的方法: public void addResourceHandlers(ResourceHandlerRegistry registry) { //如果靜態資源已經被自定義了,則直接生效if (!this.resourceProperties.isAddMappings()) {logg…

基于OpenCV的人臉識別:LBPH算法

文章目錄 引言一、概述二、代碼實現1. 代碼整體結構2. 導入庫解析3. 訓練數據準備4. 標簽系統5. 待識別圖像加載6. LBPH識別器創建7. 模型訓練8. 預測執行9. 結果輸出 三、 LBPH算法原理解析四、關鍵點解析五、改進方向總結 引言 人臉識別是計算機視覺領域的一個重要應用&…

ElasticSearch重啟之后shard未分配問題的解決

以下是Elasticsearch重啟后分片未分配問題的完整解決方案,結合典型故障場景與最新實踐: 一、快速診斷定位 ?檢查集群狀態 GET /_cluster/health?pretty # status為red/yellow時需關注unassigned_shards字段值 ? 2.查看未分配分片詳情 …

CSS- 3.1 盒子模型-塊級元素、行內元素、行內塊級元素和display屬性

本系列可作為前端學習系列的筆記,代碼的運行環境是在HBuilder中,小編會將代碼復制下來,大家復制下來就可以練習了,方便大家學習。 HTML系列文章 已經收錄在前端專欄,有需要的寶寶們可以點擊前端專欄查看! 點…

Git/GitLab日常使用的命令指南來了!

在 GitLab 中拉取并合并代碼的常見流程是通過 Git 命令來完成的。以下是一個標準的 Git 工作流,適用于從遠程倉庫(如 GitLab)拉取代碼、切換分支、合并更新等操作。 🌐 一、基礎命令:拉取最新代碼 # 拉取遠程倉庫的所…

HTML 表格與div深度解析區別及常見誤區

一、HTML<div>元素詳解 <div>是HTML中最基本的塊級容器元素&#xff0c;本身沒有語義&#xff0c;主要用于組織和布局頁面內容。以下是其核心用法&#xff1a; 1. 基礎結構與特性 <div><!-內部可包含任意HTML元素 --><h2>標題</h2><p…

mybatisPlus 新增時 其他字段的值和 id 保持一致實現方法

MyBatis-Plus 實現 sp_id_path 與 id 同步的方案 要實現新增時 sp_id_path 自動與 id 保持一致&#xff0c;需要在實體類和插入邏輯中做相應處理。MyBatis-Plus 提供了幾種方式來實現這一需求&#xff1a; 方案一&#xff1a;使用 MyBatis-Plus 的自動填充功能 這是最優雅的…

蘭亭妙微設計:為生命科技賦予人性化的交互語言

在醫療科技日新月異的今天&#xff0c;卓越的硬件性能唯有匹配恰如其分的交互語言&#xff0c;方能真正發揮價值。作為專注于醫療UI/UX設計的專業團隊&#xff0c;蘭亭妙微設計&#xff08;www.lanlanwork.com&#xff09;始終相信&#xff1a;每一處像素的排布&#xff0c;都應…