【2025年認證杯數學中國數學建模網絡挑戰賽】C題 數據預處理與問題一二求解

目錄

  • 【2025年認證杯數學建模挑戰賽】C題
  • 數據預處理與問題一求解
    • 三、數據預處理及分析
      • 3.1 數據可視化
      • 3.2 滑動窗口相關系數統計與動態置信區間耦合分析模型
      • 3.3 耦合關系分析結果
    • 四、問題一
    • 代碼
      • 數據預處理
      • 問題一

【2025年認證杯數學建模挑戰賽】C題

數據預處理與問題一求解

三、數據預處理及分析

3.1 數據可視化

首先對題目所給數據進行可視化,如下圖所示:
在這里插入圖片描述

  • 圖1 多參數可視化圖

由上圖可知,數據并無明顯的異常值。且輸入氣體2和氣體4的數據分布一致性較高,氣體1和氣體3的數據分布一致性較高。對這兩組數據進一步進行進一步的耦合分析。

3.2 滑動窗口相關系數統計與動態置信區間耦合分析模型

本文基于滑動窗口相關系數統計與動態置信區間估計結合分析兩組氣體的耦合關系。通過局部時域特征提取和統計推斷,分析氣體濃度序列間關聯性的時變規律及突變特征。

首先,對于給定的兩列氣體濃度時間序列和 X ( t ) = { x 1 , x 2 , … , x N } X(t) = \{x_1, x_2, \ldots, x_N\} X(t)={x1?,x2?,,xN?},滑動窗口算法將其劃分為若干重疊的子序列段。設窗口寬度為w,滑動步長為s,則第個窗口k對應的子序列為:
W k ( X ) = { x k , x k + 1 , … , x k + w ? 1 } W k ( Y ) = { y k , y k + 1 , … , y k + w ? 1 } \begin{aligned} W_k(X) &= \{x_k, x_{k+1}, \ldots, x_{k+w-1}\} \\ W_k(Y) &= \{y_k, y_{k+1}, \ldots, y_{k+w-1}\} \end{aligned} Wk?(X)Wk?(Y)?={xk?,xk+1?,,xk+w?1?}={yk?,yk+1?,,yk+w?1?}?

其中 k k k的取值為 1 , s + 1 , 2 s + 1 , … , N ? w + 1 1, s+1, 2s+1, \ldots, N-w+1 1,s+1,2s+1,,N?w+1,確保窗口在時間軸上連續覆蓋。窗口中心點時間 t k t_k tk?取窗口中間位置的時間戳,即 t k = k + ? w 2 ? t_k = k + \left\lfloor\frac{w}{2}\right\rfloor tk?=k+?2w??,以反映窗口內數據的代表性時刻。

在每個窗口內,采用Pearson相關系數量化氣體濃度間的線性關聯強度。對于第 k k k個窗口,相關系數 ρ k \rho_k ρk?的計算公式為:
ρ k = ∑ i = k k + w ? 1 ( x i ? x ˉ ) ( y i ? y ˉ ) ∑ i = k k + w ? 1 ( x i ? x ˉ ) 2 ∑ i = k k + w ? 1 ( y i ? y ˉ ) 2 \rho_k = \frac{\sum_{i=k}^{k+w-1}(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=k}^{k+w-1}(x_i - \bar{x})^2 \sum_{i=k}^{k+w-1}(y_i - \bar{y})^2}} ρk?=i=kk+w?1?(xi??xˉ)2i=kk+w?1?(yi??yˉ?)2 ?i=kk+w?1?(xi??xˉ)(yi??yˉ?)?
其中 x  ̄ k \overline{x}_k xk? y  ̄ k \overline{y}_k y?k?分別為窗口內 X X X Y Y Y的值。 ρ k \rho_k ρk?的取值范圍為 [ ? 1 , 1 ] [-1,1] [?1,1],其絕對值越大表明窗口內兩氣體的濃度變化趨勢越一致。

為評估相關系數的統計顯著性,引入t檢驗。構造t統計量:
t k = ρ k w ? 2 1 ? ρ k 2 t_k = \rho_k \sqrt{\frac{w - 2}{1 - \rho_k^2}} tk?=ρk?1?ρk2?w?2? ?

該統計量服從自由度為 ν = w ? 2 \nu=w-2 ν=w?2的t分布。通過計算p值 p k = P ( T > ∣ t k ∣ ) p_k = P(T > |t_k|) pk?=P(T>tk?),并與顯著性水平 α = 0.05 \alpha=0.05 α=0.05比較,可判斷窗口內相關性是否顯著。

動態置信區間的構建進一步量化了相關系數的不確定性。基于t分布的 100 ( 1 ? α ) % 100(1-\alpha)\% 100(1?α)%置信區間為:
C I k = [ ρ k ? t α / 2 , w ? 2 ? S E k , ρ k + t α / 2 , w ? 2 ? S E k ] CI_k = [\rho_k - t_{\alpha/2,w-2} \cdot SE_k, \rho_k + t_{\alpha/2,w-2} \cdot SE_k] CIk?=[ρk??tα/2,w?2??SEk?,ρk?+tα/2,w?2??SEk?]

其中標準誤 S E k = ( 1 ? ρ k 2 ) ( w ? 2 ) SE_k = \sqrt{\frac{(1 - \rho_k^2)}{(w - 2)}} SEk?=(w?2)(1?ρk2?)? ? t α / 2 , w ? 2 t_{\alpha/2,w-2} tα/2,w?2?為t分布的雙側臨界值。置信區間不包含零時,表明該窗口內的相關性具有統計意義。

針對關聯性突變的檢測,采用滑動方差法。定義滑動窗口方差序列:

σ m 2 = 1 m ∑ i = k k + m ? 1 ( ρ i ? ρ ˉ m ) 2 \sigma_m^2 = \frac{1}{m} \sum_{i=k}^{k+m-1} (\rho_i - \bar{\rho}_m)^2 σm2?=m1?i=kk+m?1?(ρi??ρˉ?m?)2

其中 m m m為方差計算窗口大小 m m m ρ ˉ m \bar{\rho}_m ρˉ?m?為局部均值。通過設定閾值 θ = η ? std ( σ 2 ) \theta = \eta \cdot \text{std}(\sigma^2) θ=η?std(σ2),當 σ m 2 > θ \sigma_m^2 > \theta σm2?>θ時判定為關聯性突變點。

多尺度分析則通過改變窗口寬度 w w w實現不同時間分辨率的特征捕捉。短窗口( w = 100 w=100 w=100)側重瞬態波動,長窗口( w = 400 w=400 w=400)反映穩態關聯,多尺度相關系數序列KaTeX parse error: Expected 'EOF', got '}' at position 15: \{\rho_k^{(w)}}?的對比可揭示氣體相互作用機制的尺度依賴性。

3.3 耦合關系分析結果

在這里插入圖片描述

  • 圖2 氣體組間動態相關系數演化

在這里插入圖片描述

  • 圖3 Gas1-Gas3

四、問題一

在這里插入圖片描述

代碼

數據預處理

在這里插入圖片描述

問題一

在這里插入圖片描述

國獎學姐的認證杯C題完整論文與代碼,今天下午寫完全部的~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/76769.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/76769.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/76769.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI Agent開發大全第二十八課-MCP實現本地命令調用怎么做的?

開篇 MCP很強大,Client端一旦實現了穩定的連接和執行流程后任Server端隨意改動都可兼容,這就是熱插撥功能。 如果我們僅僅滿足于MCP查點網上資料、讀點圖片即文字型的功能肯定是不能充分發揮MCP的強大之處的,正應了Google以及Anthropic最近的研究報告上說的:不要再在chat…

AJAX原理與XMLHttpRequest

目錄 一、XMLHttpRequest使用步驟 基本語法 步驟 1:創建 XHR 對象 步驟 2:調用 open() 方法 步驟 3:監聽 loadend 事件 步驟 4:調用 send() 方法 二、完整示例 1. GET 請求(帶查詢參數) 2. POST 請…

python寫個0~12個月寶寶喂養規劃表

下載字體:https://github.com/adobe-fonts/source-han-sans/releases 下載fpdf2 pip uninstall fpdf pip install fpdf2運行代碼 ?from fpdf import FPDF from fpdf.enums import XPos, YPos# 創建 PDF 類 class BabyFeedingPDF(FPDF):def header(self):self.s…

集中趨勢描述

一、集中趨勢的定義與核心目標 集中趨勢指數據向其中心值聚集的傾向,反映數據的典型水平或分布中心。其核心是通過統計指標(如眾數、中位數、均值)概括數據的核心特征,幫助快速理解數據分布的核心位置。 核心作用:簡化復雜數據、指導業務決策(如確定用戶平均消費水平)、…

【NLP】Attention機制

1.模型對比 RNN(馬爾科夫鏈式編碼) 通過遞歸計算逐個處理 token,當前編碼結果 h t h_t ht?僅依賴前一步的隱藏狀態 h t ? 1 h_{t-1} ht?1?和當前輸入 x t x_t xt?局限性:序列建模需嚴格串行,無法并行;長距離依賴易丟失(梯度消失/爆炸)例:雙向 LSTM 需正向+反向兩…

基于OpenCV與PyTorch的智能相冊分類器全棧實現教程

引言:為什么需要智能相冊分類器? 在數字影像爆炸的時代,每個人的相冊都存儲著數千張未整理的照片。手動分類不僅耗時,還容易遺漏重要瞬間。本文將手把手教你構建一個基于深度學習的智能相冊分類系統,實現:…

活動安排問題 之 前綴和與差分

文章目錄 D. Robert Hood and Mrs Hood 考慮到一個活動開始時間和結束時間s,e,那么可以影響到的范圍就是 s-d1,e,所以我們只需對這個每一個活動可以影響到的區域進行標記即可,當然為了降低時間復雜度,我們將使用前綴和與差分 t int(input()…

C++之 多繼承

在學校里有老師和學生,他們都是人,我么應該創建一個名為 Person 的基類和兩個名為 Teacher 和Student 的子類,后兩者是從前者繼承來的 有一部分學生還教課掙錢(助教),也就是同時存在著兩個”是一個”關系&…

大數據學習棧記——Redis安裝及其使用

本文介紹NoSQL技術:Redis的安裝及其使用。操作系統:Ubuntu24.04 Redis介紹 Redis是一個鍵值(key-value)存儲系統,即鍵值對非關系型數據庫,和Memcached類似,目前正在被越來越多的互聯網公司采用…

2024團體程序設計天梯賽L3-1 奪寶大賽

L3-037 奪寶大賽 分數 30 作者 陳越 單位 浙江大學 奪寶大賽的地圖是一個由 nm 個方格子組成的長方形,主辦方在地圖上標明了所有障礙、以及大本營寶藏的位置。參賽的隊伍一開始被隨機投放在地圖的各個方格里,同時開始向大本營進發。所有參賽隊從一個方格…

JMeter的高并發和高頻率和分布式

性能測試 模擬各種正常的、峰值的測試環境,檢測程序的各項性能指標是否能夠達標 高并發 JMeter中內置了定時器,可以實現時間模式相關的性能測試 需求1:同一時刻100個同學去訪問學生管理系統的查詢所有學院信息功能,統計高并發情況下平均響…

ubuntu學習day2

linux常用命令 3.文件查看及處理命令 3.1查看文件內容 cat[選項][文件] -b 對非空輸出行編號 -E 在每行結束處顯示$ -n 對輸出的所有行編號 -s 不輸出多行空行 標準輸入、標準輸出和標準錯誤 在 Linux 中,每個進程默認有三個文件描述符: 標準輸入&…

項目中引入 Redis 及 常用五種數據類型

在平常的開發過程中,我們經常會用到緩存的技術。比如,驗證碼60秒后過期、計數器的實現、商品信息存儲在緩存中快速展示等。那么,項目中經常會使用到的便是 redis 緩存。redis 在內存中操作,讀寫快。Redis 常用的數據類型有五種&am…

Spark-SQL簡介及核心編程

Spark-SQL概述:是Spark用于結構化數據處理的模塊,前身是Shark。Shark基于Hive開發,使SQL-on-Hadoop性能大幅提升,但對Hive依賴制約了Spark發展。SparkSQL汲取Shark優點并重新開發,在數據兼容、性能優化和組件擴展上優勢…

奇趣點播系統測試報告

1.項目簡介 本項目旨在搭建一個視頻共享點播系統,服務器支持用戶通過前端瀏覽器訪問服務器,獲取展示與觀看和操作的界面,最終實現視頻的上傳以及觀看和刪改查等基礎管理功能。讓用戶擁有良好的觀看體驗和分享視頻的快捷方式,此外…

【Web API系列】WebSocketStream API 深度實踐:構建高吞吐量實時應用的流式通信方案

前言 在當今的 Web 開發領域,實時通信已成為許多應用的核心需求。無論是即時聊天、實時數據儀表盤,還是在線游戲和金融交易系統,都需要高效的雙向數據傳輸能力。傳統的 WebSocket API 為此提供了基礎支持,但在處理大規模數據流、…

基于LangGraph的智能報告生成平臺項目分析

前言 不知道你是否知道或者了解OpenAI and Gemini Deep Research。他們是一種能夠根據輸入問題進行規劃、結合網絡搜索獲取信息并最終呈現結果的研究工具或技術。那這樣research是如何實現的呢?最近剛好看到一個實現類似功能的開源項目: open_deep_search。本文將基于該項目進…

Redis 常見的集群架構

Redis 常見的集群架構 以下是 Redis 常見的集群架構及其核心模式詳解,結合其設計原理、適用場景和優缺點進行綜合說明: 一、主從復制模式 架構原理 角色劃分:包含一個主節點(Master)和多個從節點(Slave&…

面試寶典(C++基礎)-01

文章目錄 1. C++基礎1.1 C++特點1.2 說說C語言和C++的區別1.3 說說 C++中 struct 和 class 的區別1.4 include頭文件的順序以及雙引號""和尖括號<>的區別1.5 說說C++結構體和C結構體的區別1.6 導入C函數的關鍵字是什么,C++編譯時和C有什么不同?1.7 C++從代碼…

快速獲得ecovadis認證的方法,如何提升ecovadis認證分數,有效期是多久

快速獲得EcoVadis認證的方法 EcoVadis認證是企業社會責任&#xff08;CSR&#xff09;和可持續發展能力的國際評估標準&#xff0c;被廣泛應用于供應鏈管理&#xff08;如蘋果、微軟、聯合利華等巨頭要求供應商通過EcoVadis評估&#xff09;。以下是快速獲得認證的關鍵步驟&am…