- 模型假設僅僅是簡單陳述嗎?
- 允許AI的使用是否降低了比賽難度?
- 還在依賴機器學習的模型嗎?
- 處理題目的方法有哪些?
- O獎論文的優點在哪里?
本文調研了當年賽題的評委文章和O獎論文,這些問題都會在文章中一一解答。
引言
每年美賽結束后,評委根據參賽情況撰寫評論文章,其中包括:
- 為了求解24年C題,可以采用哪些方法和模型?
- 24年C題的論文優點有哪些?缺點又是什么?
- 對文章其他部分的評價:數據預處理、AI的使用...
本文結合評委意見和當年O獎論文對24年美國大學生數學建模競賽C題做出要點分析和總結,讓我們一起來看看2024年美賽C題賽題分析吧!
省流
閱讀原始全文點這里
相關文章:
2023年美賽C題評委文章及O獎論文解讀 | 美國大學生數學建模競賽 從評委和O獎論文出發-O獎論文做對了什么?
如何在美賽中獲得更高獎項?|從組委會評選流程和分診機制出發
簡介
背景
24年C題要求團隊基于網球比賽數據集進行建模,要求模型具有兩個特點:在比賽任何時刻揭示和預測球員的表現和表現差異;通過勢頭及其變化揭示球員優勢。
此次比賽首次允許使用AI資源,但應記錄查詢內容和AI回應。
問題重述
在此進行簡單的問題說明。
- 構建一個可以捕捉比賽進行時局勢流動的模型,當應用到比賽中時,可以確定某個時刻哪個球員表現好以及其優勢有多大;
- 用模型或指標來判斷球員表現波動和成功的連續發生是否隨機;
- 創建一個模型來預測勢頭的變化,并探索其與比賽特定因素(如選手狀態、比賽關鍵節點等)的關系,判斷哪一個最關鍵;
- 提出能夠量化勢頭的指標,基于這些指標預測不同比賽的勢頭趨勢,并討論模型的適用性和可靠性。
- 向教練提供關于“勢頭”作用的建議,以及如何讓球員應對在網球比賽中影響比賽流程的事件。
問題假設
好的假設是數學化的陳述+合理的解釋,例如隊伍2418251提出每局比賽中的勢頭是離散的。
?
?還有隊伍2425454提出當隊員得分,會獲得“激勵效果”,從而增加得分概率。識別并合理化任何(以及所有)建模假設,這是建模過程中必要的要求。
?
僅僅為了滿足流程而要求呈現的簡單陳述并不被看好,例如“假設所給數據是真實準確的”、“假設選手的比賽目標是獲勝”。
評委意見:建模假設需要進行討論和評估,可以通過敏感性分析和模型測試來證明模型的適當性和充分性。
AI的使用
是否可以直接用AI來進行建模和編程?答案是否定的。
評委意見:與通過同行評審確保質量控制并增強結果可信度的研究不同,AI生成的結果在這方面是未經驗證和不受約束的。
因此,在妥善引用AI的同時,還應對結果進行驗證。然而,美賽時間本來就緊張,再去對AI結果進行驗證,可能會成為時間陷阱。
在比賽中使用AI的隊伍,大多為了解決4個方面的內容:
- 改善段落或句子的表達;
- 檢查或建議小型程序代碼段;
- 幫助識別相關的文獻來源;
- 提議關于如何開始建模網球勢頭概念的方法。
例如,隊伍2401919采用AI明確定義、生成小段示例代碼、提出解決問題的建議。
數據處理
數據預處理
拿到數據集后首要工作便是數據預處理,需要評估數據的有效性,處理異常值和缺失值。
?
以本次數據集中speed_mph參數為例,通過散點圖可以明顯看出有數據異常,可以采用刪除數據點、滑動窗口平均等方法進行處理。
利用軟件或機器學習求解
MCM評委很不推薦采用“全盤灌輸”式的軟件求解方法和直接將機器學習的結果合理化為比賽中的勢頭及其變化的方法
數學建模是為了體現創造性和批判性思維,通過蠻力和偶然性找到有效建模方法,抑或將機器學習方法以“黑箱”方式使用,都缺乏對模型參數選擇原因的討論,即使在最后使用這些方法進行jiacha或敏感性分析,也只是為了表明所做選擇是合理的。
評委意見:如果要選用機器學習的方法,最好選擇一種可以在少量假設條件下最佳應用的機器學習方法,并在之后逐步放寬這些假設,以提升模型的真實性能和可靠性。這種方法能夠更好地體現團隊的技術能力和建模思維。
隊伍2403774便很好地利用了神經網絡。該隊伍首先利用貝葉斯在線拐點檢測方法預測出拐點所在區間,接著采用時序卷積網絡(TCN)進行準確預測,同時針對網球比賽的特點,進行有意義的改進,設計出多階段時序卷積網絡(MSTCN)來整合多個時間尺度的比賽信息,以進行模型預測。
通過查閱文獻逐步進行建模
在撰寫論文時,應體現構建模型的過程,從而反映出參賽人員對于題目的理解,更符合評委的胃口。
通過查閱可靠專業來源,先識別可能構成“勢頭”的信息性要素;接著依靠這些數據,采用線性或非線性的方法進行建模,構建動態表達式。不同的動態表達式取決于隊伍的選擇,并且都有研究文獻的支持。
評委意見:動態表達式的方法更符合數學建模的理念,能夠更有效地解釋每個術語在最終表達式中的構建過程及其意義。
隊伍2409404通過線性表達式,量化勢頭,并畫出比賽過程中勢頭的變化曲線。
任務一:構建反映局勢流動的模型
題目所給的數據集很龐大,提供了豐富的潛在數據元素來表示勢頭及其在網球比賽中的變化。因此,需要從中進行選擇,構建數據子集,減少復雜度。
評委意見:傳統的TOPSIS(與理想解的貼近度排序法)模型由于依賴于主觀指標權重,會顯著影響結果。因此,主成分分析(PCA)成為一種客觀的分析方法,用于降低數據維度。
例如,隊伍2401919采用PCA-TOPSIS模型開發了一個全面的球員表現評估系統。首先得出所有因素的相關系數矩陣,計算特征值;接著從中挑選出6個具有最大的特征值的因素作為主成分決策矩陣;最后計算特征值在所有特征值中的占比,得出因素權重。
數據降維有很多種方法:主成分分析(PCA)、線性判別分析(LDA)、奇異值分解(SVD)、自回歸積分滑動平均(ARIMA)和熵。
任務二:判斷“勢頭”在比賽中是否起作用
這道題的本質和2023年美賽C題類似,實際上就是判斷第一問模型的結果和實際比賽結果的比較:如果二者相近,則“勢頭”在比賽中起作用,否則不起作用。于是,可以使用假設檢驗等一系列方法進行求解和判斷。
閱讀剩余內容點這里,包括
評委對勢頭預測模型的評價如何?評委是否認可神經網絡、XGBoost等黑盒方?。
其他隊伍如何建立勢頭預測模型?在這個問題中評委最看重哪些部分?
對模型準確性驗證在評分中占比大嗎?
敏感性分析是否必要?獲獎論文如何進行敏感性分析?
評委給出的獲獎論文的必要條件有哪些?
以及文末要點總結。
如果你覺得內容還不錯,可以點擊鏈接閱讀全文
2024年美賽C題評委文章及O獎論文解讀 | AI工具如何影響數學建模?從評委和O獎論文出發-O獎論文做對了什么?