運籌優化(OR)-在機器學習(ML)浪潮中何去何從?

在如今機器學習的浪潮中,機器學習相關的崗位日益增多,而運籌優化的崗位卻相對較少。這是今年我秋招過程中看到的現象。企業越來越希望候選人不僅能建模求解,還能理解如何用數據驅動優化。需要我們有一個完整的技術棧。那么我們就來看看OR與ML的關系,探索一下兩者結合的方向,以便認清后續發展道路。

首先,ML和OR并非替代關系,而是互補協同的兩種決策科學工具。

  1. ML擅長預測:從歷史數據中學習模式;OR擅長決策:在資源約束下尋找最優解或可行解。

  2. 1.ML for OR

  3. 1.1 ML不直接做決策,而是提升OR模型的輸入質量。

  4. 這里有一個很重要的概念Predict-then-Optimize,指的是先用ML模型預測不確定性參數,再講預測值帶入優化模型求解。

  5. 這其中會有一些潛在的風險,首先就是目標錯配,這是指ML模型通常以MAE/MSE為目標訓練,但這些誤差對決策的影響可能不對稱。比如:高估了需求導致庫存積壓、低估了需求導致缺貨,這兩者代價在實際應用總是不同的,但是如果我們使用MAE/MSE為目標進行訓練,將會把兩者一視同仁。也就是說,我們想直接將決策風險(也就是上面說的高估了多少還是低估了多少)作為損失函數。但是,通過Predict-then-Optimize的流程:

  6. 輸入數據 → ML 模型 → 預測值 → 優化模型 → 決策 → 實際成本

    會發現這當中的優化模型,也就是我們通常可能調用求解器求解的數學模型(這就是OR的部分),是一個“黑箱算子”,通常不可導,那么對于我們的ML來說就沒法進行它的核心算法——反向傳播

  7. 為了解決這個問題,有學者提出了SPO(Smart Predict-then-Optimize),這是一個框架,他的核心思想就是訓練的損失應該與最終決策的代價掛鉤。將決策風險定義為:使用預測值求解后的成本與使用真實值求解的成本之差。訓練目標是最小化這個決策風險。可以通過次梯度平滑近似等方式來近似梯度。

  8. 此外還可以使用可導的近似模型、不依賴中間梯度的強化學習等方式來解決這個問題。

  9. 上面說的不可導性與黑箱性也是潛在風險之一。

  10. 還有就是誤差放大的潛在風險。對于解空間敏感的OR問題,小的預測誤差可能導致完全不同的最優解。需要引入敏感性分析,評估預測誤差對解的影響。

  11. 1.2 OR求解器集成ML技術,加速求解過程。

  12. 學習策略分支:使用ML模型預測哪個變量分支最有希望,替代部分強分支調用;

  13. 節點選擇策略:學習哪種策略(深度優先、最佳有限、最佳估計)更適合當前問題結構;

  14. 啟發式參數自動調優;割平面選擇等等。

  15. 2.OR for ML

  16. 用運籌優化(OR)來提升機器學習(ML)性能。

  17. 最優實驗設計:建模為子集選擇問題;

  18. 神經網絡剪枝與結構搜索:保留哪些連接可以建模為0-1變量,使用OR壓縮模型;

  19. 強化學習中嵌入求解器;可解釋機器學習中的規則生成等等。

  20. 3.End-to-End Learning for Optimization

  21. 跳過顯式建模,直接用神經網絡學習從輸入到最優解的映射。在這個過程中,輸出可能違反問題的約束,因此需要結合OR使用。我認為當前最好的做法是:用端到端ML模型生成候選解,再用 OR 模型校正或排序。

  22. 4.未來方向

  23. 我們做運籌優化的最擔心的就是未來ML取代傳統的OR。但是從目前來看是不會的,兩者將會進行深度融合,會有ML for OR,也會有OR for ML。首先,OR的優勢是不可替代的,給出能夠滿足硬約束的最優解、解釋性強等等。其次,ML是由局限性的,無法保證約束滿足、解釋性差(黑箱性)、泛化能力依賴于數據分布等等。

  24. 結合我做的來說一下吧,在一些控制策略(紅綠燈)中我會用OR的數學規劃和元啟發式算法得到這個問題的baseline,然后在環境突然發生改變(救護車來到)時,使用RL實現動態調整。在智能駕駛的場景中,自動駕駛需要感知和規劃的協同,對環境的感知需要ML,對路徑和時間的精確規劃需要OR。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/920135.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/920135.shtml
英文地址,請注明出處:http://en.pswp.cn/news/920135.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

GitHub Copilot 在 VS Code 上的終極中文指南:從安裝到高階玩法

GitHub Copilot 在 VS Code 上的終極中文指南:從安裝到高階玩法 前言 GitHub Copilot 作為 AI 編程助手,正在徹底改變開發者的編碼體驗。本文將針對中文開發者,深度解析如何在 VS Code 中高效使用 Copilot,涵蓋基礎設置、中文優化…

安全測試、web探測、httpx

💢 簡介 httpx 是一個快速且多用途的HTTP工具包,允許使用retryablehttp庫運行多個探測器。它旨在通過增加線程數量來保持結果的可靠性。 功能 🤪 發送 GET、POST、PUT、DELETE 等 HTTP 請求支持流式傳輸支持重定向支持身份驗證支持代理支持 …

CNN 中 3×3 卷積核等設計背后的底層邏輯

為什么卷積核愛用 33?CNN 設計 “約定俗成” 的底層邏輯 做深度學習的同學,對 CNN 里 33 卷積核、最大池化、BN 層這些設計肯定不陌生,但你有沒有想過:為啥卷積核總選 33?池化層為啥默認最大池化?BN 層又是…

稅務崗位職場能力解析與提升路徑規劃

稅務崗位作為企業運營的核心環節之一,對從業者的專業能力與綜合素質要求極高。從基礎稅務核算到戰略稅務籌劃,職場能力的提升需要系統化的路徑規劃。以下從核心能力、階段化提升路徑及證書價值三個維度展開分析。核心能力體系構建專業稅務能力是基礎&…

MySQL 索引:結構、對比與操作實踐指南

MySQL系列 文章目錄MySQL系列前言案例一、認識MySQL與磁盤1.1 MySQL與存儲1.2 MySQL 與磁盤交互基本單位二、 MySQL 數據交互核心:BufferPool 與 IO 優化機制三、索引的理解3.1 測試案例3.2 page3.3 頁目錄3.3 對比其他結構四、聚簇索引 VS 非聚簇索引五、索引操作5…

GitHub 熱榜項目 - 日榜(2025-08-24)

GitHub 熱榜項目 - 日榜(2025-08-24) 生成于:2025-08-24 統計摘要 共發現熱門項目:20 個 榜單類型:日榜 本期熱點趨勢總結 本期GitHub熱榜呈現三大技術熱點:1)AI應用爆發式創新,包括神經擬真伴侶&#…

純凈Win11游戲系統|24H2專業工作站版,預裝運行庫,無捆綁,開機快,游戲兼容性超強!

哈嘍,大家好! 今天給大家帶來一款 Windows 11 游戲版本系統鏡像,軟件已放在文章末尾,記得獲取。 一、軟件獲取與啟動 解壓后雙擊exe即可直接運行,無需額外安裝。首次啟動界面簡潔,引導清晰。 二、系統選…

CI/CD 學習之路

目錄 簡介: 1、工具介紹: 2、搭建jenkins 1)創建一個文件Dockerfile,文件無后綴,寫入以下代碼 2)在Dockerfile文件所在目錄執行(my-jenkins-android 未自定義鏡像名稱) 3&#xf…

馬斯克宣布開源Grok 2.5:非商業許可引爭議,模型需8×40GB GPU運行,Grok 3半年后開源

昨晚,馬斯克在 X 平臺連續發布多條消息,宣布其人工智能公司 xAI 已正式開源 Grok 2.5 模型。這款模型是 xAI 在 2024 年的主力模型,如今完全向公眾開放。與此同時,馬斯克還預告了下一代模型 Grok 3 的開源計劃,預計將在…

DMP-Net:面向腦組織術中成像的深度語義先驗壓縮光譜重建方法|文獻速遞-深度學習人工智能醫療圖像

Title題目DMP-Net: Deep semantic prior compressed spectral reconstruction methodtowards intraoperative imaging of brain tissueDMP-Net:面向腦組織術中成像的深度語義先驗壓縮光譜重建方法01文獻速遞介紹腦腫瘤可分為原發性和繼發性兩類。原發性腦腫瘤多發生…

【nl2sql綜述】2025最新綜述解讀

論文地址:https://arxiv.org/pdf/2408.05109 解讀:邁向數據民主化——大型語言模型時代下的Text-to-SQL技術綜述 近期,一篇名為《A Survey of Text-to-SQL in the Era of LLMs》的綜述論文系統性地梳理了自然語言到SQL查詢(Text-t…

logback-spring.xml 文件

一.概述這是一個日志文件,主要用來對應用程序的日志進行記錄,并且可以配置日志的一些格式和規則。二.讀取機制1.SpingBoot自動識別進行文件掃描時,當在 classpath 下發現名為 logback-spring.xml 的文件時,Spring Boot 會自動加載…

LeetCode Hot 100 第二天

1. 283 移動零 鏈接&#xff1a;題目鏈接 題解&#xff1a; 要求&#xff1a;時間復雜度 < O (n^2) 題解&#xff1a;將非零元素依次往前移&#xff08;占據0元素的位置&#xff09;&#xff0c;最后再將0元素填充至數組尾。時間復雜度O(n)&#xff0c;用一個指針x來維護非…

04-Maven工具介紹

文章目錄1、Maven官網2、Maven的3個重要功能3、Maven安裝3.1 安裝教程的視頻3.2 安裝教程的文本1、Maven官網 https://maven.apache.org/ 2、Maven的3個重要功能 黑馬程序員JavaWeb基礎教程&#xff0c;Java web從入門到企業實戰完整版 3、Maven安裝 3.1 安裝教程的視頻 …

基于開源 AI 智能名片鏈動 2+1 模式 S2B2C 商城小程序的新開非連鎖品牌店開業引流策略研究

摘要&#xff1a;本文聚焦于一家新開且地理位置優越、目標客戶為周邊“80 后”“90 后”上班族的非連鎖品牌店。在明確店鋪定位、完成店內設計與菜品規劃等基礎工作后&#xff0c;探討如何在新店開業初期有效打響品牌、吸引目標客戶。通過引入開源 AI 智能名片鏈動 21 模式 S2B…

UE5多人MOBA+GAS 54、用戶登錄和會話創建請求

文章目錄創建主菜單需要的創建主菜單游戲模式創建主菜單游戲控制器創建主菜單界面UI實現登錄游戲實例創建等待界面配置和獲取協調器 URL撰寫和發送會話創建請求創建主菜單需要的 創建主菜單游戲模式 MainMenuGameMode 創建主菜單游戲控制器 MainMenuPlayerController #p…

SCSS上傳圖片占位區域樣式

_App.scss// 上傳圖片占位區域樣式---------------------------------------- [theme"uploadImage"] {transition: 0.2s;position: relative;cursor: pointer;border-radius: 4px;/*居中填滿*/background-repeat: no-repeat;background-position: center;background-…

Prometheus+Grafana監控mysql

1、簡述 使用 Prometheus 結合 Grafana 監控 MySQL 是一套成熟且廣泛應用的方案&#xff0c;能實現對 MySQL 性能、狀態等指標的實時采集、存儲、可視化及告警。 2、整體架構說明 Prometheus&#xff1a;負責定時從 MySQL 采集監控指標&#xff08;需借助 Exporter&#xff0…

網絡流量分析——Tcpdump 數據包過濾

文章目錄.PCAP 文件Tcpdump 數據包過濾過濾和高級語法選項有用的 TCPDump 過濾器主機過濾器源/目標過濾器使用源和端口作為過濾器將目標與網絡過濾器結合使用協議過濾器 - 通用名稱協議過濾器 - 編號端口過濾器端口范圍過濾器小于/大于過濾器利用更大的AND 過濾器無濾鏡的基本捕…

DeepSeek V3.1 橫空出世:重新定義大語言模型的邊界與可能

當大語言模型領域的競爭進入白熱化階段&#xff0c;一場靜默的技術革命正在悄然醞釀。2025 年8月19日&#xff0c;DeepSeek 團隊帶著全新升級的 V3.1 版本強勢登場&#xff0c;這個被業內稱為 “智能體時代敲門磚” 的模型&#xff0c;究竟藏著多少顛覆認知的黑科技&#xff1f…