NJU 凸優化導論(9) 對偶(II)KKT條件+變形重構

https://www.lamda.nju.edu.cn/chengq/optfall24/slides/Lecture_9.pdf

目錄

關于對偶的一些解釋

1. Max-min characterization 最大最小準則

2. Saddle-point Interpretation 鞍點解釋

3. Game interpretation 博弈論里的對偶

Optimality Conditions 最優條件

1. Certificate of Suboptimality and Stopping Criteria?次優性證明與停止準則

2. Complementary Slackness 互補松弛性

3. KKT Optimality Conditions

Ex.1

Ex.2

4. Solving the Primal Problem via the Dual 通過對偶解原問題

例1. Entropy Maximization 最大熵問題

例2. 等式約束與函數分配

5. Examples

5.1 引入新變量及相關等式約束

5.1.1 Unconstrained geometric program

5.1.2? Norm approximation problem

5.1.3不等式約束的幾何規劃

5.2 原目標函數的轉換

5.3顯式約束隱式化 納入目標函數的定義域

6. Generalized inequalities 廣義不等式

Ex.1

Ex.2


關于對偶的一些解釋

1. Max-min characterization 最大最小準則

如果有f>0 選取無窮大λ 上界就達到無窮; 如果所有 f≤0 取λ=0 結果即為f0

原問題? 對偶問題

代入這兩個 p*為上界的下界 以及 d*為下界的上界 可重寫強弱對偶

2. Saddle-point Interpretation 鞍點解釋

3. Game interpretation 博弈論里的對偶

玩家1選擇w? 玩家2 選擇z? 玩家1向玩家2支付?因此1想最小化? ?2想最大化

若玩家1先選 會預判到 玩家2會選擇他選后的最優 即為上界

所以玩家1會選?交易為

若玩家2先手 則交易為

這個問題中 同一玩家 先動時一定比后動時收益更高,最優對偶的間隙gap即為先動優勢。

但如果鞍點存在,先后動的最優一致,均為鞍點處。

回到之前的拉格朗日問題 即為玩家1選x 玩家2選λ,最優的x*對應p* 最優的λ*對應d*。

Optimality Conditions 最優條件

1. Certificate of Suboptimality and Stopping Criteria?次優性證明與停止準則

如果能找到一個原問題的可行解f0(x) 對偶問題的可行解g(λ,v)? ?可框定范圍 g(λ,v) ≤ d *≤ p* ≤ f0(x)

可在迭代k次后 計算一下對偶間距 絕對誤差 相對誤差,幫助確定迭代的終止條件

2. Complementary Slackness 互補松弛性

強對偶成立時 原問題對偶問題最優值相等 下面兩個≤ 都得取等

需要?由于每一項≤0? 也就需要每個都=0?

也就有互補松弛性 其中一個>0 則有另一個=0

? ? ?

3. KKT Optimality Conditions

KKT條件是 非凸優化的必要條件(可推出)? ? 特別地,是凸優化的充要條件

對于對偶間距為0的強對偶問題 若最優點為?

?偏導數為0

可行條件? ? ?對偶條件

總偏導數為0

為什么對于凸優化充分:

對于凸優化而言,f是凸函數 h是仿射函數 偏導為0就可推出 L是全局最小值

對于一般優化 KKT(偏導為0)是MIN 的必要條件 ; 凸優化 KKT <=> MIN

Ex.1

是凸優化 因為沒有不等式約束 KKT只有等式約束和偏導=0 兩個條件

Ex.2

列出KKT條件 三個原先 一個對偶 一個總偏導

? 用其他量表示λ 消去λ

?????

因為x*求和為1 就像把1體積的水倒入 底部高度為αi的容器 水位在1/v*

如果不用凸優化 偏導為?越小降低空間越大

每次調高偏導最小的x 最后結果即確定一個閾值(水位)閾值以下的加到閾值

4. Solving the Primal Problem via the Dual 通過對偶解原問題

若對偶最優解(λ*,v*)存在,對應到 min L(x,λ*,v*)? ? ? ?λ v先確定的前提下 x對應使L最小的取值

原問題可行,則對偶問題有最優解; 原問題無可行解,則對偶問題無界

四步:1.寫出對偶問題? 2.slater條件 是否強對偶? 3.求解對偶問題? 4.KKT 對偶問題對應原問題

例1. Entropy Maximization 最大熵問題

?NJU 凸優化導論(8) Lagrange Dual 拉格朗日對偶-CSDN博客

之前在共軛函數 slater條件那里 兩次提過這個例子(附近的知識點遺忘可以點上面鏈接復習一下)

滿足弱版本的slater條件 不等式為仿射函數

求解對偶問題:對偶問題對v求導?再代入對偶問題

?

求解λ和v之后帶入得x???

例2. 等式約束與函數分配

求解對偶函數得到v*

若f都是凸函數 則L也是凸函數 則目標x要最小化L? L對x求偏導 得x*與v*的關系

5. 變形重構原問題 轉換對偶

通過示例說明,對一個問題進行簡單的等價重構,可能會得到截然不同的對偶問題

5.1 引入新變量及相關等式約束

? 沒約束 寫拉格朗日還是本身

由原來的無約束 添加變量寫成有等式約束

? ? 拉格朗日形式為

?否則下界就負無窮

所以總的對偶問題可以寫成?

5.1.1 Unconstrained geometric program

?原問題添加變量寫成

對共軛形式求偏導?且要滿足條件??

用v消去y得到共軛函數? ?把共軛函數和條件對應定義域? 得到對偶問題

5.1.2? Norm approximation problem

?把仿射拿出來 改寫成

?代入范數的共軛得

仿射套函數 可改寫為?否則x就可以使L到無窮小? ?每個f都寫成共軛

故可以寫作

5.1.3不等式約束的幾何規劃

我們? ?就變成?可代入上模版

利用這個 指數求和對數 exp-sum-log 的共軛

5.2 原目標函數的轉換

把原問題的f0 用一個遞增函數替換 使得結果不變 但使得對偶問題更好

一個方式的范數變換 是之前上面的 5.1.2 Norm approximation problem? 但我們還可以

?把二范數平方/2 使得更好求導

?對y偏導得?

最后的對偶問題為

5.3顯式約束隱式化 納入目標函數的定義域

?

如果改寫 把盒形約束放到 f0 中

? ? ???

v前的系數為 Av+c 因為要最小化 對于每個x 如果系數為正就取l 為負就取u

好處是 這個對偶最后是一個無約束問題

6. Generalized inequalities 廣義不等式

? ?? ?

廣義的Slater條件 換成廣義小于

Ex.1

Ex.2

Slater條件?

? ?? 消掉λ 再代入

同樣具有互補松弛性

同樣的 Slater條件、KKT條件、互補松弛性 只是把不等式改成廣義不等式

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/89594.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/89594.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/89594.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Vue Swiper組件

Vue 漸進式JavaScript 框架 基于Vue2的學習筆記 - Vue Swiper組件實現筆記 目錄 Swiper組件 下載swiper 創建swiper組件 保存時修復 編寫swiper內容 引入swiper 使用swiper Swiper子組件 創建Swiper列表組件 使用子組件 增加生命周期 增加圖片顯示 加載數據 渲染…

Linux:lvs集群技術

一.集群和分布式1.1 集群集群是為了解決某個特定問題將多臺計算機組合起來形成的單個系統。即當單獨一臺主機無法承載現有的用戶請求量&#xff1b;或者一臺主機因為單一故障導致業務中斷的時候&#xff0c;就可以增加服務主機數&#xff0c;這些主機在一起提供服務&#xff0c…

【管理】持續交付2.0:業務引領的DevOps-精要增訂本,讀書筆記(理論模型,技術架構,業務價值)

【管理】持續交付2.0&#xff1a;業務引領的DevOps-精要增訂本&#xff0c;讀書筆記&#xff08;理論模型&#xff0c;技術架構&#xff0c;業務價值&#xff09; 文章目錄1、持續交付的理論模型&#xff08;第1-3章&#xff09;1.1 結構圖1.2 持續交付的演進1.3 雙環模型理論體…

Wilcox檢驗的星星怎么規定的?

在 R 里&#xff0c;常見的把 p 值映射為“星號”標記&#xff08;顯著性水平&#xff09;的規則通常是&#xff1a;p 值范圍標記p ≤ 0.0001“****”0.0001 < p ≤ 0.001“***”0.001 < p ≤ 0.01“**”0.01 < p ≤ 0.05“*”0.05 < p ≤ 0.1“.”p > 0.1…

https與DNS的運行流程

HTTPS流程&#xff1a;HTTPS核心:加了TLS層&#xff0c;加密傳輸身份認證TLS:信息加密、校驗機制、身份證書TLS&#xff08;Transport Layer Security&#xff09;握手是建立安全通信通道的關鍵過程&#xff0c;發生在客戶端&#xff08;如瀏覽器&#xff09;和服務器之間。其主…

板子 5.29--7.19

板子 5.29–7.19 目錄 1. 樹狀數組 2. KMP 3. 矩陣快速冪 4. 數位DP 5. 狀壓枚舉子集 6. 快速冪&#xff08;新版 7. priority_queue 8. dijkstra 9. 單調棧 10. debug內容 1. 樹狀數組 // 樹狀數組 快速求前綴和 / 前綴最大值 // 維護位置數量(離散化)...// (區間加 區間求和…

min-max容斥學習筆記

最近報了航電的春季賽&#xff0c;在一道題目里面遇到了做法&#xff0c;感覺挺有意思。 考慮一個&#xff08;多重&#xff09;集合S{ai}S\{a_i\}S{ai?}&#xff0c;有如下的等式成立 min?ai∈S(ai)∑T?S,T≠?(?1)∣T∣?1max?ai∈T(ai)\min_{a_i\in S}(a_i)\sum_{T\sub…

使用帆軟制作項目

https://zhuanlan.zhihu.com/p/23429318335 項目背景 為加快大數據體系建設&#xff0c;穩步推進數字化轉型戰略&#xff0c;規范數據架構體系和數據治理體系&#xff0c;運用大數據推進全行數字化轉型建設&#xff0c;為業務發展提供創新動力&#xff0c;目標是利用金融科技和…

論C/C++的條件編譯#if、#ifdef、#ifndef、#undef

我們以實例來演示&#xff1a; ------------------------------------------實驗①------------------------------------------ 子函數&#xff1a;主函數&#xff1a;當定義了COMMENT_FLAG該宏&#xff0c;且其為0&#xff0c;則運行結果如下&#xff1a;只執行了sub_func_1函…

21、鴻蒙Harmony Next開發:組件導航(Navigation)

目錄 設置頁面顯示模式 設置標題欄模式 設置菜單欄 設置工具欄 路由操作 頁面跳轉 頁面返回 頁面替換 頁面刪除 移動頁面 參數獲取 路由攔截 單例跳轉 子頁面 頁面顯示類型 頁面生命周期 頁面監聽和查詢 頁面轉場 關閉轉場 自定義轉場 共享元素轉場 跨包…

“外賣大戰”正在改變國內“大零售”

出品 | 何璽排版 | 葉媛7月18日&#xff0c;市場監管總局約談美團、餓了么、京東三家外賣平臺&#xff0c;要求“理性競爭、規范促銷”&#xff0c;劍指近期愈演愈烈的“0元購”“0.1秒殺”等外賣補貼亂象。但約談之后&#xff0c;平臺們是真整改&#xff0c;還是玩話術&#x…

當CAN握手EtherCAT:視覺檢測系統的“雙芯合璧”時代來了

在汽車制造的高速生產線上&#xff0c;設備間的“語言不通”曾是工程師們的頭疼事&#xff1a;CAN總線像踏實的老司機&#xff0c;穩扎穩打傳輸傳感器數據&#xff1b;而EtherCAT網關則是追求極致速度的“閃電俠”&#xff0c;主導著實時控制的重任。當視覺檢測系統需要同時對接…

【C語言】動態內存管理全解析:malloc、calloc、realloc與free的正確使用

C語言學習 動態內存分配 友情鏈接&#xff1a;C語言專欄 文章目錄C語言學習前言&#xff1a;一、為什么要有動態內存分配二、malloc和free2.1 malloc2.2 free三、calloc和realloc3.1 calloc3.2 realloc總結附錄上文鏈接下文鏈接專欄前言&#xff1a; 在C語言編程中&#xff0…

基于Arduino智能家居環境監測系統—以光照強度檢測修改

2 相關技術與理論 2.1 Arduino 技術 Arduino 是一款廣受歡迎的開源電子原型平臺&#xff0c;由硬件和軟件組成&#xff0c;為開發者提供了便捷且低成本的解決方案&#xff0c;尤其適用于快速搭建交互式電子項目&#xff0c;在本智能家居環境監測系統中擔當核心角色。? 硬件方…

前端上傳 pdf 文件 ,前端自己解析出來 生成界面 然后支持編輯

要在前端解析 PDF 文件并生成可編輯界面&#xff0c;我們可以使用 PDF.js 庫來解析 PDF 內容&#xff0c;然后將其轉換為可編輯的 HTML 元素。 主要特點和工作原理如下&#xff1a; PDF 解析&#xff1a; 使用 Mozilla 的 PDF.js 庫解析 PDF 文件內容&#xff0c;提取文本信息。…

Linux“一切皆文件“設計哲學 與 Linux文件抽象層:struct file與file_operations的架構解析

在Linux系統中&#xff0c;“一切皆文件”&#xff08;Everything is a file&#xff09;是一個核心設計哲學&#xff0c;它抽象了系統資源的訪問方式&#xff0c;使得幾乎所有硬件設備、進程、網絡連接等都可以通過統一的文件接口&#xff08;如open()、read()、write()、clos…

藍橋杯零基礎到獲獎-第3章 C++ 變量和常量

藍橋杯零基礎到獲獎-第3章 C 變量和常量 文章目錄一、變量和常量1.變量的創建2.變量初始化3.變量的分類4.常量4.1 字?常量4.2 #define定義常量4.3 const 定義常量4.4 練習練習1&#xff1a;買票https://www.nowcoder.com/practice/0ad8f1c0d7b84c6d8c560298f91d5e66練習2&…

物理AI是什么技術?

當英偉達CEO黃仁勛在鏈博會上明確提出“物理AI將是AI的下一浪潮”時&#xff0c;這個看似陌生的概念瞬間引發了科技圈的廣泛關注。究竟什么是物理AI&#xff1f;它與我們熟悉的人工智能有何不同&#xff1f;又將如何重塑我們與物理世界的交互方式&#xff1f; 物理AI&#xff1…

GRIB數據處理相關指令

GRIB 數據格式簡介 GRIB(General Regularly distributed Information in Binary form)&#xff0c;是由世界氣象組織&#xff08;WMO&#xff09;設計和維護的一種用于存儲和傳輸網格數據的標準數據格式&#xff0c;它是一種自描述的二進制壓縮格式&#xff0c;通常具有擴展名…

微服務學習(六)之分布式事務

微服務學習&#xff08;六&#xff09;之分布式事務一、認識Seata二、部署TC服務1、準備數據庫表2、準備配置文件3、docker部署三、微服務集成seata1、引入依賴2、改造配置3、添加數據庫表4、測試四、XA模式1、兩階段提交2、seata的XA模型3、優缺點4、實現步驟五、AT模式1、Sea…