【小白數學】為什么可以用拉格朗日乘子法求函數的極值【二】

我們在上一篇【小白數學】- 為什么可以用拉格朗日乘子法求函數的極值【一】已經介紹了一種較為“嚴謹“的方法來說明為什么拉格朗日乘子法可以幫助我們求具有等式約束條件下的函數的極值。雖然在我們的例子中”等式約束“中只有一個等式。但其實很容易推廣到多個等式約束的情況。所以這里也就不再贅述。本文主要兌現上一篇博客中提到第二種方法去理解:為什么可以用拉格朗日乘子法求函數的極值。

正式介紹之前,我們先回顧一些基礎概念:一元函數和多元的函數的導數;

首先來看一個一元函數 y = x 2 y=x^2 y=x2,該函數上任意一點 x x x的導數的導數 y ′ = d y d x = 2 x y'= \frac{dy}{dx} = 2x y=dxdy?=2x 。下圖中紅色的箭頭表示圖中A點(1,1)位置導數的方向。

在這里插入圖片描述
也可以直觀的理解曲線 y = x 2 y=x^2 y=x2在A點的切線的方向就是這個點的導數方向。并且隨著 x x x的增大 d y d x = 2 x \frac{dy}{dx}=2x dxdy?=2x也不斷增大,即對于函數 y = x 2 y=x^2 y=x2 x x x的值越大,其所在點 ( x , y ) (x,y) (x,y)的導數就越大,或者說經過 ( x , y ) (x,y) (x,y)的切線的斜率就越大。

看完了一元函數的導數,我們來看一下二元函數的導數,假設我們有一個二元函數 y = ? ( x 1 ? a ) 2 ? ( x 2 ? b ) 2 + c y= -(x_1-a)^2 - (x_2-b)^2 + c y=?(x1??a)2?(x2??b)2+c,其中 x 1 , x 2 x_1,x_2 x1?,x2?為變量,而 a , b , c a,b,c a,b,c為常量,為 y y y取得最大值時候的 x 1 , x 2 x_1, x_2 x1?,x2?以及 y y y本身的值。

在這里插入圖片描述
如果使用更數學的語言來表達就是:
y max ? = max ? ( ? ( x 1 ? a ) 2 ? ( x 2 ? b ) 2 + c ) = c a , b = arg ? max ? x 1 , x 2 [ ? ( x 1 ? a ) 2 ? ( x 2 ? b ) 2 + c ] \begin{align*} y_{\max} &= \max(-(x_1-a)^2 - (x_2 -b)^2 + c) = c \\ a,b &= \arg \underset{x_1,x_2}{\max} \left [ -(x_1-a)^2 - (x_2-b)^2 + c \right] \end{align*} ymax?a,b?=max(?(x1??a)2?(x2??b)2+c)=c=argx1?,x2?max?[?(x1??a)2?(x2??b)2+c]?
在看多元函數的導數之前,我們先看一下圖中紫色的那一圈圈的線是什么?沒錯,那是”等高線“。我們專門構造的這個二元函數,實際上是一座”小山“, 山頂的坐標是 ( a , b , c ) (a,b,c) (a,b,c)。在同樣的高度( y y y值相同)的山腰上的點,如果練成線,其實就變成了函數 y y y的等高線。

接下來我們再來看多元函數的導數(也稱為梯度),是怎么樣的:單個變量的導數叫”導數“,一組變量的導數叫”梯度“ (這組變量本身是函數 y y y上的一個點)。在上圖中的二元函數中,我們有兩個變量 x 1 , x 2 x_1,x_2 x1?,x2?,那么他們的各自的導數可以表示為 d y d x 1 , d y d x 2 \frac{dy}{dx_1}, \frac{dy}{dx_2} dx1?dy?,dx2?dy?,由于 y y y是由 x 1 , x 2 x_1,x_2 x1?,x2?共同作用生成的,所以我們又用偏導數的形式也表示他們各自的導數 ? y ? x i \frac{\partial y}{ \partial x_i} ?xi??y? ( i = 1 , 2 i=1,2 i=1,2),兩者是等價的。所我們定義的這個二元函數的梯度可以表示為: ? y = [ ? y ? x 1 ? y ? x 2 ] \nabla y = \begin{bmatrix*} \frac{\partial y}{\partial x_1} \\ \frac{\partial y}{\partial x_2} \end{bmatrix*} ?y=[?x1??y??x2??y??],顯然 ? y \nabla y ?y是一個向量。這個向量指向 y y y變化最劇烈的方向。

那么問題來了:我們先定義了”等高線“,然后又定義了”梯度“,這兩者是什么關系?

答:”梯度“垂直于”等高線“,直觀理解也很容易:連續等高線上的點具有相同的 y y y值;我們站在這個山坡的等高線上,肯定是朝著與等高線垂直的方向前進, y y y值的變化率最大。

在這里插入圖片描述

如上圖所示,所有的綠色小箭頭都垂直于等高線,其實就是等高線上該點的梯度值。注意到圖中有一個點A,經過該點的除了有綠色的箭頭還有灰色的箭頭,很顯然可以看得出來,只有綠色的箭頭方向是 y y y值變化最快的方向(也是上山最快的方向),而其他的灰色箭頭的方向要么是”下山“,要么是”在周圍隨意閑逛“的方向。

理解梯度與等高線的關系對于我們接下來介紹的內容非常重要,所以沒有看懂的同學建議再仔細看一下圖。

說了一大圈,還沒有說到拉格朗日乘子問題,下面我們來定義一個可以用拉格朗日乘子法求解的約束條件下的最值問題如下:

假設有函數 f ( x 1 , x 2 ) = ? ( x 1 ? a ) 2 ? ( x 2 ? b ) 2 + 4 f(x_1,x_2) = -(x_1-a)^2 - (x_2 - b)^2 + 4 f(x1?,x2?)=?(x1??a)2?(x2??b)2+4,我們要求如下的最優化問題:
max ? f ( x 1 , x 2 ) s . t . a x 2 ? d x 1 ? d = 0 a , b , c , d 均為大于 0 的常數 ( 1 ) \begin{align*} & \max f(x_1,x_2) \\ &s.t. \: a x_2 - d x_1 - d = 0 \\ &a,b,c,d\:均為大于0的常數 \end{align*} \qquad (1) ?maxf(x1?,x2?)s.t.ax2??dx1??d=0a,b,c,d均為大于0的常數?(1)
在這個最優化問題中,我們發現其本質是求 f ( x 1 , x 2 ) f(x_1, x_2) f(x1?,x2?)與平面 a x 2 ? d x 1 ? d = 0 ax_2 - dx_1 -d = 0 ax2??dx1??d=0的交線(如下圖中棕紅色的虛線所示)上的最大值。
在這里插入圖片描述

我們按照之前找梯度的方法,分別為 f ( x 1 , x 2 ) f(x_1, x_2) f(x1?,x2?), 約束平面以及兩者的交線 L ( x 1 , x 2 ) L(x_1,x_2) L(x1?,x2?)畫出梯度:具體方法為先找等高線,在沿著等高線垂直的方向畫梯度的方向。(不過大套路有時候也不好使,比如說垂直平面(與 y y y軸平行)上的點的梯度是什么?建議大家可以閱讀這篇介紹梯度定義的文章:梯度的含義)。對于垂直平面上的梯度,其實在我們的場景下,還是只涉及 x 1 , x 2 x_1, x_2 x1?,x2?兩個維度,假設約束條件重新表示為 g ( x 1 , x 2 ) = a x 2 ? d x 1 ? d g(x_1,x_2)= ax_2 - dx_1 - d g(x1?,x2?)=ax2??dx1??d,則平面上每一點的梯度為 [ ? g ? x 1 , ? g ? x 2 ] ? [\frac{\partial g}{\partial x_1}, \frac{\partial g}{\partial x_2}]^\top [?x1??g?,?x2??g?]?,即 [ ? d , a ] ? [-d, a]^\top [?d,a]? (圖中黃色箭頭所指方向)。

我們注意觀察棕色的交線上每一個點,圖中我們分別為其標識了 f ( ? ) , g ( ? ) , L ( ? ) f(\cdot), g(\cdot), L(\cdot) f(?),g(?),L(?) 三者的梯度(分別使用紫色、黃色以及綠色),我們注意到由于 g ( ? ) g(\cdot) g(?)是垂直平面,而 f ( ? ) f(\cdot) f(?)是一個對稱的圓形”山坡“,所以直觀理解上,我們要找的極值應該在交線的最高位置。如圖中的 M M M點,由于在這個點上 L ( ? ) L(\cdot) L(?)取得了極大值,所以必然有 ? L = 0 \nabla L = 0 ?L=0, 而且在圖中,可以看出來 ? f \nabla f ?f ? g \nabla g ?g存在明顯的線性關系(方向相反),即 ? f + λ ? g = 0 \nabla f + \lambda \nabla g = 0 ?f+λ?g=0. 所以從這個角度上理解,也確實是證明了拉格朗日乘子法為什么能夠運用幫助我們找到約束條件下的函數極值。

歡迎大家點贊、關注、收藏,你的鼓勵是我最大的創作動力!

參考文獻:https://medium.com/@andrew.chamberlain/a-simple-explanation-of-why-lagrange-multipliers-works-253e2cdcbf74

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/72021.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/72021.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/72021.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JAVA面試_進階部分_netty面試題

1.BIO、NIO 和 AIO 的區別? BIO:一個連接一個線程,客戶端有連接請求時服務器端就需要啟動一個線程進行處理。線程開銷大。 偽異步 IO:將請求連接放入線程池,一對多,但線程還是很寶貴的資源。 NIO&#x…

考研出分24小時,人類精神狀態圖鑒

2月24日,上午10點起,各省考研初試成績陸續公布,考生們或緊張的輸入準考證號,或抱團等待“審判”。然而更魔幻的還在后頭——下午4點,教育部竟在同一天直接發布了《2025年研考國家分數線》。 不少網友表示:…

川翔云電腦優勢總結

在數字化時代,川翔云電腦依托云計算技術,為用戶解決硬件性能瓶頸問題。川翔云電腦使用云渲碼:【2355】 卓越硬件配置:配備 RTX 3090、48G 顯存的 RTX 4090plus,支持 1 - 8 卡機配置,多卡并行計算能力強&am…

DeepSeek開源周Day4:三連發!突破 AI 訓練瓶頸的立體解決方案,并行計算三劍客DualPipe、EPLB與Profile-data

項目地址: https://github.com/deepseek-ai/DualPipehttps://github.com/deepseek-ai/eplbhttps://github.com/deepseek-ai/profile-data 開源日歷:2025-02-24起 每日9AM(北京時間)更新,持續五天 (4/5)! ? ? 一、背景概述 …

基于W2605C語音識別合成芯片的智能語音交互鬧鐘方案-AI對話享受智能生活

隨著科技的飛速發展,智能家居產品正逐步滲透到我們的日常生活中,其中智能鬧鐘作為時間管理的得力助手,也在不斷進化。基于W2605C語音識別與語音合成芯片的智能語音交互鬧鐘,憑借其強大的聯網能力、自動校時功能、實時天氣獲取、以…

Vite與Turbopack現代構建工具架構解析:秒級構建的性能奧秘

引言:傳統構建工具的效能瓶頸 Shopify將前端倉庫遷移至Vite后,HMR更新時間從Webpack的4.2秒縮短至48毫秒。Turbopack在Vercel生產環境測試中,增量構建速度較Webpack快700%。ChromeOS團隊采用Vite后,生產構建從Webpack的17分鐘優化…

網絡基礎知識-2

N個節點完全互聯的網型網即N個節點的無向完全圖,無向完全圖的邊數計算如下:每個節點都要指向其他N-1個節點,但是因為無向兩個節點之間的邊會重復,因此有N(N-1)/2條邊HDLC(高級數據鏈路控制協議)是一種面向比…

視頻級虛擬試衣技術在淘寶的產品化實踐

作為一種新的商品表現形態,內容幾乎存在于手淘用戶動線全流程,例如信息流種草內容、搜索消費決策內容、詳情頁種草內容等。通過低成本、高時效的AIGC內容生成能力,能夠從供給端緩解內容生產成本高的問題,通過源源不斷的低成本供給…

藍橋備賽(三)- 條件判斷與循環(下)

一、for循環 1.1 for 循環語法形式 for 循環是三種循環中使用最多的 , for 循環的語法形式如下: 1.2 執行流程 for 循環中 , 表達式1(初始化)只執行一次 ! 1.3 實踐 練習:使用 for 循環在屏幕…

VMware Fusion 虛擬機Mac版 安裝CentOS 7 系統

介紹 CentOS是Community Enterprise Operating System的縮寫,也叫做社區企業操作系統。是企業Linux發行版領頭羊Red Hat Enterprise Linux的再編譯版本(是一個再發行版本),而且在RHEL的基礎上修正了不少已知的 Bug ,相…

如果更換ip地址會怎么樣?網絡ip地址怎么更換

IP地址,作為網絡設備的數字身份證,其穩定性和安全性對于網絡通訊至關重要。然而,在某些特定情況下,我們可能需要更換設備的IP地址,以滿足安全、隱私或網絡管理的需求。那么,如果更換IP地址會怎么樣&#xf…

網絡通信/IP網絡劃分/子網掩碼的概念和使用

文章目錄 概述子網的考題子網掩碼的歷史有/無類地址子網劃分!子網掩碼超網技術/CIDR子網掩碼和路由IP子網掩碼定義 網絡規劃網絡規劃-拆子網網絡規劃-組超網子網劃分案例 區分于其他特殊IP地址IP地址和網絡地址子網掩碼和網絡地址子網掩碼和廣播地址 子網間的通信其他 概述 本…

評估自動駕駛(AD)策略性能的關鍵指標

以下是針對自動駕駛(AD)策略性能評測指標的詳細解讀,結合其物理意義與工程價值: 核心評測指標分類與含義 1. 安全性指標(Safety) 動態碰撞率(Dynamic Collision Ratio, DCR) 定義&a…

C++11相較于C++98的新特性介紹:列表初始化,右值引用與移動語義

一,列表初始化 1.1C98中傳統的{} C98中一般數組和結構體可以使用{}進行初始化: struct Date {int _year;int _month;int _day; };int main() {int a[] { 1,2,3,4,5 };Date _date { 2025,2,27 };return 0; } 1.2C11中的{} C11以后想統一初始化方式&…

序列化是什么?常見的序列化方式有哪些?什么時候我們會用到序列化?

序列化(Serialization)是指將對象的狀態信息轉換為可以存儲或傳輸的形式(如字節序列、XML 文檔、JSON 字符串等)的過程。反序列化則是序列化的逆過程,它將存儲或接收到的字節序列、XML 文檔、JSON 字符串等轉換回對象的…

Python解決“比賽配對”問題

Python解決“比賽配對”問題 問題描述測試樣例解決思路代碼 問題描述 小R正在組織一個比賽,比賽中有 n 支隊伍參賽。比賽遵循以下獨特的賽制: 如果當前隊伍數為 偶數,那么每支隊伍都會與另一支隊伍配對。總共進行 n / 2 場比賽,…

uniapp中使用leaferui使用Canvas繪制復雜異形表格的實現方法

需求: 如下圖,要實現左圖的樣式,先實現框架,文字到時候 往里填就行了,原來的解決方案是想用css,html來實現,發現實現起來蠻麻煩的。我也沒找到合適的實現方法,最后換使用canvas來實現&#xff…

大模型與呼叫中心融合:未來發展的潛力何在?

大模型與呼叫中心的結合,為企業帶來了前所未有的發展機遇。通過提升服務效率、優化營銷效果、降低運營成本、增強數據管理與分析能力、提升客戶體驗以及推動行業創新與變革,大模型呼叫中心正在重塑客戶服務與營銷的未來。 大模型與呼叫中心的結合具有巨…

vue3+ts+uniapp+unibest 微信小程序(第二篇)—— 圖文詳解自定義背景圖頁面布局、普通頁面布局、分頁表單頁面布局

文章目錄 簡介一、自定義背景圖布局1.1 效果預覽1.2 實現思路1.3 custom-page 組件全量代碼1.4 頁面使用 二、普通頁面布局2.1 效果預覽2.2 實現思路2.3 公共樣式部分2.4 頁面使用 三、分頁表單頁面布局3.1 效果預覽3.2 實現思路3.3 頁面代碼 簡介 開發工具:VsCode…

華為交換機堆疊方法

堆疊配置: 先把接口shutdown 第一臺: int stack-port 0/1 port interface XGigabitEthernet0/0/3 enable y qu int stack-port 0/2 port interface XGigabitEthernet0/0/4 enable y qu stack slot 0 priority 200 y 第二臺: int stack…