機器學習筆記之優化算法(十三)關于二次上界引理

機器學習筆記之優化算法——關于二次上界引理

  • 引言
    • 回顧:
      • 利普希茲連續
      • 梯度下降法介紹
    • 二次上界引理:介紹與作用
    • 二次上界與最優步長之間的關系
    • 二次上界引理證明過程

引言

本節將介紹二次上界的具體作用以及它的證明過程

回顧:

利普希茲連續

Wolfe \text{Wolfe} Wolfe準則收斂性證明一節中簡單介紹了利普希茲連續 ( Lipschitz?Continuity ) (\text{Lipschitz Continuity}) (Lipschitz?Continuity)。其定義對應數學符號表達如下:
? x , x ^ ∈ R n , ? L : s . t . ∣ ∣ f ( x ) ? f ( x ^ ) ∣ ∣ ≤ L ? ∣ ∣ x ? x ^ ∣ ∣ \forall x,\hat x \in \mathbb R^n , \exist \mathcal L: \quad s.t. ||f(x) - f(\hat x)|| \leq \mathcal L \cdot ||x - \hat x|| ?x,x^Rn,?L:s.t.∣∣f(x)?f(x^)∣∣L?∣∣x?x^∣∣
如果函數 f ( ? ) f(\cdot) f(?)滿足利普希茲連續,對上式進行簡單變換可得到:
不等式左側可使用拉格朗日中值定理進行進一步替換。
? ξ ∈ ( x , x ^ ) ? ∣ ∣ f ( x ) ? f ( x ^ ) ∣ ∣ ∣ ∣ x ? x ^ ∣ ∣ = f ′ ( ξ ) ≤ L \exist \xi \in (x,\hat x) \Rightarrow \frac{||f(x) - f(\hat x)||}{||x - \hat x||} = f'(\xi)\leq \mathcal L ?ξ(x,x^)?∣∣x?x^∣∣∣∣f(x)?f(x^)∣∣?=f(ξ)L
這意味著:在函數 f ( ? ) f(\cdot) f(?)在定義域內的絕大部分點處的變化率存在上界,受到 L \mathcal L L的限制。

梯度下降法介紹

在梯度下降法鋪墊:總體介紹一節中對梯度下降法進行了簡單認識。首先,梯度下降法是一個典型的線搜索方法 ( Line?Search?Method ) (\text{Line Search Method}) (Line?Search?Method)。其迭代過程對應數學符號表示如下:
x k + 1 = x k + α k ? P k x_{k+1} = x_k + \alpha_k \cdot \mathcal P_k xk+1?=xk?+αk??Pk?

  • 其中 P k ∈ R n \mathcal P_k \in \mathbb R^n Pk?Rn,描述數值解的更新方向,在梯度下降法中,它選擇目標函數 f ( ? ) f(\cdot) f(?) x k x_k xk?處梯度的反方向 ? ? f ( x k ) - \nabla f(x_k) ??f(xk?)作為更新方向,也稱最速下降方向
    P k = ? ? f ( x k ) \mathcal P_k = -\nabla f(x_k) Pk?=??f(xk?)
  • α k \alpha_k αk?表示步長。基于步長的選擇方式分為精確搜索非精確搜索兩類。關于非精確搜索——通過迭代獲取數值解序列并以此近似最優步長的方法詳見:

本節將介紹梯度下降法使用精確搜索求解最優步長,以及精確搜索的限制條件——二次上界引理

二次上界引理:介紹與作用

在求解梯度下降法的精確步長過程中,關于目標函數 f ( ? ) f(\cdot) f(?),在其定義域內可微的基礎上增加一個條件:目標函數的梯度函數 ? f ( ? ) \nabla f(\cdot) ?f(?)滿足利普希茲連續
如果是梯度函數 ? f ( ? ) \nabla f(\cdot) ?f(?)滿足利普希茲連續,根據上面的格式,可以得到:
? 2 f ( ? ) ≤ L \nabla^2 f(\cdot) \leq \mathcal L ?2f(?)L
而二階梯度描述的是梯度 ? f ( ? ) \nabla f(\cdot) ?f(?)的變化量。這意味著:關于 ? f ( ? ) \nabla f(\cdot) ?f(?)的變化情況不會過于劇烈。相反,如果 ? f ( ? ) \nabla f(\cdot) ?f(?)的變化情況過于劇烈:即便迭代過程中極小的一次更新,對應函數結果的變化也極大,例如: f ( x ) = 1 x \begin{aligned}f(x) = \frac{1}{x}\end{aligned} f(x)=x1?? x ∈ ( 0 , 1 ] x \in (0,1] x(0,1]區間內 ? f ( ? ) \nabla f(\cdot) ?f(?)的變化情況。從而在迭代過程中,可能出現梯度爆炸的現象。

基于上述條件,可以得到結論:函數 f ( ? ) f(\cdot) f(?)存在二次上界。其數學符號表示為:
? x , y ∈ R n ? f ( y ) ≤ f ( x ) + [ ? f ( x ) ] T ? ( y ? x ) + L 2 ∣ ∣ y ? x ∣ ∣ 2 \forall x,y \in \mathbb R^n \Rightarrow f(y) \leq f(x) + [\nabla f(x)]^T \cdot (y-x) + \frac{\mathcal L}{2}||y - x||^2 ?x,yRn?f(y)f(x)+[?f(x)]T?(y?x)+2L?∣∣y?x2
我們之前僅知道函數梯度 ? f ( ? ) \nabla f(\cdot) ?f(?)的變化率存在上界對其進行約束,但可通過該結論求出該上界的精確結果
首先通過圖像觀察該結論各部分的具體意義:
二次上界——示例
很明顯,這僅是一個一維變量對應的函數結果 ( R ? R ) (\mathbb R \mapsto\mathbb R) (R?R),其中藍色虛線箭頭表示 f ( y ) f(y) f(y)黑色虛線箭頭表示 f ( x ) + [ ? f ( x ) ] T ? ( y ? x ) f(x) + [\nabla f(x)]^T \cdot (y - x) f(x)+[?f(x)]T?(y?x)。在上述結論中,兩者之間的差距(綠色實線)不會無限大下去,而是存在一個上界約束這個差距
f ( y ) ? [ f ( x ) + [ ? f ( x ) ] T ? ( y ? x ) ] ≤ L 2 ∣ ∣ y ? x ∣ ∣ 2 f(y) - [f(x) + [\nabla f(x)]^T \cdot (y-x)] \leq \frac{\mathcal L}{2}||y -x||^2 f(y)?[f(x)+[?f(x)]T?(y?x)]2L?∣∣y?x2
假如這個差距結果遠遠大于 L 2 ∣ ∣ y ? x ∣ ∣ 2 \begin{aligned}\frac{\mathcal L}{2}||y -x||^2\end{aligned} 2L?∣∣y?x2?。例如:
超過二次上界——示例

從圖像中可以明顯看到,如果 f ( y ) f(y) f(y) f ( x ) + [ ? f ( x ) ] T ( y ? x ) f(x) + [\nabla f(x)]^T (y - x) f(x)+[?f(x)]T(y?x)之間的差距過大的話,那么必然是 f ( y ) f(y) f(y)處的斜率與 f ( x ) f(x) f(x)處的斜率差距過大產生的結果。因此這個差距上界 L 2 ∣ ∣ y ? x ∣ ∣ 2 \begin{aligned}\frac{\mathcal L}{2}||y - x||^2\end{aligned} 2L?∣∣y?x2?本質上依然是約束 ? f ( ? ) \nabla f(\cdot) ?f(?)變化率的大小。
這種情況出現梯度爆炸的可能性更高。

二次上界與最優步長之間的關系

假定二次上界引理是已知的,我們觀察:二次上界引理對精確步長的求解起到什么作用
? x , y ∈ R n ? f ( y ) ≤ f ( x ) + [ ? f ( x ) ] T ? ( y ? x ) + L 2 ∣ ∣ y ? x ∣ ∣ 2 \forall x,y \in \mathbb R^n \Rightarrow f(y) \leq f(x) + [\nabla f(x)]^T \cdot (y-x) + \frac{\mathcal L}{2}||y - x||^2 ?x,yRn?f(y)f(x)+[?f(x)]T?(y?x)+2L?∣∣y?x2
既然二次上界引理對于 ? x , y ∈ R n \forall x,y \in \mathbb R^n ?x,yRn均成立,我們可以將 x , y x,y x,y視作:某次迭代步驟 k k k x k , x k + 1 x_k,x_{k+1} xk?,xk+1?
后續依然使用 x , y x,y x,y進行表示。
{ x ? x k y ? x k + 1 y = x + α k ? P k \begin{cases} x \Rightarrow x_k \\ y \Rightarrow x_{k+1} \\ y = x + \alpha_k \cdot \mathcal P_k \end{cases} ? ? ??x?xk?y?xk+1?y=x+αk??Pk??
由于 x ? x k x \Rightarrow x_k x?xk?是上一次迭代步驟產生的位置,是已知項。這意味著:上述不等式右側相當于關于變量 y ? x k + 1 y \Rightarrow x_{k+1} y?xk+1?的一個二次函數。記作 ? ( y ) \phi(y) ?(y)
{ ? ( y ) ? f ( x ) + [ ? f ( x ) ] T ? ( y ? x ) + L 2 ∣ ∣ y ? x ∣ ∣ 2 f ( y ) ≤ ? ( y ) \begin{cases} \phi(y) \triangleq f(x) + [\nabla f(x)]^T \cdot (y - x) + \frac{\mathcal L}{2}||y - x||^2 \\ \quad \\ f(y) \leq \phi(y) \end{cases} ? ? ???(y)?f(x)+[?f(x)]T?(y?x)+2L?∣∣y?x2f(y)?(y)?
由于關于 y y y的二次項 L 2 > 0 \begin{aligned}\frac{\mathcal L}{2} > 0\end{aligned} 2L?>0?,說明函數 ? ( y ) \phi(y) ?(y)存在最小值。對該值進行求解:
函數圖像開口向上~
y m i n = arg ? min ? y ∈ R n ? ( y ) y_{min} = \mathop{\arg\min}\limits_{y \in \mathbb R^n} \phi(y) ymin?=yRnargmin??(y)

  • 首先對 ? ( y ) \phi(y) ?(y)關于 y y y求解梯度
    x x x相關的項均視作常數。
    ? ? ( y ) = 0 + ? f ( x ) ? 1 + L 2 ? 2 ? ( y ? x ) = ? f ( x ) + L ? ( y ? x ) \begin{aligned} \nabla \phi(y) & = 0 + \nabla f(x) \cdot 1 + \frac{\mathcal L}{2} \cdot 2 \cdot (y-x) \\ & = \nabla f(x) + \mathcal L \cdot (y-x) \end{aligned} ??(y)?=0+?f(x)?1+2L??2?(y?x)=?f(x)+L?(y?x)?
  • ? ? ( y ) ? 0 \nabla \phi(y) \triangleq 0 ??(y)?0,有:
    y m i n = ? ? f ( x ) L + x y_{min} = -\frac{\nabla f(x)}{\mathcal L} + x ymin?=?L?f(x)?+x
    對應 ? ( y ) \phi(y) ?(y)最小值 min ? ? ( y ) \min \phi(y) min?(y)有:
    min ? ? ( y ) = ? ( y m i n ) = f ( x ) + [ ? f ( x ) ] T ? ( ? ? f ( x ) L ) + L 2 ? [ ? ? f ( x ) ] T [ ? ? f ( x ) ] L 2 = f ( x ) ? ∣ ∣ ? f ( x ) ∣ ∣ 2 2 L \begin{aligned} \min \phi(y) & = \phi(y_{min}) \\ & = f(x) + [\nabla f(x)]^T \cdot \left(-\frac{\nabla f(x)}{\mathcal L}\right) + \frac{\mathcal L}{2} \cdot \frac{[- \nabla f(x)]^T [- \nabla f(x)]}{\mathcal L^2}\\ & = f(x) - \frac{||\nabla f(x)||^2}{2\mathcal L} \end{aligned} min?(y)?=?(ymin?)=f(x)+[?f(x)]T?(?L?f(x)?)+2L??L2[??f(x)]T[??f(x)]?=f(x)?2L∣∣?f(x)2??

y = x + α k ? P k y = x + \alpha_k \cdot \mathcal P_k y=x+αk??Pk?代入,觀察:

  • P k \mathcal P_k Pk?描述更新方向的向量對應的是負梯度方向 ? ? f ( x ) -\nabla f(x) ??f(x)
  • 同理, α k \alpha_k αk?對應 1 L \begin{aligned}\frac{1}{\mathcal L}\end{aligned} L1??
    { y = x + α k ? P k y m i n = x + 1 L ? [ ? ? f ( x ) ] ? { α k = 1 L P k = ? ? f ( x ) \begin{cases} \begin{aligned} y & = x + \alpha_k \cdot \mathcal P_k \\ y_{min} & = x + \frac{1}{\mathcal L} \cdot [-\nabla f(x)] \end{aligned} \end{cases} \Rightarrow \begin{cases} \begin{aligned}\alpha_k & = \frac{1}{\mathcal L} \\ \mathcal P_k & = - \nabla f(x) \end{aligned} \end{cases} ? ? ??yymin??=x+αk??Pk?=x+L1??[??f(x)]???? ? ??αk?Pk??=L1?=??f(x)??

但需要注意的是: f ( y ) ≤ ? ( y ) f(y) \leq \phi(y) f(y)?(y),而 y m i n y_{min} ymin?僅僅是 ? ( y ) \phi(y) ?(y)中的最小值。也就是說: y m i n y_{min} ymin? f ( y ) f(y) f(y)取值上界中的最小值。在這種條件下,我們認為 α k = 1 L \begin{aligned}\alpha_k = \frac{1}{\mathcal L}\end{aligned} αk?=L1??就是可控制的最優步長。

二次上界引理證明過程

條件:函數 f ( ? ) f(\cdot) f(?)可微,并且 ? f ( ? ) \nabla f(\cdot) ?f(?)滿足利普希茲連續
結論: f ( ? ) f(\cdot) f(?)存在二次上界
? x , y ∈ R n ? f ( y ) ≤ f ( x ) + [ ? f ( x ) ] T ? ( y ? x ) + L 2 ∣ ∣ y ? x ∣ ∣ 2 \forall x,y \in \mathbb R^n \Rightarrow f(y) \leq f(x) + [\nabla f(x)]^T \cdot (y - x) + \frac{\mathcal L}{2}||y - x||^2 ?x,yRn?f(y)f(x)+[?f(x)]T?(y?x)+2L?∣∣y?x2

證明:
由于上述的 x , y ∈ R n x,y \in \mathbb R^n x,yRn定義域內任意取值,因而無法直接從條件中獲取到 f ( x ) , f ( y ) f(x),f(y) f(x),f(y)之間的大小關系。這里不妨設: y > x y > x y>x,并引入輔助函數 G ( θ ) \mathcal G(\theta) G(θ)
x , y ∈ R n ( y > x ) x,y \in \mathbb R^n \text{ } (y > x) x,yRn?(y>x)確定的情況下,構建一個關于 θ \theta θ的函數,從而通過調節 θ \theta θ來獲取 [ f ( x ) , f ( y ) ] [f(x),f(y)] [f(x),f(y)]之間的函數結果。
G ( θ ) = f [ θ ? y + ( 1 ? θ ) ? x ] = f [ x + θ ( y ? x ) ] θ ∈ [ 0 , 1 ] \begin{aligned} \mathcal G(\theta) & = f [\theta \cdot y + (1 - \theta) \cdot x] \\ & = f [x + \theta(y - x)] \quad \theta \in [0,1] \end{aligned} G(θ)?=f[θ?y+(1?θ)?x]=f[x+θ(y?x)]θ[0,1]?
從而有: G ( 0 ) = f ( x ) ; G ( 1 ) = f ( y ) \mathcal G(0) = f(x);\mathcal G(1) = f(y) G(0)=f(x);G(1)=f(y)。將其與結論中的對應項進行替換
僅需證明‘替換’后的式子成立即可。
G ( 1 ) ≤ G ( 0 ) + [ ? f ( x ) ] T ? ( y ? x ) + L 2 ∣ ∣ y ? x ∣ ∣ 2 ? G ( 1 ) ? G ( 0 ) ? [ ? f ( x ) ] T ? ( y ? x ) ≤ L 2 ∣ ∣ y ? x ∣ ∣ 2 \begin{aligned} & \quad \quad \mathcal G(1) \leq \mathcal G(0) + [\nabla f(x)]^T \cdot (y - x) + \frac{\mathcal L}{2} ||y - x||^2 \\ & \Rightarrow \mathcal G(1) - \mathcal G(0) - [\nabla f(x)]^T \cdot (y - x) \leq \frac{\mathcal L}{2} ||y - x||^2 \end{aligned} ?G(1)G(0)+[?f(x)]T?(y?x)+2L?∣∣y?x2?G(1)?G(0)?[?f(x)]T?(y?x)2L?∣∣y?x2?
觀察不等式左側
使用牛頓-萊布尼茲公式,可以將 G ( 1 ) ? G ( 0 ) \mathcal G(1) - \mathcal G(0) G(1)?G(0)表示成如下形式:
G ( 1 ) ? G ( 0 ) = G ( θ ) ∣ 0 1 = ∫ 0 1 G ′ ( θ ) d θ \mathcal G(1) - \mathcal G(0) = \mathcal G(\theta) |_{0}^1 = \int_{0}^1 \mathcal G'(\theta) d\theta G(1)?G(0)=G(θ)01?=01?G(θ)dθ
關于項 [ ? f ( x ) ] T ? ( y ? x ) [\nabla f(x)]^T \cdot (y - x) [?f(x)]T?(y?x),同樣可以使用定積分的形式進行表示。其中 [ ? f ( x ) ] T ? ( y ? x ) [\nabla f(x)]^T \cdot (y - x) [?f(x)]T?(y?x)中不含 θ \theta θ,被視作常數。
[ ? f ( x ) ] T ? ( y ? x ) = [ ? f ( x ) ] T ? ( y ? x ) ? 1 = [ ? f ( x ) ] T ? ( y ? x ) ? θ ∣ 0 1 = [ ? f ( x ) ] T ? ( y ? x ) ? ∫ 0 1 1 d θ = ∫ 0 1 [ ? f ( x ) ] T ? ( y ? x ) d θ \begin{aligned} [\nabla f(x)]^T \cdot(y - x) & = [\nabla f(x)]^T \cdot (y - x) \cdot 1 \\ & = [\nabla f(x)]^T \cdot (y - x) \cdot \theta |_0^1 \\ & = [\nabla f(x)]^T \cdot (y - x) \cdot \int_0^1 1 d\theta \\ & = \int_{0}^1 [\nabla f(x)]^T \cdot (y - x) d\theta \end{aligned} [?f(x)]T?(y?x)?=[?f(x)]T?(y?x)?1=[?f(x)]T?(y?x)?θ01?=[?f(x)]T?(y?x)?01?1dθ=01?[?f(x)]T?(y?x)dθ?
至此,不等式左側可表示為:
I l e f t = ∫ 0 1 G ′ ( θ ) d θ ? ∫ 0 1 [ ? f ( x ) ] T ? ( y ? x ) d θ = ∫ 0 1 { [ ? f ( x + θ ? ( y ? x ) ) ] T ? ( y ? x ) ? [ ? f ( x ) ] T ? ( y ? x ) } d θ \begin{aligned} \mathcal I_{left} & = \int_{0}^1 \mathcal G'(\theta) d\theta - \int_{0}^1 [\nabla f(x)]^T \cdot (y - x) d\theta \\ & = \int_0^1 \left \{[\nabla f(x + \theta \cdot (y - x))]^T\cdot (y - x) - [\nabla f(x)]^T \cdot (y - x) \right\} d\theta \end{aligned} Ileft??=01?G(θ)dθ?01?[?f(x)]T?(y?x)dθ=01?{[?f(x+θ?(y?x))]T?(y?x)?[?f(x)]T?(y?x)}dθ?
提出公共部分: y ? x y - x y?x,將剩余部分進行合并
I l e f t = ∫ 0 1 { ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) } T ? ( y ? x ) d θ \mathcal I_{left} = \int_{0}^1 \left\{\nabla f[x + \theta \cdot (y - x)] - \nabla f(x)\right\}^T \cdot (y - x) d\theta Ileft?=01?{?f[x+θ?(y?x)]??f(x)}T?(y?x)dθ
觀察積分號內的項,其本質上是向量 ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) \nabla f[x + \theta \cdot (y - x)] - \nabla f(x) ?f[x+θ?(y?x)]??f(x)與向量 y ? x y - x y?x的內積結果。因而有:
不等式滿足的原因: cos ? θ ∈ [ ? 1 , 1 ] \cos \theta \in [-1,1] cosθ[?1,1]
{ ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) } T ? ( y ? x ) = ∣ ∣ ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) ∣ ∣ ? ∣ ∣ y ? x ∣ ∣ ? cos ? θ ≤ ∣ ∣ ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) ∣ ∣ ? ∣ ∣ y ? x ∣ ∣ \begin{aligned} \left\{\nabla f[x + \theta \cdot (y - x)] - \nabla f(x)\right\}^T \cdot (y - x) & = ||\nabla f[x + \theta \cdot (y - x)] - \nabla f(x)|| \cdot ||y - x|| \cdot \cos \theta \\ & \leq ||\nabla f[x + \theta \cdot (y - x)] - \nabla f(x)|| \cdot ||y - x|| \end{aligned} {?f[x+θ?(y?x)]??f(x)}T?(y?x)?=∣∣?f[x+θ?(y?x)]??f(x)∣∣?∣∣y?x∣∣?cosθ∣∣?f[x+θ?(y?x)]??f(x)∣∣?∣∣y?x∣∣?
將該不等式帶回 I l e f t \mathcal I_{left} Ileft?,有:
I l e f t ≤ ∫ 0 1 ∣ ∣ ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) ∣ ∣ ? ∣ ∣ y ? x ∣ ∣ d θ \mathcal I_{left} \leq \int_0^1 ||\nabla f[x + \theta \cdot (y - x)] - \nabla f(x)|| \cdot ||y - x|| d\theta Ileft?01?∣∣?f[x+θ?(y?x)]??f(x)∣∣?∣∣y?x∣∣dθ
由于 f ( ? ) f(\cdot) f(?)滿足利普希茲連續,因而有:
其中 θ ∈ [ 0 , 1 ] \theta \in [0,1] θ[0,1],因而可以將其從范數符號中提出來。
∣ ∣ ? f [ x + θ ? ( y ? x ) ] ? ? f ( x ) ∣ ∣ ≤ L ? ∣ ∣ x + θ ? ( y ? x ) ? x ∣ ∣ = L ? θ ? ∣ ∣ y ? x ∣ ∣ ||\nabla f[x + \theta \cdot (y - x)] - \nabla f(x)|| \leq \mathcal L \cdot ||x + \theta \cdot (y -x) - x|| = \mathcal L \cdot \theta \cdot ||y - x|| ∣∣?f[x+θ?(y?x)]??f(x)∣∣L?∣∣x+θ?(y?x)?x∣∣=L?θ?∣∣y?x∣∣
整理有:
I l e f t ≤ ∫ 0 1 L ? θ ? ∣ ∣ y ? x ∣ ∣ 2 d θ \mathcal I_{left} \leq \int_0^1 \mathcal L \cdot \theta \cdot ||y - x||^2 d\theta Ileft?01?L?θ?∣∣y?x2dθ
又因為 L , ∣ ∣ y ? x ∣ ∣ 2 \mathcal L,||y - x||^2 L,∣∣y?x2 θ \theta θ無關,因而從積分號中提出:
I l e f t ≤ L ? ∣ ∣ y ? x ∣ ∣ 2 ? ∫ 0 1 θ d θ = L ? ∣ ∣ y ? x ∣ ∣ 2 ? 1 2 θ 2 ∣ 0 1 = L 2 ? ∣ ∣ y ? x ∣ ∣ 2 = I r i g h t \begin{aligned} \mathcal I_{left} & \leq \mathcal L \cdot ||y - x||^2 \cdot \int_0^1 \theta d\theta \\ & = \mathcal L \cdot ||y - x||^2 \cdot \frac{1}{2} \theta^2|_0^1 \\ & = \frac{\mathcal L}{2} \cdot ||y - x||^2 \\ & = \mathcal I_{right} \end{aligned} Ileft??L?∣∣y?x2?01?θdθ=L?∣∣y?x2?21?θ201?=2L??∣∣y?x2=Iright??
證畢。

相關參考:
【優化算法】梯度下降法-二次上界

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/37912.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/37912.shtml
英文地址,請注明出處:http://en.pswp.cn/news/37912.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uniapp 微信小程序 訂閱消息

第一步&#xff0c;需要先去小程序官方挑選一下訂閱模板拿到模板id 訂閱按鈕在頭部導航上&#xff0c;所以 <u-navbar :bgColor"bgColor"><view class"u-nav-slot" slot"left" click"goSubscribe"><image :src"g…

阿里社招一面記錄

一輪電話面試&#xff0c;一個半小時&#xff0c;昨天晚上面試的&#xff0c;今早面試官打電話約了二面&#xff08;為啥是一面面試官:&#xff09; 自我介紹 工作經歷&#xff0c;項目經歷項目挑兩個介紹一下 這里介紹了一個偏技術的基于Mysql搭建的olap系統&#xff0c;數據…

綜述:計算機視覺中的圖像分割

一、說明 這篇文章是關于圖像分割的探索&#xff0c;這是解決計算機視覺問題&#xff08;如對象檢測、對象識別、圖像編輯、醫學圖像分析、自動駕駛汽車等&#xff09;的重要步驟之一。讓我們從介紹開始。 二、圖像分割介紹 圖像分割是計算機視覺中的一項基本任務&#xff0c;涉…

【Maven】SpringBoot項目使用maven-assembly-plugin插件多環境打包

SpringBoot項目使用maven-assembly-plugin插件多環境打包 1.創建SpringBoot項目并在pom.xml文件中添加maven-assembly-plugin配置 <!-- 多環境配置 --><profiles><!-- 開發環境 --><profile><id>dev</id><properties><prof…

新一代分布式融合存儲,數據場景All In One

1、摘要 2023年5月11日&#xff0c;浪潮信息全國巡展廣州站正式啟航。會上&#xff0c;重磅發布新一代分布式融合存儲AS13000G7&#xff0c;其采用極致融合架構設計理念&#xff0c;實現同一套存儲滿足四種非結構化數據的“All In One”高效融合&#xff0c;數據存力提升300%&a…

基于WebSocket的在線文字聊天室

與Ajax不同&#xff0c;WebSocket可以使服務端主動向客戶發送響應&#xff0c;本案例就是基于WebSocket的一個在線聊天室&#xff0c;不過功能比較簡單&#xff0c;只能滿足文字交流。演示如下。 案例學習于b站up主&#xff0c;鏈接 。這位up主講的非常清楚&#xff0c;值得去學…

item_get_sales-獲取TB商品銷量詳情

一、接口參數說明&#xff1a; item_get_sales-獲取商品銷量詳情&#xff0c;點擊更多API調試&#xff0c;請移步注冊API賬號點擊獲取測試key和secret 公共參數 請求地址: https://api-gw.onebound.cn/taobao/item_get_sales 名稱類型必須描述keyString是調用key&#xff08…

Idea 快捷鍵整理

Idea快捷鍵和自動代碼補全匯總 idea快捷鍵匯總 Ctrl 快捷鍵說明Ctrl F在當前文件進行文本查找 &#xff08;必備&#xff09;Ctrl R在當前文件進行文本替換 &#xff08;必備&#xff09;Ctrl Z撤銷 &#xff08;必備&#xff09;Ctrl Y刪除光標所在行 或 刪除選中的行 &am…

設計HTML5圖像和多媒體

在網頁中的文本信息直觀、明了&#xff0c;而多媒體信息更富內涵和視覺沖擊力。恰當使用不同類型的多媒體可以展示個性&#xff0c;突出重點&#xff0c;吸引用戶。在HTML5之前&#xff0c;需要借助插件為網頁添加多媒體&#xff0c;如Adobe Flash Player、蘋果的QuickTime等。…

【C++精華鋪】6.C++類和對象(下)類與對象的知識補充及編譯器優化

目錄 1. 再談構造 1.1 成員變量的初始化&#xff08;初始化列表&#xff09; 1.2 初始化列表的行為 1.3 explicit關鍵字 2. 類中的static成員 2.1 靜態成員變量 2.2 靜態成員函數 3. 友元 3.1 友元函數 3.1 友元類 4. 內部類 5. 匿名對象 6. 對象拷貝時候的編譯器優化…

GitHub 打不開解決方案

GitHub 這幾年國內普通用戶越來越難以訪問&#xff0c;github 作為全球最大的開源平臺&#xff0c;里面有用的內容很多&#xff0c;不管是對專業用戶還是普通用戶&#xff0c;無法訪問都是很嚴重的問題。 1.GitHub 加速鏡像 kgithub 是一個公益加速項目&#xff0c;僅需在 gi…

【LeetCode每日一題】——41.缺失的第一個正數

文章目錄 一【題目類別】二【題目難度】三【題目編號】四【題目描述】五【題目示例】六【題目提示】七【解題思路】八【時間頻度】九【代碼實現】十【提交結果】 一【題目類別】 哈希表 二【題目難度】 困難 三【題目編號】 41.缺失的第一個正數 四【題目描述】 給你一個…

Compute shader SV 理解圖

本圖轉子&#xff1a;【Computeshader】個人總結_蔣偉博的博客-CSDN博客

【Rust】Rust學習 第十二章一個 I/O 項目:構建一個命令行程序

本章既是一個目前所學的很多技能的概括&#xff0c;也是一個更多標準庫功能的探索。我們將構建一個與文件和命令行輸入/輸出交互的命令行工具來練習現在一些你已經掌握的 Rust 技能。 Rust 的運行速度、安全性、單二進制文件輸出和跨平臺支持使其成為創建命令行程序的絕佳選擇…

談一談在兩個商業項目中使用MVI架構后的感悟

作者&#xff1a;leobertlan 前言 當時項目采用MVP分層設計&#xff0c;組員的代碼風格差異也較大&#xff0c;代碼中類職責賦予與封裝風格各成一套&#xff0c;隨著業務急速膨脹&#xff0c;代碼越發混亂。試圖用 MVI架構 單向流 形成 掣肘 帶來一致風格。 但這種做法不夠以…

linux系列基本介紹

雖然我們常說Linux操作系統&#xff0c;這種叫法是不正確的&#xff0c;嚴格意義上講&#xff0c;Linux并不是操作系統&#xff0c;而是屬于操作系統的一個內核&#xff0c;inux內核提供了操作系統的核心功能&#xff0c;如進程管理、內存管理、文件系統等。 Linux有很多不同的…

LeetCode 熱題 100 JavaScript--33. 搜索旋轉排序數組

整數數組 nums 按升序排列&#xff0c;數組中的值 互不相同 。 在傳遞給函數之前&#xff0c;nums 在預先未知的某個下標 k&#xff08;0 < k < nums.length&#xff09;上進行了 旋轉&#xff0c;使數組變為 [nums[k], nums[k1], …, nums[n-1], nums[0], nums[1], …,…

yolov5 轉換為rknn模型在3588上運行

為了把yolov5在rk3588上跑起來&#xff0c;在網上搜羅了一圈,踩了一些坑。由于瑞芯微的文檔有升級&#xff0c;導致和網絡的文章有出入&#xff0c;所以做個記錄。 rknn-toolkit 轉換文檔&#xff1a; 瑞芯微的轉換文檔在 rknn-toolkit/example/pytorch/yolov5/REAME.md 里 …

LangChain入門:構建LLM驅動的應用程序的初學者指南

LangChain & DemoGPT 一、介紹 你有沒有想過如何使用大型語言模型&#xff08;LLM&#xff09;構建強大的應用程序&#xff1f;或者&#xff0c;也許您正在尋找一種簡化的方式來開發這些應用程序&#xff1f;那么你來對地方了&#xff01;本指南將向您介紹LangChain&#x…

【Sklearn】基于邏輯回歸算法的數據分類預測(Excel可直接替換數據)

【Sklearn】基于邏輯回歸算法的數據分類預測(Excel可直接替換數據) 1.模型原理2.模型參數3.文件結構4.Excel數據5.下載地址6.完整代碼7.運行結果1.模型原理 邏輯回歸是一種用于二分類問題的統計學習方法,盡管名字中含有“回歸”,但實際上是一種分類算法。它的基本原理是通…