共軛梯度法筆記

一、梯度下降法

在這里插入圖片描述

x k + 1 = x k ? α ? f ( x k ) x_{k+1} = x_k - \alpha \nabla f(x_k) xk+1?=xk??α?f(xk?)

  • 這是普通的梯度下降公式,有兩個量是關鍵,步長 α \alpha α和方向 ? f ( x k ) \nabla f(x_k) ?f(xk?)。這里的方向直接選擇了梯度方向,也是使用最多,但是并不一定要是這個方向。

二、最速梯度下降

在這里插入圖片描述

x k + 1 = x k ? α ? f ( x k ) x_{k+1} = x_k - \alpha \nabla f(x_k) xk+1?=xk??α?f(xk?)
? f ( x k + 1 ) ? α k = 0 , α k = r k T r k r k T A r k \frac{\partial f(x_{k+1})}{\partial \alpha_k} = 0, \alpha_k = \frac{\mathbf{r}_k^T \mathbf{r}_k}{\mathbf{r}_k^T A \mathbf{r}_k} ?αk??f(xk+1?)?=0αk?=rkT?Ark?rkT?rk??

  • 最速梯度下降與梯度下降的區別在于采用了一個公式計算步長 α \alpha α,計算思路就是在當前梯度方向上盡量降低評價函數
  • 推導過程可以參考https://www.bilibili.com/video/BV1kM4y177s1/?spm_id_from=333.337.search-card.all.click&vd_source=a686d8f8b0e9b94066f2d4ba714466e7
  • 這樣沒次更新后在之前的梯度方向上已經沒有可以讓f健翔的方向了,所以下一個梯度一定會與之前梯度正交

三、共軛梯度下降

整體講解視頻:
https://www.bilibili.com/video/BV1kM4y177s1/?spm_id_from=333.337.search-card.all.click&vd_source=a686d8f8b0e9b94066f2d4ba714466e7
為什么若干共軛梯度在一起可以高效到達期望點:https://blog.csdn.net/bitcarmanlee/article/details/121522734
講解文字版:
https://blog.csdn.net/weixin_43940314/article/details/121125847

  • 最速梯度下降改變了步長,還可以改變方向,理想狀態下是梯度之間可以相互垂直,這樣不會出現最速梯度下降那樣互相抵消的問題,推導如下:
    在這里插入圖片描述
  • 在正交的前提下可以直接計算步長,但是這樣存在的問題是并不知道 e i e_i ei?,如果知道誤差,直接算結果就行了,所以并沒有一種叫做正交梯度下降的方法。因此選擇了另一種選擇方向的思路,采用共軛梯度的方向,也就是梯度方向之間相互共軛。
  • 共軛向量定義如下:
    在這里插入圖片描述
  • 共軛向量有一個性質是線性無關
  • 這里我有一個疑惑是相互共軛的向量能像正交向量那樣高效的達到期望點嗎?也就是共軛向量可以簡潔的表示期望點嗎?其實是可以的,推導https://blog.csdn.net/bitcarmanlee/article/details/121522734
  • 方法推導過程如下:
    在這里插入圖片描述
  • 共軛梯度的步長是用最速梯度下降的方法算的,用推導如下:
    在這里插入圖片描述
  • 而方向就是先定義一些線性無關量,然后在每步利用類似施密特正交化的思路,將每個線性無關量轉換成共軛量。向量之間相互共軛也線性無關,每次完成一次迭代就失去了一個方向上的誤差,之后的梯度方向肯定有自己獨特的信息,所以也是線性無關的(這可可以這樣想,一個二維的誤差空間,線性無關梯度方向有兩個,第一次迭代去除一個維度后,新的梯度向量肯定有自己另一個維度的信息)。
  • 之前說最理想的梯度方向是相互正交其實是不準確的,只要梯度向量之間相互線性無關,這就是很好的梯度向量了。正交的梯度向量是線性無關的,但是沒法算法。所以利用另外一個讓梯度向量相互線性無關的可能方案,也就是共軛向量。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/896845.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/896845.shtml
英文地址,請注明出處:http://en.pswp.cn/news/896845.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ubuntu 啟動不起來,光標閃爍 解決方法

ubuntu 啟動不起來,光標閃爍 進不了系統,解決方法 按ctrl alt f2,進入終端,登錄。 jounal -b 查看啟動日志。 發現是找不到顯卡驅動程序。 解決方法: 卸載nvidia程序。 sudo systemctl stop gdm # 適用于GNOME…

CSS - 妙用Sass

官方文檔:https://www.sass.hk/docs/ 1.例1: each $theme in $themeList {$themeKey: map-get($theme, key);media screen and (weex-theme: $themeKey) {.btnText {max-width: 150px;include font(map-get($theme, medFont),map-get($theme, subFontS…

chromadb向量數據庫使用 (2)

目錄 代碼代碼解釋**1. 導入 chatGLM 嵌入函數****2. 創建 ChromaDB 客戶端和集合****3. 查詢集合中的數據數量****4. 添加數據到集合****5. 獲取已存儲的文檔****6. 更新文檔****7. 再次獲取數據,驗證更新結果****8. 刪除某個文檔****9. 獲取已刪除的文檔****總結*…

我的世界1.20.1forge模組開發進階物品(7)——具有動畫、3D立體效果的物品

基礎的物品大家都會做了對吧?包括武器的釋放技能,這次來點難度,讓物品的貼圖呈現動畫效果和扔出后顯示3D立體效果,這個3D立體效果需要先學習blockbench,學習如何制作貼圖。 Blockbench Blockbench是一個用于創建和編輯三維模型的免費軟件,特別適用于Minecraft模型的設計…

大模型在敗血癥預測及圍手術期管理中的應用研究報告

目錄 一、引言 1.1 研究背景與意義 1.2 研究目的與創新點 1.3 研究方法與數據來源 二、敗血癥概述 2.1 定義與流行病學 2.2 病因與發病機制 2.3 臨床表現與診斷標準 2.4 并發癥與危害 三、大模型技術原理及在醫療領域的應用 3.1 大模型技術概述 3.2 大模型在醫療領…

SpringBoot接口自動化測試實戰:從OpenAPI到壓力測試全解析

引言:接口測試的必要性 在微服務架構盛行的今天,SpringBoot項目的接口質量直接影響著系統穩定性。本文將分享如何通過自動化工具鏈實現接口的功能驗證與性能壓測,使用OpenAPI規范打通測試全流程,讓您的接口質量保障體系更加完備。…

微軟具身智能感知交互多面手!Magma:基于基礎模型的多模態AI智能體

作者: Jianwei Yang, Reuben Tan, Qianhui Wu, Ruijie Zheng, Baolin Peng, Yongyuan Liang, Yu Gu, MuCai, SeonghyeonYe, JoelJang, Yuquan Deng, Lars Liden, Jianfeng Gao 單位:微軟研究院,馬里蘭大學,威斯康星大學麥迪遜分校…

Linux中jdk-8u291-linux-x64 中jdk工具包

jdk-8u291-linux-x64 指的是適用于 64 位 Linux 系統的 Java 開發工具包(JDK)8 更新 291 版本。這是 JDK 的一個特定版本,用于開發 Java 應用程序和小程序。 jdk-8u291-linux-x64 網盤下載鏈接:夸克網盤分享

Baklib云內容中臺的核心架構是什么?

云內容中臺分層架構解析 現代企業內容管理系統的核心在于構建動態聚合與智能分發的云端中樞。以Baklib為代表的云內容中臺采用三層架構設計,其基礎層為數據匯聚工具集,通過標準化接口實現多源異構數據的實時采集與清洗,支持從CRM、ERP等業務…

17.3 LangSmith Evaluation 深度解析:構建數據驅動的模型優化體系

LangSmith Evaluation 深度解析:構建數據驅動的模型優化體系 關鍵詞:模型評估體系、自動化測試框架、業務指標對齊、A/B測試集成、生產級質量監控 1. Evaluation 核心功能全景 1.1 評估維度矩陣 維度評估指標示例采集方式質量評估準確率、相關性評分、事實性檢查人工標注+A…

華為 VRP 系統簡介配置SSH,TELNET遠程登錄

華為 VRP 系統簡介&配置TELNET遠程登錄 1.華為 VRP 系統概述 1.1 什么是 VRP VRP(Versatile Routing Platform 華為數通設備操作系統)是華為公司數據通信產品的通用操作系統平臺,從低端到核心的全系列路由器、以太網交換機、業務網關等…

算法基礎 -- 字符串哈希的基本概念和數學原理分析

字符串哈希的基本概念和數學原理分析 1. 字符串哈希的定義和基本概念 哈希函數的定義 哈希函數(Hash Function)是一種將任意長度的輸入映射為固定長度輸出的函數。對于字符串而言,哈希函數通過某種算法將字符串轉換成一個整數,…

從新加坡《Companion Guide on Securing AI Systems 》看可信AI全生命周期防護框架構建

從新加坡《AI系統安全指南配套手冊》看可信AI全生命周期防護框架構建 一、引言 1.1 研究背景與意義 近年來,人工智能(AI)技術以前所未有的速度蓬勃發展,已然成為推動各行業變革與創新的核心驅動力。從醫療領域輔助疾病診斷,到金融行業的風險預測與智能投顧,再到交通領…

C++學習之C++初識、C++對C語言增強、對C語言擴展

一.C初識 1.C簡介 2.第一個C程序 //#include <iostream> //iostream 相當于 C語言下的 stdio.h i - input 輸入 o -output 輸出 //using namespace std; //using 使用 namespace 命名空間 std 標準 &#xff0c;理解為打開一個房間&#xff0c;房間里有我們所需…

HTMLS基本結構及標簽

HTML5是目前制作網頁的核心技術&#xff0c;有叫超文本標記語言。 基本結構 聲明部分位于文檔的最前面&#xff0c;用于向瀏覽器說明當前文檔使用HTML標準規范。 根部標簽位于聲明部分后&#xff0c;用于告知瀏覽器這是一個HTML文檔。< html>表示文檔開始&#xff0c;&l…

eMMC存儲器詳解(存儲區域結構、EXT_CSD[179]、各分區介紹、主要引腳、命令格式與類型等)

讀本篇博文所需要的先行知識 關于芯片內部的ROM的作用、工作原理的介紹&#xff0c;鏈接如下&#xff1a; https://blog.csdn.net/wenhao_ir/article/details/145969584 eMMC的物理結構、特點、用途 這個標題的相關內容見我的另一篇博文&#xff0c;博文鏈接如下&#xff1a…

分布式鎖—2.Redisson的可重入鎖一

大綱 1.Redisson可重入鎖RedissonLock概述 2.可重入鎖源碼之創建RedissonClient實例 3.可重入鎖源碼之lua腳本加鎖邏輯 4.可重入鎖源碼之WatchDog維持加鎖邏輯 5.可重入鎖源碼之可重入加鎖邏輯 6.可重入鎖源碼之鎖的互斥阻塞邏輯 7.可重入鎖源碼之釋放鎖邏輯 8.可重入鎖…

iOS實現一個強大的本地狀態記錄容器

我們開發中經常會遇到這樣的場景&#xff0c;就是我們客戶端用戶進行了某個操作&#xff0c;這個操作影響了數據的狀態&#xff0c;但是我們又不方便重新請求一次數據&#xff0c; 這個時候&#xff0c;就需要我們記錄一下本地狀態在內存中&#xff0c;隨著業務越來越復雜&…

vue中帶$的是什么

在Vue.js中&#xff0c;帶的 $ 符號用于表示 Vue實例的屬性和方法。 這些屬性和方法是Vue框架內部定義的&#xff0c;主要用于方便開發者在組件內部訪問和使用。 常見的帶$的屬性和方法: ?$data?&#xff1a;用于訪問組件的內部數據對象&#xff0c;包含組件內定義的所有響…

杰和科技工業整機AF208|防塵+靜音+全天候運行

在特殊的工業環境中&#xff0c;實現快速生產離不開各類工業計算機的強大支持。杰和科技工業計算機AF208&#xff0c;作為核心控制單元&#xff0c;憑借其堅固可靠的外殼、先進的散熱技術以及緊湊靈活的部署特點&#xff0c;發揮著關鍵作用。 硬實力外殼&#xff0c;無懼塵埃 …