【深度學習與實戰】2.3、線性回歸模型與梯度下降法先導案例--最小二乘法(向量形式求解)

為了求解損失函數?loss = (f(x)-y)^2 = (wx-y)^2對?w?的導數,并利用最小二乘法向量形式求解?w?的值?

這是?線性回歸?的平方誤差損失函數,目標是最小化預測值?X_w?與真實值?y?之間的差距。

?損失函數?:
考慮多個樣本的情況,損失函數為所有樣本的平方誤差之和:

L = (Xw-Y)^2

??????????????????????=( X w-Y )^{\top} ( X w-Y )

?????????????????????????????????????????????????????????=w^{\mathsf{T}} X^{\mathsf{T}} X w-Y^{\mathsf{T}} X w-w^{\mathsf{T}} X^{\mathsf{T}} Y+Y^{\mathsf{T}} Y

  • L?是損失函數
  • X?是?n\times m?的設計矩陣(n個樣本,m個特征)。
  • w是?m\times 1?的權重向量。
  • Y是?n\times 1?的目標值向量。
  • 對于兩個列向量\partialb,它們的點積(內積)就是\partial ^Tb,??\partial ^T是向量?\partial?的轉置

針對?f(x)?=w^{\mathsf{T}} X^{\mathsf{T}} X w-Y^{\mathsf{T}} X w-w^{\mathsf{T}} X^{\mathsf{T}} Y+Y^{\mathsf{T}} Y函數求導,有一下性質:

\frac{\partial AB}{\partial B} = A^T,\frac{\partial A^TB}{\partial A} = B,\frac{\partial C^TAC}{\partial C} = 2AC

對每項求導?
?第一項? ?w^{\mathsf{T}} X^{\mathsf{T}} X w

????????將?\frac{\partial C^TAC}{\partial C} = 2AC?公式代入得

????????X^T \cdot w^T X w??\Rightarrow??X^T\cdot 2AC?\Rightarrow?2X^TXw

????????w^{\mathsf{T}} X^{\mathsf{T}} X w??= 2X^TXw

????????其中??w^T? 為?C^T,?X?為?Aw?為?c

第二項??Y^{\mathsf{T}} X w

????????將?\frac{\partial AB}{\partial B} = A^T?公式代入得

? ? ? ?Y^{\mathsf{T}} X \cdot w\Rightarrow A^T \Rightarrow (Y^{\mathsf{T}} X)^T

?????????Y^{\mathsf{T}} X w = (Y^{\mathsf{T}} X)^T

????????其中?Y^{\mathsf{T}} X?為?A,w?為?B

第三項?w^{\mathsf{T}} X^{\mathsf{T}} Y

????????將?\frac{\partial A^TB}{\partial A} = B?代入得

????????w^{\mathsf{T}} \cdot X^{\mathsf{T}} Y\Rightarrow B\Rightarrow X^{\mathsf{T}} Y

????????w^{\mathsf{T}} X^{\mathsf{T}} Y = X^{\mathsf{T}} Y

????????其中?w^T?為?A^T,X^{\mathsf{T}} Y?為?B

第四項 沒有?w?看作常數項 常數項的導數為0
合并項得

????????f(x) =w^{\mathsf{T}} X^{\mathsf{T}} X w-Y^{\mathsf{T}} X w-w^{\mathsf{T}} X^{\mathsf{T}} Y+Y^{\mathsf{T}} Y

? ? ?= 2X^TXw-(Y^{\mathsf{T}} X)^T-X^{\mathsf{T}} Y+0

=2X^TXw-X^{\mathsf{T}} Y-X^{\mathsf{T}} Y? ? ? ? ?

=2X^TXw-2X^{\mathsf{T}} Y? ? ? ? ? ? ? ? ? ? ??

=2(X^TXw-X^{\mathsf{T}} Y)? ? ? ? ? ? ? ? ?? ??

?令?\frac{\partial f(w)}{\partial w} = 0,得

?2(X^TXw-X^{\mathsf{T}} Y) = 0

X^TXw=X^{\mathsf{T}} Y

(X^TX)^{-1}X^TXw=(X^TX)^{-1}X^{\mathsf{T}} Y?(X^TX?可逆時)

w=(X^TX)^{-1}X^{\mathsf{T}} Y

(X^TX)(X^TX)^{-1}互為逆矩陣??(X^TX)(X^TX)^{-1} = 1

得出結果
???w=(X^TX)^{-1}X^{\mathsf{T}} Y

解釋:

(X^TX)(X^TX)^{-1} = 1,(X^TX)(X^TX)^{-1}互逆

?逆矩陣的定義

如果?B是?A的逆矩陣,則滿足:

AB=BA=I(單位矩陣 類似于數值乘法中的?1)

?即無論?A左乘還是右乘?B,結果均為單位矩陣。

必要條件?

AB必須是方陣(行數=列數)

A必須可逆(即行列式 det(A) \neq 0

直觀理解

?逆矩陣的作用類似于“倒數”。例如,數值中?2\times \frac{1}{2} = 1,類似地,矩陣中?A\times A^{-1} = I

單位矩陣?I在矩陣乘法中的作用類似于數值乘法中的?1。

示例驗證

取矩陣?A=\begin{bmatrix} 1 & 2 \\ 3& 4 \end{bmatrix},其行列式det(A) = -2 \neq 0,故可逆。

計算逆矩陣:

A^{-1} = \frac{1}{det(A)}\begin{bmatrix} 4 &-2 \\ -3& 1 \end{bmatrix}= \frac{1}{-2}\begin{bmatrix} 4 &-2 \\ -3& 1 \end{bmatrix}= \begin{bmatrix} -2 &1 \\ \frac{3}{2}& -\frac{1}{2} \end{bmatrix}

?(1) 第一行第一列的元素 (C_{11}?)?

C_{11}=\frac{1}{-2}\times 4=-2

?(2) 第一行第二列的元素 (C_{12}?)?

C_{12}=\frac{1}{-2}\times -2 = 1

?(3) 第一行第二列的元素 (C_{21}?)?

C_{21}=\frac{1}{-2}\times -3 = \frac{3}{2}

?(4) 第一行第二列的元素 (C_{22}?)?

C_{22}=\frac{1}{-2}\times 1 =- \frac{1}{2}

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/73506.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/73506.shtml
英文地址,請注明出處:http://en.pswp.cn/web/73506.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

氣象可視化衛星云圖的方式:方法與架構詳解

氣象衛星云圖是氣象預報和氣候研究的重要數據來源。通過可視化技術,我們可以將衛星云圖數據轉化為直觀的圖像或動畫,幫助用戶更好地理解氣象變化。本文將詳細介紹衛星云圖可視化的方法、架構和代碼實現。 一、衛星云圖可視化方法 1. 數據獲取與預處理 衛星云圖數據通常來源…

瀏覽器渲染原理與優化詳解

一、瀏覽器渲染基礎原理 瀏覽器渲染流程主要包括以下步驟(也稱為"關鍵渲染路徑"): 構建DOM樹:將HTML解析為DOM(文檔對象模型)樹構建CSSOM樹:將CSS解析為CSSOM(CSS對象模…

基于Spring Boot的成績管理系統后臺實現

下面是一個完整的成績管理系統后臺實現,使用Spring Boot框架,包含學生管理、課程管理和成績管理功能。 1. 項目結構 src/main/java/com/example/grademanagement/ ├── config/ # 配置類 ├── controller/ # 控制器 ├── dto/ …

實現極限網關(INFINI Gateway)配置動態加載

還在停機更新 Gateway 配置,OUT 了。 今天和大家分享一個 Gateway 的功能:動態加載配置(也稱熱更新或熱加載)。 這個功能可以在 Gateway 不停機的情況下更新配置并使之生效。 配置樣例如下: path.data: data path.…

Mean Shift 圖像分割與 Canny 邊緣檢測教程

1. Mean Shift 簡介 Mean Shift 是一種聚類算法,通過尋找圖像中顏色相似的區域來實現分割。它非常適合用于場景分割或物體檢測等任務。本教程將它與 Canny 邊緣檢測結合,突出分割區域的邊界。 2. 圖像分割流程 我們將按照以下步驟完成圖像分割和邊緣檢…

Day15 -實例 端口掃描工具 WAF識別工具的使用

一、端口掃描工具 1、zenmap 我這里user是漢字名,沒有解析成功。等后續換一個英文賬戶試一試。 魔改kali的nmap nmap -p8000-9000 8.140.159.19 2、masscan cmd啟動,拖入exe文件。然后先寫ip,會報錯給提示 尋路犬系統 我們去找一下他的…

如何解決高并發場景下的性能瓶頸?實踐分享

解決高并發性能瓶頸的核心方法包括優化系統架構、合理使用緩存技術、數據庫優化及擴展策略、負載均衡設計。 其中,優化系統架構是根本解決性能問題的關鍵所在。良好的系統架構能夠有效支撐業務高效穩定運行,避免性能瓶頸帶來的損失。企業可通過微服務架構…

自動駕駛背后的數學:ReLU,Sigmoid, Leaky ReLU, PReLU,Swish等激活函數解析

隨著自動駕駛技術的飛速發展,深度學習在其中扮演著至關重要的角色。而激活函數作為神經網絡中的關鍵組件,直接影響著模型的性能和效果。前面幾篇博客 自動駕駛背后的數學:特征提取中的線性變換與非線性激活 , 「自動駕駛背后的數學&#xff1…

性能測試、負載測試、壓力測試的全面解析

在軟件測試領域,性能測試、負載測試和壓力測試是評估系統穩定性和可靠性的關鍵手段。?它們各自關注不同的測試目標和應用場景,理解這些差異對于制定有效的測試策略至關重要。 本文對性能測試、負載測試和壓力測試進行深入分析,探討其定義、…

責任鏈模式-java

1、spring依賴注入模式 @Configuration public class ChainConfig {@Beanpublic ChainSpringFactory chainSpringFactory(List<IHandler<DemoOne,Boolean>> handlerList){return new ChainSpringFactory(handlerList);}} public class DemoOne { }public abstract…

學習本地部署DeepSeek的過程(基于LM Studio)

除了使用Ollama部署DeepSeek&#xff0c;還可以使用LM Studio部署DeepSeek&#xff0c;后者是一款允許用戶在本地計算機上運行大型語言模型&#xff08;LLMs&#xff09;的桌面應用程序&#xff0c;旨在簡化本地模型的使用&#xff0c;無需云端連接或復雜配置即可體驗 AI 功能。…

CSS 尺寸 (Dimension)

CSS 尺寸 (Dimension) 在網頁設計中&#xff0c;CSS&#xff08;層疊樣式表&#xff09;的尺寸屬性是控制元素大小和位置的關鍵。本文將詳細介紹CSS尺寸相關的概念、屬性及其應用。 1. CSS 尺寸概述 CSS尺寸主要包括寬度和高度&#xff0c;這些屬性可以應用于各種HTML元素&a…

【自學筆記】ELK基礎知識點總覽-持續更新

提示&#xff1a;文章寫完后&#xff0c;目錄可以自動生成&#xff0c;如何生成可參考右邊的幫助文檔 文章目錄 ELK基礎知識點總覽1. ELK簡介2. Elasticsearch基礎Elasticsearch配置示例&#xff08;elasticsearch.yml&#xff09; 3. Logstash基礎Logstash配置示例&#xff08…

等差數列公式推導

前言&#xff1a; 通過實踐而發現真理&#xff0c;又通過實踐而證實真理和發展真理。從感性認識而能動地發展到理性認識&#xff0c;又從理性認識而能動地指導革命實踐&#xff0c;改造主觀世界和客觀世界。實踐、認識、再實踐、再認識&#xff0c;這種形式&#xff0c;循環往…

【MySQL】用戶賬戶、角色、口令、PAM

目錄 查看用戶賬戶設置 連接 1.本地連接 2.遠程連接 賬戶 角色 操作用戶賬戶和角色 配置口令和賬戶有效期限 手工使口令過期 配置口令有效期限 PAM身份驗證插件 客戶端連接&#xff1a;使用 PAM 賬戶登錄 在連接到MySQL服務器并執行查詢時&#xff0c;會驗證你的身…

5種生成模型(VAE、GAN、AR、Flow 和 Diffusion)的對比梳理 + 易懂講解 + 代碼實現

目錄 1 變分自編碼器&#xff08;VAE&#xff09;? 1.1 概念 1.2 訓練損失 1.3 VAE 的實現 2 生成對抗網絡&#xff08;GAN&#xff09;? 2.1 概念 2.2 訓練損失 a. 判別器的損失函數 b. 生成器的損失函數 c. 對抗訓練的動態過程 2.3 GAN 的實現 3 自回歸模型&am…

印刷電路板 (PCB) 的影響何時重要?在模擬環境中導航

我和我的同事們經常被問到關于 PCB 效應的相同問題&#xff0c;例如&#xff1a; 仿真何時需要 PCB 效果&#xff1f; 為什么時域仿真需要 PCB 效應&#xff1f; 當 PCB 效應必須包含在仿真中時&#xff0c;頻率是否重要&#xff1f; 設計人員應該在多大程度上關注 VRM 模型中包…

2024跨境電商挑戰:AI反檢測技術在避免封號中的作用

2024跨境電商挑戰&#xff1a;AI反檢測技術在避免封號中的作用 跨境電商的浪潮席卷全球&#xff0c;為商家打開了通往世界各地的大門。然而&#xff0c;隨著平臺監管的加強&#xff0c;合規性問題成為商家不得不面對的挑戰。在電商平臺的嚴格監控下&#xff0c;任何違規行為都…

QML控件 - Text

在 QML 中&#xff0c;Text 組件是用于顯示文本的核心元素&#xff0c;支持豐富的文本樣式、布局和交互功能。以下是 完整指南 和常見用法示例&#xff1a; 1. 基礎用法 import QtQuick 2.15Text {text: "Hello, QML!" // 顯示文本內容font.pixelSize: 20 // 字體…

網絡運維學習筆記(DeepSeek優化版) 024 HCIP-Datacom OSPF域內路由計算

文章目錄 OSPF域內路由計算&#xff1a;單區域的路由計算一、OSPF單區域路由計算原理二、1類LSA詳解2.1 1類LSA的作用與結構2.2 1類LSA的四種鏈路類型 三、OSPF路由表生成驗證3.1 查看LSDB3.2 查看OSPF路由表3.3 查看全局路由表 四、2類LSA詳解4.1 2類LSA的作用與生成條件4.2 2…