線性代數--AI數學基礎復習

原文鏈接:Github-Funny_Mr_Zhi GNN_playground

參考:麻省理工公開課 線性代數 MIT Linear Algebra

Chapter1

可以帶著問題去讀,線性代數到底是什么,矩陣又是什么。盡管深入學習數學需要一種抽離出現實和直觀理解的高度抽象思維,前期利用一些具體的現實映射示例有助于更好地理解和接受一套理論。

最終結論:矩陣分解A=LU是高斯消元求解n元方程組的抽象表示,高斯消元求解也是矩陣分解的一種具體現實映射,它幫助我們初步了解矩陣的妙用與可能的理解方式,為后續更廣泛而奇妙的應用打下基礎!(看到第一章最后就可以理解這句話,理解了這句話這一章也就學會了)

需要重點理解的用紅色大字體標出

Class 1

Class 1:Explanation of the geometic equation system 方程組的幾何解釋

基本問題:N linear equations , n unknowns. 求解N個線性等式的n個未知數

三種視角

  • Row picture
  • column picture
  • matrix from

以二元一次方程組為例
2x?y=0?x+2y=3\begin{align} 2x - y = 0\\ -x+2y = 3 \end{align}2x?y=0?x+2y=3??
用線性代數表示
[2?1?12][xy]=[03]\left[ \begin{array}{ccc} 2 & -1 \\ -1 & 2 \end{array} \right] \left[ \begin{array}{ccc} x\\y \end{array} \right] = \left[ \begin{array}{ccc} 0\\3 \end{array} \right][2?1??12?][xy?]=[03?]

  • Row picture看,是二維空間的兩條直線,交點即為解
  • column picture看,是二維空間的兩個向量,通過linear combination線性組合合成(0, 3)
  • Matrix form看,計算左側結構,可以當成矩陣乘法,也可以分解為column picture求解

具體解法中,圖解只能在低維度使用,高維度不夠直觀,會用系統性的消元法解。這里重點關注線性組合,也就是理解列視角的看問題的方式。

一個常見的基本問題:

  • Can I solve Ax = b for every b
  • or say: Do the linear combinations of the columns fill N-D space
  • 這個問題的答案與奇異\非奇異,可逆\非可逆有關

Class 2

elimination消元法解方程組

以三元一次方程組為例,一個自然的想法是利用消元法求解。

對應到矩陣上Ax=bAx = bAx=b,對角線上的元素稱為主元,消元最終目的是主元下方的元素全部為0,且主元不為零。滿足條件后,說明求解成功,通過回代可以求出所有變量的解。

  • 從第一行開始,若當前主元行的主元不為零,則講該行整體疊加到下面的行,確保主元下方元素都為0
  • 若當前行主元為零,則可以交換主元行和其它行的位置,再次嘗試第一步
  • 逐行處理,若對角線主元全部非零且主元下方全部為零(上三角矩陣),則求解成功
    • 回代:在所有過程中間矩陣右側補充b列,稱為argumented matrix增廣矩陣
    • b同步疊加操作,結果從最后一行開始向上逐行解出變量值
  • 若無法滿足上一步的要求,求解失敗

該處理步驟可以和直接在方程組上進行消元的操作一一對應,直接目的就是消元。

從另一個角度理解:如何看待矩陣運算(一種行列變換)

|a b c| |x|      |a|     |b|     |c|
|d e f| |y| =  x |d| + y |e| + z |f|    //右側列分解列疊加
|g h i| |z|      |g|     |h|     |i||a b c|    
|x y z| |d e f| = x |a b c| + y |d e f| + z |g h i|  //左側行分解行疊加|g h i||a b|   |0 1| 
|c d|   |1 0|   等效于對左側矩陣進行列置換,右側變換矩陣進行列變換|0 1|   |a b|   
|1 0|   |c d|   等效于對右側矩陣進行行置換,左側變換矩陣進行行變換|1 0|   |a   b|    |a    b|
|2 1|   |-2a d|  = |0 d+2b|
等效于對右側矩陣進行行變換,第一行不變,第二行為二倍第一行疊加過來

深入理解矩陣乘與行列變換的對應關系!

有了上面的理解,消元無非是行變換,也就是在A左側不斷乘上新的矩陣達到消元的目的。即消元過程可表示為Ex…(E1A)=UE_{x}\dots(E_{1}A) = UEx?(E1?A)=U 其中U為上三角矩陣。(這里注意,矩陣乘法有結合律,但沒有交換律)

進一步可以思考逆矩陣的概念,從上面的理解角度,就是通過逆變換消除原來變換的影響

|1  0| |1   0| |a b|
|3  1| |-3  1| |c d|
以上兩個左側矩陣為逆變換,先是R2 = R2 - 3R1再是R2 = R2 + 3R1,還原回A

Class 3

  • Matrix mutiplication
  • Inverse of A
  • Gauss-Jordan find A?1A^{-1}A?1

首先學習矩陣乘法的四種計算方式,結果是一樣的,四種方式事實上從四個角度理解矩陣乘法

矩陣乘法

對于矩陣乘法AB=CAB = CAB=C

  • 方式一: Cij=(RowjofA)?(ColiofB)C_{ij} = (Row_j\quad of\quad A)\quad ·\quad ( Col_i\quad of\quad B)Cij?=(Rowj?ofA)?(Coli?ofB)

Cij=∑k=1naikbkjC_{ij} = \sum_{k=1}^n a_{ik}b_{kj}Cij?=k=1n?aik?bkj?

  • 方式二:C的每一列由A的列的線性組合得到,C的第k列由B的第K列與A矩陣定義的線性組合得到
  • 方式三:C的每一行由B的行的線性組合得到,C的第k行由A的第K行與B矩陣定義的線性組合得到
  • 方式四:C=∑k=1n((ColkofA)?(RowkofB))C = \sum_{k=1}^{n}((Col_k\quad of \quad A) · (Row_k\quad of\quad B))C=k=1n?((Colk?ofA)?(Rowk?ofB))

這種理解方式是從多個視角觀察矩陣乘法時到底發生了什么。
從AB角度看,可以拆分為行列乘、矩陣與列乘、行與矩陣乘、列行乘
從C角度看,可以認為是一次計算一個元素、一次計算一列,一次計算一行,一次計算整個矩陣的部分分量

矩陣的逆與Gauss-Jordan

對于一個矩陣A,定義A的逆為A?1A^{-1}A?1
A?1A=I=AA?1A^{-1}A = I = AA^{-1}A?1A=I=AA?1

關注兩個問題:A的逆是否存在,以及如何求A的逆(此時可以與解方程組聯系起來)

定理:若能找到非零向量x使得,Ax=0Ax=0Ax=0,則A不可逆

反正法解釋:若存在A的逆,Ax=0Ax=0Ax=0說明Ix=A?10=0Ix = A^{-1}0 = 0Ix=A?10=0,若x非零顯然矛盾,單位矩陣乘非零向量不可能為零。

Gauss-Jordan目的是一次解多個N元方程組

|1 3|  |a c| = |x y|
|2 7|  |b d|   |i j|    可以理解為解兩組方程第一組是:
|1 3|  |a| = |x|
|2 7|  |b|   |i|        第二組由B和C的另外一列構成,省略解法為將原A和C拼接,寫成增廣矩陣|A C|
|1 3 x y|
|2 7 i j|
然后對左側A部分進行消元
|1 3 x    y   |
|0 1 i-2x j-2y|         
以上是Guass做法,Jordan繼續消除A對角線以外其它元素(矩陣內運算替代回代過程)
|1 0 -3i+7x -3j+7y|
|0 1 i-2x   j-2y  | 
這樣就解出a, b和c, d了求逆是可以利用Gauss-jordan,令右側C=I
|A I|進行Gauss-jordan計算求解
得到|I E|這里,由于EA=I,則可以得出E即為要求解的A的逆

到這里為止,線性代數可以看作對于AB=CAB = CAB=C中,知道任意兩個矩陣,求另一個矩陣的范疇。

對于AB = Col of C,可以等效為求解一個N元方程。這是矩陣乘法和多元方程求解的對應關系。

通過矩陣分塊和矩陣運算在等式兩側同時乘上一個矩陣,等式仍成立(以及矩陣運算分配律、結合律)可以通過一些有趣的方法實現系統性的計算過程。

理解Gauss-Jordan算法中用到的矩陣運算技巧,以及每一個運算過程對應的實際含義

Class4

  • 矩陣求逆和轉置的公式
  • 矩陣分解 A = LU
  • 矩陣分解復雜度
  • 矩陣置換的組合與群

矩陣求逆和

(AB)?1=B?1A?1(1)(AB)^{-1} = B^{-1}A^{-1}\quad (1)(AB)?1=B?1A?1(1)
前提是在A,B有逆。該公式較為容易理解,(AB)的逆應該與(AB)左乘右乘都為I, B?1A?1B^{-1}A^{-1}B?1A?1顯然滿足

(AT)?1=(A?1)T(2)(A^T)^{-1} = (A^{-1})^T\quad (2)(AT)?1=(A?1)T(2)
以式子(AB)T=BTAT(AB)^T = B^TA^T(AB)T=BTAT為基礎,(A?1)TAT=(AA?1)T=I(A^{-1})^TA^T = (AA^{-1})^T = I(A?1)TAT=(AA?1)T=I,即ATA^{T}AT的逆為(A?1)T(A^{-1})^T(A?1)T

矩陣分解

一種較為基礎的分解:將A分解為L和上三角矩陣U

  • 在高斯消元法中,為了得到上三角矩陣UUU,使用E與A相乘得到U。
  • 通常,E可以表示為若干步驟的行變換(若A可解的話)
    • e.g.對3x3矩陣,E可分解為E32E31E21E_{32}E_{31}E_{21}E32?E31?E21?,其中EijE_{ij}Eij?表示E為在I的基礎上,第i行j列非零的矩陣,即將j行疊加到i行以消除A中主元下方i行的元素的變換
  • 對于EA=UEA = UEA=U可以寫成A=E?1UA = E^{-1}UA=E?1U,這里E?1E^{-1}E?1就是我們要求的L
  • 通常E?1E^{-1}E?1寫成若干(Eij)?1(E_{ij})^{-1}(Eij?)?1相乘的形式,若采用這種分開寫的形式和行變換視角理解矩陣乘和求逆計算,求解L的整個過程不需要任何演算,全部心算即可完成。

以下為示例

以3x3矩陣為例
假設E = E32 E21 (A31天然為0, 簡化說明過程)
不妨令|1 0 0| |1 0 0|
E = |0 1 0|*|4 1 0||0 3 1| |0 0 1|
則L = E32的逆 * E21的逆|1  0 0| |1  0 0|
L = |-4 1 0|*|0  1 0||0  1 1| |0 -3 1|  利用行變換思路理解求逆,直接加負號就行|1  0 0|
L = |-4 1 0||0 -3 1|  利用行變換思路求矩陣乘,很快

對于求L的過程,如果嚴格按照分解E的過程來寫,并從行變換角度理解矩陣求逆和矩陣乘法。整個過程會很簡單。因為過程中出現的所有矩陣求逆和矩陣乘法的結果從行變換的角度來看都可以一眼看出結果

由此再觀察矩陣分解式子:A=LUA = LUA=LU。我們關注的就只是E代表的矩陣列表,得到這個列表后只需求逆,然后逆序相乘即可。

矩陣分解復雜度分析

每一次求加法或減法視為一次計算

對于n*n的矩陣

  • 第一次講(1, 1)主元下的元素全部消為0,涉及下面(n-1)行的疊加計算,共(n*n-1)次計算,近似為n2n^2n2
  • 第二次為(n?1)2(n-1)^2(n?1)2,后續以此類推
  • 總共需要n2+(n?1)2+…12n^2 + (n-1)^2 + \dots 1^2n2+(n?1)2+12次計算,利用微積分知識可近似為1/3n31/3n^31/3n3

該矩陣分解的過程事實上是在模擬高斯消元的過程,對于右側b的變化其復雜度可以近似為n2n^2n2

矩陣置換的組合與群

對于一個n*n的矩陣,行(列)置換共有n(n-1)種可能

由于置換組合已經覆蓋了所有可能的置換方式,所有置換組合相乘或取逆,其結果仍是一種置換,也就仍是置換的一種。這種不論如何計算結果仍在原先集合內的性質,比較類似群的概念。

第一章小結

至此第一章完結,從最開始的解n元方程組入手,逐步引入了矩陣的概念

認識矩陣有多種方式,矩陣也有很多奇妙的性質。通過矩陣的運算,也可以理解為矩陣的變換,我們從一個完全不同的角度嘗試了n原方程組的求解。基本的矩陣分解的一種形式(A = LU)事實上模擬了高斯消元的過程,但整個過程種只包含非常簡單的矩陣運算(或者更直觀一點說是變換)。

本質上我們做的事還是求解n元方程組,但是矩陣用一種高度概括和抽象的視角抽離出問題求解的關鍵所在,并用優雅且簡單的抽象變換完成了問題的求解。

矩陣的變換和直接在n原方程上進行加減疊加消元的每一步操作是可以完全對應上的。就是對問題本質的高度抽象。然而這是n元方程求解的全部,但不是線性代數的全部,矩陣的應用遠不止這些。后續章節應該會更深入的理解線性代數及其用途。

矩陣分解A=LU是高斯消元求解n元方程組的抽象表示,高斯消元求解也是矩陣分解的一種具體現實映射,它幫助我們初步了解矩陣的妙用與可能的理解方式,為后續更廣泛而奇妙的應用打下基礎!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/90574.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/90574.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/90574.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Cursor配置DeepSeek調用MCP服務實現任務自動化

文章目錄1. 任務需求2. 環境準備2.1 Cursor安裝2.2 Node.js安裝2.3 DeepSeek模型Key申請2.4 高德地圖Key申請3. MCP服務配置3.1 Cursor配置Server方式3.1.1全局設置3.1.2 項目級別設置3.2 MCP服務接入3.2.1 高德地圖MCP服務3.2.2 Mysql MCP服務3.2.3 FileSystem MCP服務3.2.4 驗…

java SpringBoot數據庫查詢 時間范圍查詢

exTime的類型為varchar 存儲的數據格式為yyy-MM-ddTHH:mm:ss,查詢時傳進來的時間格式也需要為yyy-MM-ddTHH:mm:ss格式Query(value "SELECT * FROM test_fbep fbep WHERE delFlag 1 " "AND IF(?1 ! AND ?1 IS NOT NULL, fbep.passId ?1, TRUE) " &q…

Linux 操作系統如何實現軟硬件解耦?從容器與硬件接口封裝談起

在計算機系統中,軟硬件解耦是提升系統靈活性、可移植性和可維護性的核心設計思想。Linux 作為開源操作系統的典范,通過數十年的演進形成了一套成熟的解耦機制。本文將從容器技術和硬件接口封裝兩個維度,深入解析 Linux 如何實現軟硬件解耦&am…

7月10號總結 (1)

今天開始寫web項目&#xff0c;畫了一下登錄界面&#xff0c;借鑒了一下網上的資源。 <!DOCTYPE html> <html lang"zh.CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initi…

Docker 高級管理 -- 容器通信技術與數據持久化

目錄 第一節:容器通信技術 一&#xff1a;Docker 容器的網絡模式 1&#xff1a;Bridge模式 2&#xff1a;Host模式 3&#xff1a;Container模式 4&#xff1a;None模式 5&#xff1a;Overlay 模式 6&#xff1a;Macvlan 模式 7&#xff1a;自定義網絡模式 二&#xff…

鏈路管理和命令管理

第1章 鏈路管理在通信領域&#xff0c;鏈路&#xff08;Link&#xff09; 是兩個設備之間進行數據傳輸的物理或邏輯路徑。例如&#xff1a;網絡鏈路&#xff1a;TCP/IP 連接、UDP 通信、WebSocket串口鏈路&#xff1a;RS232、RS485、CAN 總線無線鏈路&#xff1a;藍牙、Wi-Fi、…

BERT模型基本原理及實現示例

BERT&#xff08;Bidirectional Encoder Representations from Transformers&#xff09;是Google在2018年提出的預訓練語言模型&#xff0c;其核心思想是通過雙向Transformer結構捕捉上下文信息&#xff0c;為下游NLP任務提供通用的語義表示。 一、模型架構BERT基于Transforme…

NPM組件包 json-cookie-csv 等竊取主機敏感信息

【高危】NPM組件包 json-cookie-csv 等竊取主機敏感信息 漏洞描述 當用戶安裝受影響版本的 json-cookie-csv 等NPM組件包時會竊取用戶的主機名、用戶名、工作目錄、IP地址等信息并發送到攻擊者可控的服務器地址。 MPS編號MPS-xo1f-4kue處置建議強烈建議修復發現時間2025-07-…

【Netty+WebSocket詳解】WebSocket全雙工通信與Netty的高效結合與實戰

一、 Netty網絡框架、WebSocket協議基礎 1.1 Netty網絡框架介紹 1.2 WebSocket簡介 1.3 WebSocket握手流程 二、為什么選擇NettyWebSocket&#xff1f; 三、NettyWebSocket與Spring WebSocket 3.1 架構層級對比 3.2 核心組件差異 3.3 協議支持深度 3.4 性能基準測試 3.5 開發…

5、Vue中使用Cesium實現交互式折線繪制詳解

引言 Cesium是一款強大的開源3D地理信息可視化引擎&#xff0c;廣泛應用于數字地球、地圖可視化等領域。在Vue項目中集成Cesium可以快速構建高性能的地理信息應用。本文將詳細介紹如何在Vue項目中實現交互式折線繪制功能&#xff0c;包括頂點添加、臨時繪制、距離計算等核心功…

mysql實戰之主從復制

原理圖理論&#xff1a;一、配置準備每臺主機都安裝mysql對每臺主機都進行對時操作&#xff0c;減少時間誤差[rooteveryone ~]# timedatectl set-timezone Asia/Shanghai [rooteveryone ~]# systemctl restart chronyd.service 對每臺主機都進行關閉防火墻、上下文等&#xff0…

中望CAD2026亮點速遞(5):【相似查找】高效自動化識別定位

本文為CAD芯智庫整理&#xff0c;未經允許請勿復制、轉載&#xff01;原文轉自&#xff1a;www.xwzsoft.com/h-nd-594.html CAD的相似查找功能主要應用于需要重復操作、標準化控制、一致性檢查或復雜模式識別的場景&#xff0c;通過圖形相似度算法&#xff0c;快速找到匹配的圖…

國產化條碼類庫Spire.Barcode教程:使用 C# 讀取二維碼(QR Code)——從圖片或數據流解析

二維碼已成為現代應用的常見組成部分&#xff0c;廣泛應用于用戶身份驗證、移動支付、商品包裝和活動票務等場景。很多使用 C# 開發的系統需要從圖像或掃描件中提取二維碼信息&#xff0c;因此掌握二維碼識別技術顯得尤為重要。 為滿足這類需求&#xff0c;開發者需要一種既可…

IPSAN 共享存儲詳解:架構、優化與落地實踐指南

一、IPSAN 技術定位與核心價值核心價值對比矩陣&#xff1a;維度IPSANFC-SAN實現方案成本端口成本$500端口成本$2000復用IP網絡設備傳輸距離跨地域&#xff08;VPN/專線&#xff09;≤10公里兩地三中心架構運維效率SNMP/CLI管理Zone/ALPA管理自動化運維工具鏈協議標準IETF RFC …

【衛星語音】基于神經網絡的低碼率語音編解碼(ULBC)方案架構分析:以SoundStream為例

摘要 隨著深度學習技術的快速發展&#xff0c;基于神經網絡的音頻編解碼技術已成為下一代音頻壓縮的重要研究方向。本文以Google提出的SoundStream為核心分析對象&#xff0c;深入探討其在低碼率語音編解碼領域的創新架構設計和關鍵技術突破。SoundStream通過全卷積編解碼器網絡…

技術面試問題總結一

MySQL的幾種鎖機制一、從鎖的粒度角度劃分表級鎖機制&#xff1a;它是對整張表進行鎖定的一種鎖。當一個事務對表執行寫操作時&#xff0c;會獲取寫鎖&#xff0c;在寫鎖持有期間&#xff0c;其他事務無法對該表進行讀寫操作&#xff1b;而當事務執行讀操作時&#xff0c;會獲取…

Python(一)

基本語法&#xff1a;變量&#xff0c;語法變量類型&#xff1a;不同于Java&#xff0c;C語言&#xff0c;C&#xff0c;Python在創建一個變量的時候&#xff0c;不需要聲明變量類型&#xff0c;由編譯器自行識別Python語句在只有一個語句的時候語句末尾不需要分號&#xff0c;…

Adaptive AUTOSAR中的Firewall技術:智能汽車網絡安全架構的核心

1 防火墻技術基礎 1.1 定義與演進歷程 防火墻(Firewall)作為一種位于內部網絡與外部網絡之間的網絡安全系統,本質上是依照特定規則允許或限制數據傳輸的信息安全防護機制。在汽車電子電氣架構從分布式向集中式轉變的背景下,防火墻技術已從傳統的IT領域深度融入Adaptive A…

android閃光燈源碼分析

目錄 一、APP層源碼分析 二&#xff0c;framework層代碼分析 ???????2.1 binder溯源 這幾天擼了android11 aosp閃光燈源碼&#xff0c;本著前人栽樹后人乘涼的原則&#xff0c;有志于android系統開發的新同學們提供一盞明燈&#xff0c;照亮你們前行。 本人擼代碼風格&…

文心一言4.5開源部署指南及文學領域測評

&#x1f4dd;個人主頁&#xff1a;哈__ 期待您的關注 目錄 一、引言 二、文心一言開源模型 2.1 MoE架構 2.2 文心一言MoE架構 三、文心一言稠密模型部署 3.1 產品選擇 3.2 環境選擇 3.3 Python3.12安裝 3.3 PaddlePaddle-GPU安裝 3.4 FastDeploy-GPU安裝 ?編輯3.…