低秩矩陣、奇異值矩陣和正交矩陣

低秩矩陣

低秩矩陣(Low-rank Matrix)是指秩(rank)遠小于其行數和列數的矩陣,即 r a n k ( M ) = r ? min ? ( m , n ) rank(M) = r \ll \min(m,n) rank(M)=r?min(m,n)。其核心特點是信息冗余性,可通過少量獨立基向量(奇異向量)近似表示整個矩陣,從而在數據壓縮、去噪和補全等任務中發揮重要作用。

意義

矩陣乘法是大多數機器學習模型的核心計算瓶頸。為了降低計算復雜度,已經出現了許多方法對一組更高效的矩陣進行學習。這些矩陣被稱為結構化矩陣,其參數數量和運行時間為次二次函數(對于 𝑛 維度,其參數數量和運行時間為 𝑜1𝑛2o)。結構化矩陣最常見的例子是稀疏矩陣低秩矩陣,以及信號處理中常見的快速變換(傅里葉變換、切比雪夫變換、正弦/余弦變換、正交多項式)。

核心概念

  1. 秩的定義
    矩陣的秩表示其線性無關的行或列向量的最大數量。若矩陣 M ∈ R m × n M \in \mathbb{R}^{m \times n} MRm×n 的秩為 r r r,則存在分解 M = U V T M = UV^T M=UVT,其中 U ∈ R m × r U \in \mathbb{R}^{m \times r} URm×r V ∈ R n × r V \in \mathbb{R}^{n \times r} VRn×r,參數總量從 m × n m \times n m×n 降至 ( m + n ) × r (m+n) \times r (m+n)×r

  2. SVD與低秩逼近
    奇異值分解(SVD)將矩陣分解為 M = U Σ V T M = U\Sigma V^T M=UΣVT,其中 Σ \Sigma Σ 為奇異值矩陣。通過保留前 k k k 個最大奇異值( k ? r k \ll r k?r),可得到最優低秩近似 M k M_k Mk?(Eckart-Young-Mirsky定理)。

應用場景

  1. 推薦系統
    用戶-物品評分矩陣通常低秩,通過矩陣分解(如SVD)挖掘潛在特征,預測缺失值。
  2. 圖像處理
    圖像矩陣的低秩性可用于去噪(將噪聲視為高秩擾動)或修復缺失像素。
  3. 深度學習微調
    LoRA(Low-Rank Adaptation)通過低秩矩陣調整大模型參數,減少計算量。

示例說明

若矩陣 A = [ 1 2 3 2 4 6 3 6 9 ] A = \begin{bmatrix}1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9\end{bmatrix} A= ?123?246?369? ?,其秩為1,因為所有行均為第一行的倍數。此時 A A A 可表示為 U V T UV^T UVT(如 U = [ 1 , 2 , 3 ] T U = [1,2,3]^T U=[1,2,3]T V = [ 1 , 2 , 3 ] V = [1,2,3] V=[1,2,3])。

為什么重要?

  • 計算效率:低秩分解降低存儲和計算復雜度(如從 O ( n 2 ) O(n^2) O(n2) O ( n ) O(n) O(n))。
  • 魯棒性:在噪聲或缺失數據下仍能恢復主要結構。

奇異值矩陣

奇異值矩陣(Singular Value Matrix)是奇異值分解(SVD)中的核心組成部分,通常記為 Σ \Sigma Σ(或 S S S),它是一個對角矩陣,其對角線元素為矩陣的奇異值,按從大到小排列,其余元素為零。以下是詳細解析:


1. 定義與數學形式

給定矩陣 A ∈ R m × n A \in \mathbb{R}^{m \times n} ARm×n,其奇異值分解為:
A = U Σ V T A = U \Sigma V^T A=UΣVT
其中:

  • U U U m × m m \times m m×m 的正交矩陣(左奇異向量)。
  • V V V n × n n \times n n×n 的正交矩陣(右奇異向量)。
  • Σ \Sigma Σ m × n m \times n m×n對角矩陣,稱為奇異值矩陣,其對角線元素 σ 1 ≥ σ 2 ≥ ? ≥ σ r > 0 \sigma_1 \geq \sigma_2 \geq \dots \geq \sigma_r > 0 σ1?σ2??σr?>0 r = rank ( A ) r = \text{rank}(A) r=rank(A))即為 A A A 的奇異值。

2. 奇異值的性質

  • 非負性:奇異值 σ i \sigma_i σi? 是非負實數,且唯一確定(即使 U U U V V V 不唯一)。
  • 與特征值的關系:奇異值是 A T A A^TA ATA A A T AA^T AAT 的特征值的平方根。
  • 矩陣秩:非零奇異值的個數等于矩陣 A A A 的秩。

3. 計算與示例

計算方法
  • SVD分解:通過數值計算工具(如MATLAB的 svd 或 Python的 numpy.linalg.svd)直接求解。
  • 特征值分解:先計算 A T A A^TA ATA 的特征值,再取平方根得到奇異值。
示例

若矩陣 A = [ 1 0 1 0 1 0 ] A = \begin{bmatrix}1 & 0 & 1 \\ 0 & 1 & 0\end{bmatrix} A=[10?01?10?],其奇異值分解后 Σ \Sigma Σ 可能為:
Σ = [ 1.732 0 0 0 1 0 ] \Sigma = \begin{bmatrix}1.732 & 0 & 0 \\ 0 & 1 & 0\end{bmatrix} Σ=[1.7320?01?00?]
其中奇異值為 1.732 1.732 1.732 1 1 1


4. 應用場景

  • 數據壓縮:保留前 k k k 個奇異值(低秩近似)可減少存儲和計算量(如PCA)。
  • 圖像去噪:較小的奇異值通常對應噪聲,截斷后可恢復清晰圖像。
  • 推薦系統:通過SVD分解用戶-物品矩陣,提取潛在特征。

5. 幾何意義

奇異值表示矩陣 A A A 在不同方向上的“縮放因子”。例如,在圖像處理中,奇異值越大,對應的特征方向對圖像的貢獻越大。


總結

奇異值矩陣 Σ \Sigma Σ 是SVD的核心,其對角線元素(奇異值)揭示了矩陣的秩、穩定性及主要特征方向。通過控制奇異值的數量,可實現數據降維、去噪等高效操作。

正交矩陣

正交矩陣(Orthogonal Matrix)是線性代數中一類重要的實方陣,其核心特性是轉置矩陣等于逆矩陣,即滿足 Q T Q = Q Q T = I Q^T Q = Q Q^T = I QTQ=QQT=I I I I 為單位矩陣)。以下是其關鍵內容:


1. 定義與性質

  • 定義:若 n × n n \times n n×n 實矩陣 Q Q Q 滿足 Q T = Q ? 1 Q^T = Q^{-1} QT=Q?1,則稱 Q Q Q 為正交矩陣。
  • 等價條件
    1. 行(或列)向量組是標準正交基(兩兩正交且長度為1)。
    2. 保持向量內積不變: ( Q x , Q y ) = ( x , y ) (Qx, Qy) = (x, y) (Qx,Qy)=(x,y),即保持幾何長度和夾角。
    3. 行列式 ∣ Q ∣ = ± 1 |Q| = \pm 1 Q=±1 + 1 +1 +1 表示旋轉, ? 1 -1 ?1 表示反射)。

2. 分類與例子

  • 第一類正交矩陣 ∣ Q ∣ = 1 |Q| = 1 Q=1,對應旋轉變換(如二維旋轉矩陣):
    Q = [ cos ? θ ? sin ? θ sin ? θ cos ? θ ] Q = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{bmatrix} Q=[cosθsinθ??sinθcosθ?]
  • 第二類正交矩陣 ∣ Q ∣ = ? 1 |Q| = -1 Q=?1,對應反射變換(如鏡像矩陣)。

3. 應用領域

  • 幾何變換:用于旋轉、反射等操作(如計算機圖形學中的坐標變換)。
  • 數據科學:主成分分析(PCA)中通過正交矩陣實現降維。
  • 信號處理:離散傅里葉變換(DFT)的基函數構成正交矩陣。
  • 量子計算:量子門操作對應酉矩陣(復數域的正交矩陣)。

4. 重要定理

  • 譜分解定理:實對稱矩陣可通過正交矩陣對角化,即 A = Q Λ Q T A = Q \Lambda Q^T A=QΛQT Λ \Lambda Λ 為對角矩陣)。
  • QR分解:任意矩陣可分解為正交矩陣與上三角矩陣的乘積。

Python示例驗證

import numpy as np
Q = np.array([[1/np.sqrt(2), 1/np.sqrt(2)], [-1/np.sqrt(2), 1/np.sqrt(2)]])
print("Q^T Q = \n", np.dot(Q.T, Q))  # 應輸出單位矩陣

正交矩陣因其計算高效(逆即轉置)和幾何保形性,成為數學與工程領域的基石工具。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/82553.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/82553.shtml
英文地址,請注明出處:http://en.pswp.cn/web/82553.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

對抗性提示:大型語言模型的安全性測試

隨著大語言模型(LLM)在虛擬助手、企業平臺等現實場景中的深度應用,其智能化與響應速度不斷提升。然而能力增長的同時,風險也在加劇。對抗性提示已成為AI安全領域的核心挑戰,它揭示了即使最先進的模型也可能被操縱生成有…

SSM 框架核心知識詳解(Spring + SpringMVC + MyBatis)

🌱 第一部分:Spring 核心原理與使用 1. 什么是 Spring Spring 是一個開源的 Java 企業級開發框架,旨在簡化 Java 企業應用程序開發。它核心思想是控制反轉(IoC)和面向切面編程(AOP)&#xff0…

基于 Alpine 定制單功能用途(kiosk)電腦

前言 故事回到 7 年前, 在網上沖浪的時候發現了一篇介紹使用 Ubuntu 打造 kiosk 單功能用途電腦的文章, 挺好玩的, 就翻譯了一下并比葫蘆畫瓢先后用了 CentOS 7, ArchLinux 進行了實現. 歷史文章: 翻譯 - 使用Ubutnu14.04和Chrome打造單功能用途電腦(大屏展示電腦) 使用CentOS…

【機器學習及深度學習】機器學習模型的誤差:偏差、方差及噪聲

機器學習模型的誤差分析 V1.0機器學習模型的衡量準則概念引入機器學習模型誤差分析誤差出現的原因及消除 V1.0 機器學習模型的衡量準則 衡量機器學習模型的好壞可以考慮以下幾個方面: 偏差(Bias): 在充分訓練的情況下&#xff0…

混沌映射(Chaotic Map)

一.定義 混沌映射是指一類具有混沌行為的離散時間非線性動力系統,通常由遞推公式定義。其數學形式為 ,其中 f 是非線性函數,θ 為參數。它們以簡單的數學規則生成復雜的、看似隨機的軌跡,是非線性動力學和混沌理論的重要研究對象…

多群組部署

相關概念 星形拓撲和并行多組 如下圖,星形組網拓撲和并行多組組網拓撲是區塊鏈應用中使用較廣泛的兩種組網方式。 星形拓撲:中心機構節點同時屬于多個群組,運行多家機構應用,其他每家機構屬于不同群組,運行各自應用…

基于vue3-elemenyui的動態列案例

本案例主要是實現數據模型的解析以及實現el-table的動態列加載。 1.數據結構 公司A\B\C\測試1,是列,功能-url,是行數據,其中功能x是行頭。 this.rawData [{companyName: "公司A",rpWebShows: [{ "功能1": &…

Kerberos面試內容整理-Kerberos 與 LDAP/Active Directory 的集成

Kerberos 通常不會單獨存在于企業環境中,而是與目錄服務相結合以提供完整的身份管理方案。其中,Active Directory (AD) 是 Kerberos 集成應用的典型代表。Active Directory 是微軟的目錄服務,實現了 LDAP(輕量級目錄訪問協議)目錄和 Kerberos 認證的融合。在 AD 域控制器上…

Oracle DG庫控制文件IO錯誤導致宕機的應急處理

Oracle DG庫控制文件IO錯誤導致宕機的應急處理 事故現場偷天換日棋差一招事故現場 一套Oracle 19c DG環境的備庫宕機。 根據告警時間檢查實例宕機時間點附近的alert日志有如下重要信息: 2025-05-25T23:34:10.705385+08:00 KCF: read, write or open error, block=0x3377ee …

《前端面試題:前端盒模型》

前端盒模型完全指南:從原理到面試實戰 🎁 端午快樂! 各位前端小伙伴,端午節快樂!🥮 在這個粽葉飄香的時節,愿你的代碼如龍舟般一往無前,bug 如咸蛋黃般被完美包裹!今天我…

BERT:讓AI真正“讀懂”語言的革命

BERT:讓AI真正“讀懂”語言的革命 ——圖解谷歌神作《BERT: Pre-training of Deep Bidirectional Transformers》 2018年,谷歌AI團隊扔出一篇核彈級論文,引爆了整個NLP領域。這個叫BERT的模型在11項任務中屠榜,甚至超越人類表現…

爬蟲入門:從基礎到實戰全攻略

🧠 一、爬蟲基礎概念 1.1 爬蟲定義 爬蟲(Web Crawler)是模擬瀏覽器行為,自動向服務器發送請求并獲取響應數據的一種程序。主要用于從網頁中提取結構化數據,供后續分析、展示或存儲使用。 1.2 爬蟲特點 數據碎片化&…

uni-app學習筆記二十一--pages.json中tabBar設置底部菜單項和圖標

如果應用是一個多 tab 應用,可以通過 tabBar 配置項指定一級導航欄,以及 tab 切換時顯示的對應頁。 在 pages.json 中提供 tabBar 配置,不僅僅是為了方便快速開發導航,更重要的是在App和小程序端提升性能。在這兩個平臺&#xff…

行業分析---小米汽車2025第一季度財報

1 背景 最近幾年是新能源汽車的淘汰賽,前短時間比亞迪再次開始了降價,導致一片上市車企的股價大跌,足見車圈現在的敏感度。因此筆者會一直跟蹤新勢力車企的財報狀況,對之前財報分析感興趣的讀者朋友可以參考以下博客:…

Python 解釋器安裝全攻略(適用于 Linux / Windows / macOS)

目錄 一、Windows安裝Python解釋器1.1 下載并安裝Python解釋1.2 測試安裝是否成功1.3 設置pip的國內鏡像------永久配置 二、macOS安裝Python解釋器三、Linux下安裝Python解釋器3.1 Rocky8.10/Rocky9.5安裝Python解釋器3.2 Ubuntu2204/Ubuntu2404安裝Python解釋器3.3 設置pip的…

考研系列—操作系統:沖刺筆記(1-3章)

目錄 第一章 計算機系統概述 1.基本概念 2.內核態和用戶態 3.中斷(外中斷)、異常(內中斷-與當前執行的) 4.系統調用 5.操作系統引導程序 2021年真題: 6.操作系統結構 大綱新增 (1)分層結構 (2)模塊化 (3)外核 7.虛擬機 第二章 進程管理 1.畫作業運行的順序和甘…

監控 100 臺服務器磁盤內存CPU利用率

監控 100 臺服務器磁盤,內存,CPU利用率腳本 以下是一個優化后的監控腳本,用于同時監控100臺服務器的磁盤、內存和CPU利用率,并支持并發執行以提高效率: #!/bin/bash # 服務器監控腳本 - 支持并發獲取100臺服務器系統指標 # 功能…

[5-02-04].第01節:Jmeter環境搭建:

JMeter筆記大綱 Jmeter依賴于JDK,所以必須確保當前計算機上已經安裝了JDK,并且配置了環境變量 一、JMeter概述: 1.1.JMeter是什么: JMeter是Appache組織使用java開發的一款測試工具 可以用于對服務器、網絡或對象模擬巨大的負載…

【獸醫處方專用軟件】佳易王獸醫電子處方軟件:高效智能的寵物診療管理方案

一、軟件概述與核心優勢 (一)試用版獲取方式 資源下載路徑:進入博主頭像主頁第一篇文章末尾,點擊卡片按鈕;或訪問左上角博客主頁,通過右側按鈕獲取詳細資料。 說明:下載文件為壓縮包&#xff…

MapReduce(期末速成版)

起初在B站看3分鐘的速成視頻,感覺很多細節沒聽懂。 具體例子解析(文件內容去重) 對于兩個輸入文件,即文件A 和文件B,請編寫MapReduce 程序,對兩個文件進行合并,并剔除 其中重復的內容,得到一個新的輸出文件…