深度學習 必然用到的 線性代數知識

把標量到張量、點積到范數全串起來,幫你從 0 → 1 搭建 AI 數學底座 🚀

1 標量:深度學習的最小單元

標量 就是一維空間里的“點”,只有大小沒有方向。例如溫度 52 °F、學習率 0.001。

  • 記號:普通小寫 x;域:x ∈ ?
  • 代碼:torch.tensor(3.0)
    在網絡中,標量常作為超參數單一輸出出現(如二分類概率)。它讓后續向量、矩陣的世界有了可度量的起點。

在這里插入圖片描述

📊 標量由只有一個元素的張量表示。下面的代碼將實例化兩個標量,并執行一些熟悉的算術運算,即加法、乘法、除法和指數。

2 向量:特征打包者

把多個標量排成一列就是 向量。大小 + 方向 = 能描述“狀態”。

  • 記號:粗體小寫 x,維度 nx ∈ ??
  • 用途:一條用戶畫像、一幀心電圖、一張詞嵌入
  • 代碼:torch.arange(4)tensor([0,1,2,3])
    向量讓模型一次性“看見”多特征,用長度(維度)衡量信息量 👍。

3 矩陣:表格數據的萬能容器

矩陣 是“批量向量”或“二維表”。

  • 記號:粗體大寫 A ∈ ?^{m×n}
  • 行表示樣本,列表示特征;深度學習 mini-batch 自然采用行批次
  • 核心操作:轉置 A.T、索引 A[i,j]、對稱性檢查 A==A.T
    矩陣讓 GPU 并行沖浪,線性層的權重本質就是矩陣乘法權值🎯。

📊 可以通過行索引(i)和列索引(j)來訪問矩陣中的標量元素,

4 張量:多維世界的坐標系

再在矩陣外加軸,就得到 張量

  • 3D 圖像:(C,H,W);視頻:(T,C,H,W)
  • 代碼:torch.arange(24).reshape(2,3,4)
    張量是 PyTorch 的一等公民,支持廣播切片視圖變換,讓高階數據和算子自然對齊。

在這里插入圖片描述

📊 張量是描述具有任意數量軸的n維數組的通用方法。例如,向量是一階張量,矩陣是二階張量。張量用特殊字體的大寫字母表示(例如,X、Y和Z)

5 按元素運算與 Hadamard 積:并行的力量

同形狀張量可逐元素加減乘除:

  • Hadamard 積 A ⊙ B = A * B → 特征級交互
  • 標量 + 張量:自動廣播,不改變形狀
    GPU 核心一次算 N 個元素,秒殺循環,真正體現“向量化編程”🔥。

在這里插入圖片描述

📊 兩個矩陣的按元素乘法稱為Hadamard積(Hadamard product)(數學符號⊙)

6 降維:從海量數據中找平均

sum / mean / cumsum 可沿指定軸“折疊”張量:

  • A.sum(axis=0) → 列匯總;keepdims=True 保維度
  • 用于 softmax 歸一化、特征池化、全局平均池化
    降維技術讓模型聚焦信息密度,減小參數量同時抑制過擬合。

7 點積:度量相似度的核心操作

兩向量 x·y = Σ xi yi

  • 加權和(權重非負且和為1)

  • 余弦相似度(單位向量時)

  • 代碼:torch.dot(x,y)(x*y).sum()
    點積是注意力機制、Word2Vec 的基石,對齊“相關性”就靠它。

    點積的本質是相似性,余弦相似度的本質是方向相似性,因為余弦是單位向量的點積,規范化消除了長度影響。

在這里插入圖片描述

📊 給定兩個向量x, y ,它們的點積是相同位置的按元素乘積的和

8 矩陣-向量積:線性變換的快速電梯

Axx ∈ ?? 變成 ??

  • 每行 a? 與 x 點積,得到新向量元素
  • PyTorch:torch.mv(A,x)
    這是全連接層 forward 的數學本質,也能表示旋轉、縮放等幾何變換。

9 矩陣-矩陣乘法:批量線性映射

AB 可看作 m 次矩陣-向量乘再拼接:

  • 形狀要求:A(n×k) · B(k×m) → C(n×m)
  • 代碼:torch.mm(A,B)
    矩陣乘是多頭注意力、卷積的幕后英雄,使并行度再上層樓。

在這里插入圖片描述

📊 矩陣‐矩陣乘法AB看作簡單地執行m次矩陣‐向量積,并將結果拼接在一起,形成一個n × m矩陣

10 范數:給向量量身定做的尺子

  • L2 范數 ∥x∥? = √Σ xi2 → 距離、正則化;torch.norm(x)
  • L1 范數 ∥x∥? = Σ|xi| → 稀疏性,抗離群

向量的范數是表示一個向量有多大

歐幾里得距離就是L2范數 代表真實距離 用于kmeans算法等 余弦相似度用于文本相似性 因為它代表方向

范數和 目標函數 密切相關:L2 正則抑制大權重,L1 促稀疏,在深度學習中我們經常試圖解決優化問題:最大化分配給觀測數據的概率; 最小化預測和真實觀測之間的距離。用向量表示物品(如單詞、產品或新聞文章),以便最小化相似項目之間的距離,最大化不同項目之間的距離。目標,或許是深度學習算法最重要的組成部分(除了數據),通常被表達為范數。

概念公式/操作實戰意義
標量c = 5/9(f-32)超參數/單輸出
向量x ∈ ??用戶畫像
矩陣A ∈ ?^{m×n}批次數據
張量(N,C,H,W,…)圖像/視頻
Hadamard 積A⊙B特征交互
降維sum/mean池化歸一
點積x·y相似度
范數∥x∥?/?/?正則化

📊 上表濃縮 8 大核心要素,橫向對照“公式 → 作用 → 應用”,幫你一眼鎖定線性代數在深度學習中的落地場景。讀表時先關注左列概念,再往右看公式和實戰意義

                 | ∥x∥?/?/?        | 正則化     |

📊 上表濃縮 8 大核心要素,橫向對照“公式 → 作用 → 應用”,幫你一眼鎖定線性代數在深度學習中的落地場景。讀表時先關注左列概念,再往右看公式和實戰意義

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/90386.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/90386.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/90386.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

OpenGL ES 紋理以及紋理的映射

文章目錄開啟紋理創建紋理綁定紋理生成紋理紋理坐標圖像配置線性插值重復效果限制拉伸完整代碼在 Android OpenGL ES 中使用紋理(Texture)可以顯著提升圖形渲染的質量和效率。以下是使用紋理的主要好處: 增強視覺真實感 紋理可以將復雜的圖像…

從金字塔到個性化路徑:AI 正在重新定義學習方式

幾十年來,我們的教育系統始終遵循著一條熟悉的路線: 從小學、初中、高中,再到大學和研究生。這條標準化的路徑(K-12 到研究所)結構清晰,卻也緩慢。但在當今這個信息爆炸、知識快速更新、個性化需求高漲的時…

產品經理崗位職責拆解

以下是產品經理崗位職責的詳細分解表,涵蓋工作內容、核心動作及輸出成果:崗位職責具體工作內容輸出成果1. 日常版本迭代管理需求分析及PRD產出協調資源推動產品上線- 收集業務/用戶需求,分析可行性及優先級- 撰寫PRD文檔,明確功能…

后端微服務基礎架構Spring Cloud

版本關系 版本發布說明-阿里云Spring Cloud Alibaba官網 選擇 創建項目 創建父項目 什么都不動&#xff0c;創建即可 1) 刪掉沒用的文件 保留 2) pom中加入 打包方式 <packaging>pom</packaging> 3) 刪掉src 4) pom.xml中刪除沒用的 5)更改pom.xml中 spring…

數據分析框架和方法

一、核心分析框架 (The Big Picture Frameworks)??描述性分析 (What Happened?)????目的&#xff1a;?? 了解過去發生了什么&#xff0c;描述現狀&#xff0c;監控業務健康。??核心工作&#xff1a;?? 匯總、聚合、計算基礎指標 (KPI)&#xff0c;生成報表和儀表盤…

電路研究9.3.10——合宙Air780EP中的AT開發指南:阿里云應用指南

這個好像也用不到&#xff0c;不過可以先貼出來。簡單看了一下也沒深入分析&#xff0c;直接扒過來了&#xff0c;感覺涉及到了上位機的學習了。我這下位機的可能用不到&#xff0c;就是貼過來好了。 應用概述 使用 AT 方式連接阿里云分為一機一密和一型一密&#xff0c;其中一…

[Backlog] 核心協調器 | 終端用戶界面(TUI)實現 | 多分支任務沖突解決 | 測試驗證體系

第8章 核心協調器 歡迎回到Backlog.md&#xff01; 在上一章文件系統操作中&#xff0c;我們深入了解了數據物理存儲層面的讀寫機制。本章將聚焦系統的神經中樞——核心協調器。 核心協調器的本質&#xff08;中央決策引擎&#xff09; 如果將Backlog.md視為項目管理團隊&a…

車載以太網-TC8測試-UT(Upper Tester)

目錄 一、技術原理:指令體系與協議適配1. **指令格式與傳輸機制**2. **協議棧交互邏輯**3. **規范遵循與版本演進**二、測試應用:TC8測試場景與案例1. **TCP協議棧深度驗證**2. **ARP協議健壯性測試**3. **SOME/IP服務動態管理**三、實現挑戰與解決方案1. **實時性要求**2. *…

扣子Coze純前端部署多Agents

純前端網頁搭建&#xff0c;無需任何后端代碼&#xff0c;方便快捷&#xff01; 就像公司前臺的多功能控制臺&#xff0c;員工可以通過按鈕快速呼叫不同的AI助手。具備多設備適配、智能對話等基礎能力。 支持添加多個智能體 配置方式 添加智能體信息&#xff0c;data-bot為智…

STM32中I2C協議詳解

前言 在嵌入式系統中&#xff0c;設備間的短距離通信協議中&#xff0c;I2C&#xff08;Inter-Integrated Circuit&#xff0c;集成電路互連&#xff09;以其信號線少、布線簡單、支持多從機等特點&#xff0c;被廣泛應用于傳感器、EEPROM、OLED屏等中低速外設的通信場景。與SP…

解鎖Spring Boot多項目共享Redis:優雅Key命名結構指南

引言Redis 基礎與 Spring Boot 集成Redis 簡介Redis&#xff0c;即 Remote Dictionary Server&#xff0c;是一個開源的基于內存的數據結構存儲系統&#xff0c;可用作數據庫、緩存和消息中間件 。它具備諸多顯著特性&#xff0c;使其在現代軟件開發中占據重要地位。Redis 的讀…

《重構項目》基于Apollo架構設計的項目重構方案(多種地圖、多階段、多任務、狀態機管理)

1. 項目結構設計project/ ├── config/ # 配置文件&#xff08;定義 Scenario、Stage、Task 的映射&#xff09; ├── src/ │ ├── base/ # 抽象基類定義 │ │ ├── scenario_base.h/.cpp │ │ ├── stage_base.h/.cpp…

動手學深度學習13.6. 目標檢測數據集-筆記練習(PyTorch)

以下內容為結合李沐老師的課程和教材補充的學習筆記&#xff0c;以及對課后練習的一些思考&#xff0c;自留回顧&#xff0c;也供同學之人交流參考。 本節課程地址&#xff1a;數據集_嗶哩嗶哩_bilibili 本節教材地址&#xff1a;13.6. 目標檢測數據集 — 動手學深度學習 2.0…

Unity3D游戲內存優化指南

前言 Unity3D 游戲的內存控制是保證游戲流暢運行&#xff08;尤其在移動端和主機平臺&#xff09;和避免崩潰的關鍵挑戰。以下是核心策略和常見問題的解決方案&#xff1a; 對惹&#xff0c;這里有一個游戲開發交流小組&#xff0c;希望大家可以點擊進來一起交流一下開發經驗…

git學習:首次創建倉庫

文章目錄前言&#xff1a;1、首次創建倉庫并上傳數據1.1 創建倉庫&#xff0c;1.2 命令上傳1.3 首次代碼上傳至倉庫的步驟&#xff1a;2、分支操作2.1 分支的刪除2.2 切換分支2.3 查看分支2.4 同步其他分支的修改3、查看電腦的配置文件4、遠程倉庫命令 git remote5、其他后語前…

C++并行計算:OpenMP與MPI全解析

在高性能計算領域&#xff0c;充分利用硬件資源的并行計算技術已成為剛需。從單節點多核到跨節點集群&#xff0c;開發者需要掌握不同的并行編程模型。本文將系統講解兩種主流并行技術&#xff1a;OpenMP&#xff08;共享內存多核并行&#xff09;與MPI&#xff08;分布式內存集…

TCP 動態選路協議全面研究:OSPF、BGP 與 IS-IS 的比較與應用分析

一、引言&#xff1a;動態選路協議概述 在現代計算機網絡中&#xff0c;路由選擇是數據傳輸的核心功能&#xff0c;它決定了數據包從源到目的地的路徑選擇。隨著網絡規模的不斷擴大和復雜性的增加&#xff0c;靜態路由已經無法滿足網絡動態變化的需求&#xff0c;動態路由協議…

OpenCV 圖像哈希類cv::img_hash::AverageHash

操作系統&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 編程語言&#xff1a;C11 算法描述 cv::img_hash::AverageHash是OpenCV中用于圖像哈希&#xff08;Image Hashing&#xff09;的一個類&#xff0c;屬于opencv_img_hash模塊。它實現了…

【Python-網絡爬蟲】爬蟲的基礎概念介紹

目錄 一、爬蟲的介紹 1.1 爬蟲的概念 1.2 爬蟲的作用 1. 搜索引擎數據索引 2. 商業數據采集與分析 3. 輿情監控與社交分析 4. 學術研究與數據挖掘 5. 信息聚合與服務優化 二、爬蟲的分類 三、爬蟲的基本流程 3.1 基本流程 3.2 Robots協議 一、爬蟲的介紹 1.1 爬蟲的…

力扣-31.下一個排列

題目鏈接 31.下一個排列 class Solution {public void nextPermutation(int[] nums) {//1.從右往左找第一個非逆序的數aint left nums.length - 2; //這里是為了找不到順序對的時候正好停在-1while (left > 0 && nums[left] > nums[left 1]) { //一定要取等號…