標量/向量/矩陣/張量/范數詳解及其在機器學習中的應用

標量(Scalar)、向量(Vector)、矩陣(Matrix)、張量(Tensor)與范數(Norm)詳解及其在機器學習中的應用

1. 標量(Scalar)
  • 定義:標量是單個數字,僅具有大小(Magnitude),沒有方向。

    • 數學表示:如 a = 5 a = 5 a=5, b = ? 3.2 b = -3.2 b=?3.2
    • 特點:零維數據(0D Tensor)。
  • 機器學習中的應用

    • 模型參數:如線性回歸中的偏置項(Bias)。
    • 損失函數輸出:如均方誤差(MSE)的結果是一個標量。
    • 超參數:學習率(Learning Rate)、正則化系數(Regularization Coefficient)等。
2. 向量(Vector)
  • 定義:向量是一維數組,既有大小又有方向,表示空間中的點或變化量。

    • 數學表示:如 v = [ v 1 , v 2 , … , v n ] T \mathbf{v} = [v_1, v_2, \dots, v_n]^T v=[v1?,v2?,,vn?]T
    • 特點:一維數據(1D Tensor),可看作標量的有序集合。
  • 機器學習中的應用

    • 特征向量(Feature Vector):數據樣本的數值化表示(如圖像的像素值、文本的詞頻統計)。
    • 嵌入(Embedding):將離散數據(如單詞、類別)映射為低維向量(如Word2Vec、GloVe)。
    • 梯度(Gradient):優化算法中參數更新的方向(如隨機梯度下降SGD)。
    • 輸出結果:分類任務中概率分布的輸出(如Softmax后的向量)。
3. 矩陣(Matrix)
  • 定義:矩陣是二維數組,由行和列組成,可表示線性變換或數據關系。

    • 數學表示:如 A = [ a 11 a 12 a 21 a 22 ] \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} A=[a11?a21??a12?a22??]
    • 特點:二維數據(2D Tensor),矩陣運算(乘法、逆、特征分解)是核心工具。
  • 機器學習中的應用

    • 數據集表示:每行代表樣本,每列代表特征(如表格型數據)。
    • 權重矩陣(Weight Matrix):神經網絡中層與層之間的連接參數。
    • 核方法(Kernel Methods):支持向量機(SVM)中通過核矩陣計算高維相似性。
    • 矩陣分解:推薦系統(協同過濾)中將用戶-物品評分矩陣分解為低秩矩陣。
4. 張量(Tensor)
  • 定義:張量是向量和矩陣的高維推廣,表示多維數組。

    • 數學表示:三維張量 T ∈ R n × m × k \mathcal{T} \in \mathbb{R}^{n \times m \times k} TRn×m×k
    • 特點:N維數據(ND Tensor),如圖像(3D:高×寬×通道)、視頻(4D:幀×高×寬×通道)。
  • 機器學習中的應用

    • 圖像處理:RGB圖像表示為三維張量(如 224 × 224 × 3 224 \times 224 \times 3 224×224×3
    • 深度學習輸入/輸出:卷積神經網絡(CNN)中張量在層間流動(如特征圖Feature Maps)。
    • 自然語言處理(NLP):詞嵌入矩陣(如 句子長度 × 詞向量維度 \text{句子長度} \times \text{詞向量維度} 句子長度×詞向量維度
    • 高階關系建模:張量分解用于知識圖譜(如TransE模型)。
5. 范數(Norm)
  • 定義:范數是向量或矩陣的“長度”度量,用于量化大小、距離或復雜度。

    • 常見類型
      • L0范數:非零元素個數(常用于稀疏性約束)。
      • L1范數:絕對值之和( ∣ ∣ x ∣ ∣ 1 = ∑ ∣ x i ∣ ||\mathbf{x}||_1 = \sum |x_i| ∣∣x1?=xi?,稀疏性正則化。
      • L2范數:歐幾里得范數( ∣ ∣ x ∣ ∣ 2 = ∑ x i 2 ||\mathbf{x}||_2 = \sqrt{\sum x_i^2} ∣∣x2?=xi2? ?,防止過擬合。
      • L∞范數:最大絕對值( ∣ ∣ x ∣ ∣ ∞ = max ? ∣ x i ∣ ||\mathbf{x}||_\infty = \max |x_i| ∣∣x?=maxxi?
      • Frobenius范數:矩陣版本的L2范數( ∣ ∣ A ∣ ∣ F = ∑ a i j 2 ||\mathbf{A}||_F = \sqrt{\sum a_{ij}^2} ∣∣AF?=aij2? ?
  • 機器學習中的應用

    • 正則化(Regularization)
      • L1正則化(Lasso):使模型參數稀疏化,選擇重要特征。
      • L2正則化(Ridge):限制參數大小,防止過擬合。
    • 優化算法
      • 梯度裁剪(Gradient Clipping):用L2范數限制梯度爆炸。
      • 距離計算:K近鄰(KNN)中的歐氏距離(L2)或曼哈頓距離(L1)。
    • 模型評估
      • 均方誤差(MSE)等價于預測值與真實值差向量的L2范數平方。
    • 嵌入學習:對比學習(Contrastive Learning)中用余弦相似度(基于L2歸一化)。
總結:機器學習中的核心角色
概念核心作用典型應用
標量參數、超參數、損失值學習率、損失函數輸出
向量特征表示、梯度更新特征向量、嵌入向量
矩陣數據存儲、線性變換權重矩陣、協方差矩陣
張量高維數據建模圖像、視頻、特征圖
范數正則化、距離度量L1/L2正則化、KNN
擴展思考
  • 張量與深度學習框架:PyTorch/TensorFlow中所有數據均以張量形式處理,支持GPU加速。
  • 范數選擇的影響:L1稀疏性適合特征選擇,L2穩定性適合參數約束。
  • 高階應用:張量網絡(Tensor Networks)用于壓縮模型或建模復雜關系。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/80548.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/80548.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/80548.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【2025年】基于電腦的jdk1.8通過idea創建springboot2.x版本(非常簡潔快速)

【2025年】基于電腦的jdk1.8通過idea創建springboot2.x版本 提示:幫幫志會陸續更新非常多的IT技術知識,希望分享的內容對您有用。本章分享的是springboot的使用。前后每一小節的內容是存在的有:學習and理解的關聯性。【幫幫志系列文章】&…

SierraNet協議分析使用指導[RDMA]| 如何設置 NVMe QP 端口以進行正確解碼

在解碼RoCEv2數據包(包括TCP RDMA和RoCE RDMA)時,若捕獲的跟蹤數據無法正確解碼,通常需要執行特定的解碼步驟。對于RoCE RDMA跟蹤數據的處理,分析器主要采用兩種方式獲取必要信息以實現數據包解碼: 首先&am…

JavaScript基礎-局部作用域

在JavaScript中,理解不同種類的作用域是掌握這門語言的關鍵之一。作用域決定了變量和函數的可訪問性(即可見性和生命周期)。與全局作用域相對應的是局部作用域,它限制了變量和函數只能在其定義的特定范圍內被訪問。本文將深入探討…

李沐動手深度學習(pycharm中運行筆記)——09.softmax回歸+圖像分類數據集+從零實現+簡潔實現

09.softmax回歸圖像分類數據集從零實現簡潔實現(與課程對應) 目錄 一、softmax回歸 1、回歸 vs 分類 2、經典分類數據集: 3、從回歸到分類——均方損失 4、從回歸到多類分類——無校驗比例 5、從回歸到多類分類——校驗比例 6、softmax和…

C++八股——內存分配

文章目錄 1. 虛擬內存空間2. malloc和free3. new和delete4. 內存池 1. 虛擬內存空間 程序進程的虛擬內存空間是操作系統為每個進程提供的獨立、連續的邏輯地址空間,與物理內存解耦。其核心目的是隔離進程、簡化內存管理,并提供靈活的內存訪問控制。 &am…

【Linux基礎】網絡相關命令

目錄 netstat命令 1.1 命令介紹 1.2 命令格式 1.3 常用選項 1.4 常用命令實例 1.4.1 顯示所有TCP連接 1.4.2 查看路由表 1.4.3 實時監控網絡接口流量 1.4.4 查看監聽中的端口以及關聯進程 ping命令 2.1 命令介紹 2.2 命令格式 2.3 常用選項 2.4 常用示例 ifconfi…

adb 實用命令匯總

版權歸作者所有&#xff0c;如有轉發&#xff0c;請注明文章出處&#xff1a;https://cyrus-studio.github.io/blog/ 基礎adb命令 # 重啟adb adb kill-server# 查看已連接的設備 adb devices# 進入命令行 adb shell# 使用 -s 參數來指定設備 adb -s <設備序列號> shell…

C#管道通訊及傳輸信息丟失的原因

以下是C#管道通訊客戶端/服務端共用類 namespace PipeCommunication { /// <summary> /// 管道信息回調通知 /// </summary> /// <param name"msg"></param> public delegate void PipeMessageEventHandler(string msg…

MixTeX - 支持CPU推理的多模態LaTeX OCR

文章目錄 一、項目概覽相關資源核心特性技術特點 二、安裝三、使用說明環境要求 四、版本更新五、當前限制 一、項目概覽 MixTeX是一款創新的多模態LaTeX識別小程序&#xff0c;支持本地離線環境下的高效CPU推理。 無論是LaTeX公式、表格還是混合文本&#xff0c;MixTeX都能輕…

簡單 Linux 字符設備驅動程序

注&#xff1a;本文為 “Linux 字符設備驅動” 相關文章合輯。 英文引文&#xff0c;機翻未校。 中文引文&#xff0c;略作重排。 未整理去重&#xff0c;如有內容異常&#xff0c;請看原文。 Simple Linux character device driver 簡單 Linux 字符設備驅動程序 Oleg Kutko…

NX949NX952美光科技閃存NX961NX964

NX949NX952美光科技閃存NX961NX964 在半導體存儲領域&#xff0c;美光科技始終扮演著技術引領者的角色。其NX系列閃存產品線憑借卓越的性能與創新設計&#xff0c;成為數據中心、人工智能、高端消費電子等場景的核心組件。本文將圍繞NX949、NX952、NX961及NX964四款代表性產品…

協議路由與路由協議

協議路由”和“路由協議”聽起來相似&#xff0c;但其實是兩個完全不同的網絡概念。下面我來分別解釋&#xff1a; 一、協議路由&#xff08;Policy-Based Routing&#xff0c;PBR&#xff09; ? 定義&#xff1a; 協議路由是指 根據預設策略&#xff08;策略路由&#xff0…

Linux510 ssh服務 ssh連接

arning: Permanently added ‘11.1.1.100’ (ECDSA) to the list of known hosts. rooot11.1.1.100’s password: Permission denied, please try again. rooot11.1.1.100’s password: Permission denied, please try again 還沒生效 登不上了 失效了 sshcaozx26成功登錄 …

金融學知識筆記

金融學知識筆記 一、引言 金融學它結合了數學、概率論、統計學、經濟學和計算機科學等多學科的知識&#xff0c;用于解決金融領域中的各種問題&#xff0c;如金融衍生品定價、投資組合優化、風險管理和固定收益證券分析等。通過對金融學的學習&#xff0c;我們可以更好地理解…

AB測試面試題

AB測試面試題 常考AB測試問答題(1)AB測試的優缺點是什么?(2)AB測試的一般流程/介紹一下日常工作中你是如何做A/B實驗的?(3)第一類錯誤 vs 第二類錯誤 vs 你怎么理解AB測試中的第一、二類錯誤?(4)統計顯著=實際顯著?(5)AB測試效果統計上不顯著?(6)實驗組優于對…

USR-M100采集數據并提交MQTT服務器

本文為記錄備忘&#xff0c;不做過多解釋。 模塊自身帶有2路數字量輸入&#xff0c;2路模擬量輸入&#xff0c;2路485接口 數字量接報警輸入&#xff0c;模擬量接壓力傳感器&#xff0c;液位傳感器&#xff0c;485接口分別接流量計&#xff0c;溫濕度傳感器。 正確接線&…

Octave 繪圖快速入門指南

目錄 1. 基本的 2D 繪圖 2. 自定義圖形樣式 3. 繪制散點圖 4. 繪制柱狀圖 5. 繪制直方圖 6. 3D 繪圖 6.6.1 3D 曲面圖 6.6.2 3D 散點圖 7. 繪制極坐標 8. 多子圖繪制 總結 Octave 是一個類似于 MATLAB 的開源數學軟件&#xff0c;廣泛用于數值計算和數據分析。它提供…

RabbitMQ--基礎篇

RabbitMQ 簡介&#xff1a;RabbitMQ 是一種開源的消息隊列中間件&#xff0c;你可以把它想象成一個高效的“郵局”。它專門負責在不同應用程序之間傳遞消息&#xff0c;讓系統各部分能松耦合地協作 優勢&#xff1a; 異步處理&#xff1a;比如用戶注冊后&#xff0c;主程序將發…

【MySQL】事務(重點)

目錄 一、什么是事務&#xff1a; 二、事務的前置知識了解 引擎是否支持事務 事務的提交方式 事務操作的前置準備&#xff1a; 三、事務回滾&#xff1a; 四、事務崩潰&#xff1a; 原子性&#xff1a; 持久性&#xff1a; 五、自動提交和手動提交&#xff1a; 六、…

C++STL——stack,queue

stack與queue 前言容器適配器deque 前言 本篇主要講解stack與queue的底層&#xff0c;但并不會進行實現&#xff0c;stack的接口 queue的接口 &#xff0c;關于stack與queue的接口在這里不做講解&#xff0c;因為通過前面的對STL的學習&#xff0c;這些接口都是大同小異的。 …