機器學習與深度學習18-線性代數01

目錄

    • 前文回顧
    • 1.特征向量和特征值
    • 2.矩陣與模型
    • 3.內積和外積
    • 4.向量的范數
    • 5.正交矩陣

前文回顧

上一篇文章地址:鏈接

1.特征向量和特征值

在機器學習中,特征向量和特征值是用于描述數據集中的特征或變量之間關系的重要概念。它們在降維技術(如主成分分析)中起到關鍵作用,特征向量是一個非零向量,其方向在線性變換下保持不變,只發生縮放。它表示了數據變換后的新坐標系下的方向。特征值是與特征向量相關聯的數值,表示特征向量在對應的線性變換下的縮放因子。在降維中,我們可以使用特征向量和特征值來找到數據集中最顯著的特征,并將數據投影到這些特征上以減少維度。以下是計算特征向量和特征值的常用步驟為
假設我們有一個 m × n m \times n m×n的數據矩陣 X X X,其中每行代表一個樣本,每列代表一個特征。

  1. 計算數據矩陣 X X X的協方差矩陣 C C C
    C = 1 m ? 1 ( X ? X ˉ ) T ( X ? X ˉ ) C = \frac{1}{m - 1}(X - \bar{X})^T (X - \bar{X}) C=m?11?(X?Xˉ)T(X?Xˉ)
    其中 X ˉ \bar{X} Xˉ是每個特征的均值
  2. 對協方差矩陣 C C C進行特征值分解:
    C = V Λ V T C = V\Lambda V^T C=VΛVT
    其中 V V V是特征向量組成的矩陣, Λ \Lambda Λ是由特征值組成的對角矩陣
  3. 對特征值進行排序,從最大到最小,同時對應調整特征向量的順序
  4. 選擇前 k k k個最大的特征值及其對應的特征向量,這些特征向量構成了降維后的新坐標系
  5. 將數據 X X X投影到新的坐標系中,得到降維后的數據矩陣 Y = X V reduced Y = XV_{\text{reduced}} Y=XVreduced?
    其中 V reduced V_{\text{reduced}} Vreduced?是由前 k k k個特征向量組成的子矩陣

通過上述步驟,我們可以獲得降維后的數據矩陣 Y Y Y,其列數減少為 k k k。這樣可以減少冗余信息并保留數據的最重要方面,同時也能夠加速機器學習算法的訓練和提高模型的性能

2.矩陣與模型

在 linear regression 中,我們可以使用矩陣表示模型,其中特征矩陣(輸入)和目標向量(輸出)之間的線性關系可以用以下公式表示:

y = X w \mathbf{y} = \mathbf{Xw} y=Xw

其中, y \mathbf{y} y 是一個大小為 m × 1 m \times 1 m×1 的列向量,表示目標變量; X \mathbf{X} X 是一個大小為 m × ( n + 1 ) m \times (n + 1) m×(n+1) 的特征矩陣,每行代表一個樣本,包含 n n n 個特征以及一列全為 1 的常數列,用于表示截距項; w \mathbf{w} w 是一個大小為 ( n + 1 ) × 1 (n + 1) \times 1 (n+1)×1 的列向量,表示模型的參數(權重和截距),在 linear regression 中,我們的目標是找到最優的參數向量 w \mathbf{w} w,使得預測值 y ^ \hat{\mathbf{y}} y^? 與實際值 y \mathbf{y} y 之間的差異最小化。這通常通過最小化損失函數來實現。損失函數通常使用平方誤差(Sum of Squared Errors, SSE)來度量預測誤差的總和。它可以用以下公式表示:
L ( w ) = 1 2 m ( y ? X w ) T ( y ? X w ) L(\mathbf{w}) = \frac{1}{2m} (\mathbf{y} - \mathbf{Xw})^T (\mathbf{y} - \mathbf{Xw}) L(w)=2m1?(y?Xw)T(y?Xw)
其中, L ( w ) L(\mathbf{w}) L(w) 表示損失函數, 1 2 m \frac{1}{2m} 2m1? 是一個常數因子,用于簡化計算。

通過最小化損失函數,即求解以下優化問題:

min ? w L ( w ) \min_{\mathbf{w}} L(\mathbf{w}) wmin?L(w)

我們可以使用 linear algebra 中的方法來找到最優的參數解。通過對損失函數關于參數向量 w \mathbf{w} w 的梯度進行求解和令其為零,可以得到閉式解或者使用優化算法(如梯度下降)進行迭代求解,通過 linear algebra 的技術和求解方法,在 linear regression 中,我們可以更有效地擬合模型并找到最優的參數,以最小化預測誤差

3.內積和外積

  • 內積(點積):給定兩個向量 a \boldsymbol{a} a b \boldsymbol{b} b,它們的內積表示為 a ? b \boldsymbol{a} \cdot \boldsymbol{b} a?b。內積的計算方法是將兩個向量對應位置上的元素相乘,并將乘積相加得到一個標量。內積滿足交換律和分配律,并且可以通過向量的長度和夾角的余弦來計算:
    a ? b = ∣ a ∣ ∣ b ∣ cos ? ( θ ) \boldsymbol{a} \cdot \boldsymbol{b} = \vert\boldsymbol{a}\vert \vert\boldsymbol{b}\vert \cos(\theta) a?b=a∣∣bcos(θ)
    其中 ∣ a ∣ \vert\boldsymbol{a}\vert a ∣ b ∣ \vert\boldsymbol{b}\vert b分別代表向量 a \boldsymbol{a} a b \boldsymbol{b} b的長度, θ \theta θ是兩個向量之間的夾角

  • 外積(叉積):給定兩個三維向量 a \boldsymbol{a} a b \boldsymbol{b} b,它們的外積表示為 a × b \boldsymbol{a} \times \boldsymbol{b} a×b。外積的結果是一個新的向量,其方向垂直于原始向量所在的平面,并且大小等于該平面的面積與兩個向量長度的乘積。外積只適用于三維向量

在機器學習中,內積具有多種常見應用:

  • 相似度度量:內積可以用來計算向量之間的相似度或相關性。例如,在推薦系統中,可以使用內積來計算用戶之間的相似度,以便為用戶提供個性化的推薦
  • 特征之間的交互:在特征工程中,我們可以使用內積來表示兩個特征之間的交互作用。例如,在多項式回歸中,可以將高階特征表示為原始特征的內積
  • 核方法:在支持向量機(SVM)等機器學習算法中,內積扮演著關鍵角色。通過選擇合適的核函數,我們可以基于內積來進行非線性分類,將數據映射到更高維的特征空間中

總而言之,內積在機器學習中具有廣泛的應用,包括相似度度量、特征交互和核方法等。它是許多機器學習算法中重要的數學概念和操作

4.向量的范數

向量的范數是一種用于衡量向量大小或長度的函數。在機器學習中,我們通常使用L1范數和L2范數進行正則化來控制模型的復雜度。L1范數(也稱為曼哈頓范數或稀疏范數)定義為向量中各個元素的絕對值之和。對于一個n維向量 x = ( x 1 , x 2 , … , x n ) \boldsymbol{x} = (x_1, x_2, \ldots, x_n) x=(x1?,x2?,,xn?),它的L1范數表示為:

∥ x ∥ 1 = ∣ x 1 ∣ + ∣ x 2 ∣ + … + ∣ x n ∣ \|\boldsymbol{x}\|_1 = |x_1| + |x_2| + \ldots + |x_n| x1?=x1?+x2?++xn?

在正則化中,L1范數可以促使模型參數稀疏化,即將一些參數的值設為零。因此,通過在損失函數中加上L1范數的懲罰項,可以傾向于產生更稀疏的模型,有助于特征選擇和降低過擬合的風險。L2范數(也稱為歐幾里得范數或嶺回歸的懲罰項)定義為向量各個元素的平方和的平方根。對于一個n維向量 x = ( x 1 , x 2 , … , x n ) \boldsymbol{x} = (x_1, x_2, \ldots, x_n) x=(x1?,x2?,,xn?),它的L2范數表示為:

∥ x ∥ 2 = x 1 2 + x 2 2 + … + x n 2 \|\boldsymbol{x}\|_2 = \sqrt{x_1^2 + x_2^2 + \ldots + x_n^2} x2?=x12?+x22?++xn2? ?

在正則化中,L2范數可以控制模型的權重衰減,使得參數的值趨向于較小的值。通過在損失函數中加上L2范數的懲罰項,可以防止模型過擬合,并促使模型參數分布在更集中的區域,有助于提高模型的泛化能力。總結起來,L1范數在正則化中促使模型參數稀疏化,而L2范數則控制參數的大小并減少參數之間的相關性,從而幫助避免過擬合。根據問題的不同,選擇適當的范數進行正則化可以改善模型的性能和泛化能力

5.正交矩陣

正交矩陣是一個方陣,其列向量(或行向量)彼此正交(垂直),并且每個向量的長度為1。換句話說,正交矩陣的轉置矩陣等于其逆矩陣。給定一個 n × n n \times n n×n的矩陣 Q \boldsymbol{Q} Q,如果滿足以下條件,則稱其為正交矩陣(其中 I \boldsymbol{I} I是單位矩陣):
Q T Q = Q Q T = I \boldsymbol{Q}^T \boldsymbol{Q} = \boldsymbol{Q} \boldsymbol{Q}^T = \boldsymbol{I} QTQ=QQT=I
在旋轉和變換中,正交矩陣發揮重要作用。由于正交矩陣的特性,它們保持向量的長度不變,并保持向量之間的夾角不變。具體來說,正交矩陣可以在幾何上表示旋轉、鏡像和反射等線性變換。

應用:

  • 旋轉變換:正交矩陣可以通過乘以一個向量來實現旋轉操作。通過將向量乘以旋轉矩陣,我們可以將向量繞原點旋轉到新的位置,而不改變向量的長度- 坐標系變換:正交矩陣可以用于坐標系之間的變換。通過乘以一個正交矩陣,我們可以將一個坐標系中的向量映射到另一個坐標系中
  • 正交化:正交矩陣還可以用于將一組線性無關的向量正交化。通過對向量組成的矩陣進行正交分解,我們可以得到一個正交矩陣和一個對角矩陣,從而使得向量之間相互正交
  • 傅里葉變換:在信號處理中,正交矩陣(如傅里葉矩陣)用于將信號從時域轉換到頻域。傅里葉變換是一種正交變換,它將信號分解為一組正交基函數

總結來說,正交矩陣在旋轉和變換中具有重要的應用。它們保持向量的長度和夾角不變,可用于實現旋轉、鏡像、反射等幾何操作,并且在信號處理中起著關鍵作用

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/84911.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/84911.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/84911.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何讓 VS Code 僅通過滾輪放大字體,而不縮放整個界面?

在 VS Code 中,默認情況下使用 Ctrl滾輪(Windows/Linux)或 Cmd滾輪(Mac)會同時縮放整個界面(包括 UI 元素和編輯器字體)。如果你希望僅放大編輯器字體而不影響界面縮放,可以通過以下…

Vue3中v-bind指令用法詳解

在 Vue 3 中&#xff0c;v-bind 是一個核心指令&#xff0c;用于動態綁定 HTML 屬性或組件的 props 到 Vue 實例的數據。以下是詳細講解&#xff1a; 一、基礎用法 1. 綁定單個屬性 vue 復制 下載 <template><!-- 綁定 img 的 src 屬性 --><img v-bind:src…

算法題(169):最大子段和(分治思想)

審題&#xff1a; 本題需要我們找到區間的最大子段和并輸出結果 思路&#xff1a; 方法一&#xff1a;分治思想 我們可以把給定區間平均分成兩部分&#xff0c;然后獲取左段區間的最大子段和&#xff0c;右段區間的最大子段和&#xff0c;以及跨區間的最大子段和。最后比較出他…

Linux 線程深度解析:從內存管理到線程控制的核心機制

文章目錄 引言一、Linux 線程概念1.1 什么是線程1.2 分頁式存儲管理1.2.1 虛擬地址和頁表的由來1.2.2 物理內存管理struct page 的主要用途 1.2.3 頁表1.2.4 頁目錄結構1.2.5 兩級頁表的地址轉換1.2.6 缺頁異常 1.3 線程的優點1.4 線程缺點1.5 線程異常1.6 線程用途 二、Linux進…

玩轉計算機視覺——按照配置部署paddleOCR(英偉達環境與昇騰300IDUO環境)

英偉達環境安裝 創建虛擬環境 conda create -n paddleOCR python3.10 -y conda activate paddleOCRconda install jupyterlab -y conda install ipykernel -y python -m ipykernel install --user --name paddleOCR --display-name "paddle OCR"下載PaddleOCR的GPU…

Java機器學習全攻略:從基礎原理到實戰案例詳解

在當今AI驅動的技術浪潮中,機器學習已成為Java開發者必須掌握的核心技能之一。本文將系統性地介紹Java機器學習的原理基礎、常用框架,并通過多個實戰案例展示如何在實際項目中應用這些技術。無論你是剛接觸機器學習的Java開發者,還是希望鞏固基礎的中級工程師,這篇文章都將…

eBPF 技術詳解及其在網絡安全領域的應用與挑戰

摘要 eBPF&#xff08;extended Berkeley Packet Filter&#xff09;是 Linux 內核中的一項革命性技術&#xff0c;它允許用戶在不修改內核代碼或加載內核模塊的情況下&#xff0c;安全、高效地運行自定義程序。eBPF 的出現極大地擴展了 Linux 內核的可編程性&#xff0c;使其…

error:MISCONF Redis is configured to save RDB snapshots

一、背景 在使用redis異步驅動方式下&#xff0c;執行hset指令時&#xff0c;報錯 redisAsyncCommand((redisAsyncContext *)c, dumpReply, "hset role:10001", "hset role:10001 name %s age %d sex %s", "mark", 31, "male");二、原…

Android-Mod-Menu 使用教程

目錄 簡介前提條件安裝步驟1. 下載和解壓項目2. 配置 Android Studio3. 安裝到設備 修改游戲 APK1. 確定游戲主活動2. 集成模組菜單方法 1&#xff1a;通過服務啟動&#xff08;推薦&#xff09;方法 2&#xff1a;通過活動啟動&#xff08;僅在游戲檢測模組時使用&#xff09;…

SpringBoot 自動化部署實戰:從環境搭建到 CI/CD 全流程

SpringBoot 自動化部署全流程實戰 一、環境準備&#xff08;開發側&#xff09; 基礎工具鏈安裝&#xff1a; # JDK 17 brew install openjdk17 # Maven 構建工具 brew install maven # Docker 環境 brew install --cask docker項目配置驗證&#xff1a; <!-- pom.xml 關…

Flutter動畫與交互:打造流暢用戶體驗的完整指南

在移動應用開發中&#xff0c;流暢的動畫和自然的交互是提升用戶體驗的關鍵因素。Flutter作為Google推出的跨平臺UI工具包&#xff0c;提供了一套強大而靈活的動畫系統&#xff0c;使開發者能夠輕松創建專業級的動畫效果。本文將深入探討Flutter中的動畫與交互技術&#xff0c;…

山東大學軟件學院項目實訓:基于大模型的模擬面試系統項目總結(九)

在山東大學軟件學院的項目實訓中&#xff0c;團隊成員們圍繞基于大模型的模擬面試系統展開了一系列開發與優化工作。以下是本周項目的核心進展與成果總結。 前端界面優化與 Bug 修復&#xff08;吳尤&#xff09; Logo 顯示問題修復 在項目開發過程中&#xff0c;團隊發現項…

14.vue.js的watch()的注意事項(1)

一、 Q &#xff1a;因為 state 有內部的屬性 也就是id。 因為要追逐id。所以要寫函數&#xff1f;而不能直接監聽state。 只監聽state &#xff0c;監聽不到id的變化嗎&#xff1f; A&#xff1a; 為什么監聽 state 不等于監聽 state.id&#xff1f; 在 Vue 3 中&#xff0…

強化學習入門:價值、回報、策略概念詳解

前言 最近想開一個關于強化學習專欄&#xff0c;因為DeepSeek-R1很火&#xff0c;但本人對于LLM連門都沒入。因此&#xff0c;只是記錄一些類似的讀書筆記&#xff0c;內容不深&#xff0c;大多數只是一些概念的東西&#xff0c;數學公式也不會太多&#xff0c;還望讀者多多指教…

基于“數智立體化三維架構”框架的醫療數智化機制研究

1 研究背景與框架基礎 當前,全球醫療服務體系正經歷深刻的數智化轉型浪潮,人工智能、大數據、云計算等新一代信息技術與醫療健康領域的融合不斷深入,催生了醫療服務模式的革命性變化。在我國,數智化技術已成為提升基層衛生服務質量、促進醫療服務公平可及、增進百姓健康福…

OpenCV CUDA模塊圖像變形------對圖像進行旋轉操作函數rotate()

操作系統&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 編程語言&#xff1a;C11 算法描述 該函數用于對圖像進行 GPU 加速的旋轉操作&#xff0c;支持指定旋轉角度、縮放中心偏移和插值方法。是 OpenCV CUDA 模塊中用于圖像旋轉的核心函…

【面板數據】中國與世界各國新能源汽車進出口數據-分類別與不分類別(2017-2024年)

新能源汽車作為中國制造高質量發展的重要代表&#xff0c;其進出口數據不僅反映了我國技術實力與產業格局的變化&#xff0c;也是理解全球綠色交通趨勢、制定國家戰略決策的重要依據。目前國內主流定義判斷標準主要參考中國工信部于2009年發布的《新能源汽車生產企業及產品準入…

亞馬遜云服務器(AWS)會限制用戶使用嗎?深度解讀AWS資源政策

一、AWS的資源邏輯&#xff1a;為什么說"不限速"&#xff1f; AWS采用"按需分配"的資源配置模式&#xff0c;其核心限制并非來自人為設定&#xff0c;而是取決于&#xff1a; 實例類型配置&#xff08;如t2.micro默認CPU積分制&#xff09; 賬戶服務配額…

頂級視頻生成大模型分析:Seedance 1.0 Pro (字節跳動) - 新晉榜首

&#x1f4d6; 目錄 一、概述與市場格局 1.1 AI視頻生成技術現狀1.2 主要競爭者概覽1.3 評測標準與方法 二、頂級模型詳細分析 2.1 Seedance 1.0 Pro (字節跳動) - 新晉榜首2.2 OpenAI Sora - 行業先驅者2.3 Google Veo 3 - 音視頻一體化領航者2.4 快手可靈 2.0 - 國產之光…

【Spring源碼核心篇-08】spring中配置類底層原理和源碼實現

Spring源碼核心篇整體欄目 內容鏈接地址【一】Spring的bean的生命周期https://zhenghuisheng.blog.csdn.net/article/details/143441012【二】深入理解spring的依賴注入和屬性填充https://zhenghuisheng.blog.csdn.net/article/details/143854482【三】精通spring的aop的底層原…