《機器學習數學基礎》補充資料:過渡矩陣和坐標變換推導

盡管《機器學習數學基礎》這本書,耗費了比較長的時間和精力,怎奈學識有限,錯誤難免。因此,除了在專門的網頁( 勘誤和修訂 )中發布勘誤和修訂內容之外,對于重大錯誤,我還會以專題的形式發布,并做出更多的相關解釋。

更歡迎有識之士、廣大讀者朋友,指出其中的錯誤。非常感謝大家的幫助。

在《機器學習數學基礎》第29頁到第30頁,推導過渡矩陣和坐標變換的時候,原文有一些錯誤。下面將推導過程重新編寫如下,并且增加一些更詳細的說明。此說明沒有寫入原文,是為了協助理解這段推導而作。

針對性的修改,請參閱:勘誤與修訂


{ α 1 , ? , α n } \{\pmb{\alpha}_1, \cdots, \pmb{\alpha}_n\} {α1?,?,αn?} α i \pmb{\alpha}_i αi? 表示列向量) 是某個向量空間的一個基,則該空間中一個向量 O A → \overrightarrow{OA} OA 可以描述為:

O A → = x 1 α 1 + ? + x n α n (1.3.4) \overrightarrow{OA} = x_1\pmb{\alpha}_1 + \cdots + x_n\pmb{\alpha}_n\tag{1.3.4} OA =x1?α1?+?+xn?αn?(1.3.4)
其中的 ( x 1 , ? , x n ) (x_1, \cdots, x_n) (x1?,?,xn?) 即為向量 O A → \overrightarrow{OA} OA 在基 { α 1 , ? , α n } \{\pmb{\alpha}_1, \cdots, \pmb{\alpha}_n\} {α1?,?,αn?}坐標

如果有另外一個基 { β 1 , ? , β n } \{\pmb{\beta}_1, \cdots, \pmb{\beta}_n\} {β1?,?,βn?} β i \pmb{\beta}_i βi? 表示列向量),向量 O A → \overrightarrow{OA} OA 又描述為:

O A → = x 1 ′ β 1 + ? + x n ′ β n (1.3.5) \overrightarrow{OA} = x_1'\pmb{\beta}_1 + \cdots + x_n'\pmb{\beta}_n\tag{1.3.5} OA =x1?β1?+?+xn?βn?(1.3.5)
那么,同一個向量空間的這兩個基有沒有關系呢?有。不要忘記,基是一個向量組,例如基 { β 1 , ? , β n } \{\pmb{\beta}_1, \cdots, \pmb{\beta}_n\} {β1?,?,βn?} 中的每個向量也在此向量空間,所以可以用基 { α 1 , ? , α n } \{\pmb{\alpha}_1, \cdots, \pmb{\alpha}_n\} {α1?,?,αn?} 線性表出,即:

{ β 1 = b 11 α 1 + ? + b n 1 α n ? β n = b 1 n α 1 + ? + b n n α n \begin{cases}\begin{split}\pmb{\beta}_1 &= b_{11}\pmb{\alpha}_1 + \cdots + b_{n1}\pmb{\alpha}_n \\ \vdots \\\pmb{\beta}_n &= b_{1n}\pmb{\alpha}_1 + \cdots + b_{nn}\pmb{\alpha}_n \end{split}\end{cases} ? ? ??β1??βn??=b11?α1?+?+bn1?αn?=b1n?α1?+?+bnn?αn???
以矩陣(這里提前使用了矩陣的概念,是因為本書已經在前言中聲明,不假定讀者完全沒有學過高等數學。關于矩陣的更詳細內容,請參閱第2章)的方式,可以表示為:

[ β 1 ? β n ] = [ α 1 ? α n ] [ b 11 ? b 1 n ? b n 1 ? b n n ] (1.3.6) \begin{equation} \begin{split} \begin{bmatrix}\pmb{\beta}_1&\cdots&\pmb{\beta}_n\end{bmatrix} = \begin{bmatrix}\pmb{\alpha}_1&\cdots&\pmb{\alpha}_n\end{bmatrix}\begin{bmatrix}b_{11} & \cdots & b_{1n}\\\vdots\\b_{n1} & \cdots &b_{nn}\end{bmatrix} \end{split} \end{equation}\tag{1.3.6} [β1????βn??]=[α1????αn??] ?b11??bn1?????b1n?bnn?? ???(1.3.6)
其中:

P = [ b 11 ? b 1 n ? b n 1 ? b n n ] \pmb P = \begin{bmatrix}b_{11} & \cdots & b_{1n}\\\vdots\\b_{n1} & \cdots &b_{nn}\end{bmatrix} P= ?b11??bn1?????b1n?bnn?? ?
稱為基 { α 1 , ? , α n } \{\pmb{\alpha}_1, \cdots, \pmb{\alpha}_n\} {α1?,?,αn?} 向基 { β 1 , ? , β n } \{\pmb{\beta}_1, \cdots, \pmb{\beta}_n\} {β1?,?,βn?}過渡矩陣。顯然,過渡矩陣實現了一個基向另一個基的變換。

定義 在同一個向量空間,由基 { α 1 ? α n } \{\pmb{\alpha}_1\quad\cdots\quad\pmb{\alpha}_n\} {α1??αn?} 向基 { β 1 ? β n } \{\pmb{\beta}_1\quad\cdots\quad\pmb{\beta}_n\} {β1??βn?} 的過渡矩陣是 P \pmb{P} P ,則:
[ β 1 ? β n ] = [ α 1 ? α n ] P [\pmb{\beta}_1\quad\cdots\quad\pmb{\beta}_n] = [\pmb{\alpha}_1\quad\cdots\quad\pmb{\alpha}_n]\pmb P [β1??βn?]=[α1??αn?]P

根據(1.3.5)式,可得:

x 1 ′ β 1 + ? + x n ′ β n = x 1 ′ b 11 α 1 + ? + x 1 ′ b n 1 α n + ? + x n ′ b 1 n α 1 + ? + x n ′ b n n α n = ( x 1 ′ b 11 + ? + x n ′ b 1 n ) α 1 + ? + ( x 1 ′ b n 1 + ? + x n ′ b n n ) α n \begin{split}x_1'\pmb{\beta}_1 + \cdots + x_n'\pmb{\beta}_n &= x_1'b_{11}\pmb{\alpha}_1 + \cdots + x_1'b_{n1}\pmb{\alpha}_n \\ & \quad + \cdots \\ & \quad + x_n'b_{1n}\pmb{\alpha}_1 + \cdots + x_n'b_{nn}\pmb{\alpha}_n \\ &=(x_1'b_{11}+ \cdots + x_n'b_{1n})\pmb{\alpha}_1 \\ & \quad + \cdots \\ &\quad+(x_1'b_{n1} + \cdots + x_n'b_{nn})\pmb{\alpha}_n\end{split} x1?β1?+?+xn?βn??=x1?b11?α1?+?+x1?bn1?αn?+?+xn?b1n?α1?+?+xn?bnn?αn?=(x1?b11?+?+xn?b1n?)α1?+?+(x1?bn1?+?+xn?bnn?)αn??
(1.3.4)式 和(1.3.5)式描述的是同一個向量,所以:

{ x 1 = x 1 ′ b 11 + ? + x n ′ b 1 n ? x n = x 1 ′ b n 1 + ? + x n ′ b n n \begin{cases}\begin{split}x_1 &= x_1'b_{11} + \cdots + x_n'b_{1n}\\&\vdots\\x_n &= x_1'b_{n1} + \cdots + x_n'b_{nn}\end{split}\end{cases} ? ? ??x1?xn??=x1?b11?+?+xn?b1n??=x1?bn1?+?+xn?bnn???
如果寫成矩陣形式,即:

[ x 1 ? x n ] = [ b 11 ? b 1 n ? b n 1 ? b n n ] [ x 1 ′ ? x n ′ ] (1.3.7) \begin{bmatrix}x_1\\\vdots\\x_n\end{bmatrix} = \begin{bmatrix}b_{11} & \cdots & b_{1n}\\\vdots\\b_{n1} & \cdots &b_{nn}\end{bmatrix}\begin{bmatrix}x_1'\\\vdots\\x_n'\end{bmatrix}\tag{1.3.7} ?x1??xn?? ?= ?b11??bn1?????b1n?bnn?? ? ?x1??xn?? ?(1.3.7)
表示了在同一個向量空間中,向量在不同基下的坐標之間的變換關系,我們稱為坐標變換公式

定義 在某個向量空間中,由基 { α 1 ? α n } \{\pmb{\alpha}_1\quad\cdots\quad\pmb{\alpha}_n\} {α1??αn?} 向基 { β 1 ? β n } \{\pmb{\beta}_1\quad\cdots\quad\pmb{\beta}_n\} {β1??βn?} 的過渡矩陣是 P \pmb{P} P 。某向量在基 { α 1 ? α n } \{\pmb{\alpha}_1\quad\cdots\quad\pmb{\alpha}_n\} {α1??αn?} 的坐標是 x = [ x 1 ? x n ] \pmb{x}=\begin{bmatrix}x_1\\\vdots\\x_n\end{bmatrix} x= ?x1??xn?? ?,在基 { β 1 ? β n } \{\pmb{\beta}_1\quad\cdots\quad\pmb{\beta}_n\} {β1??βn?} 的坐標是 x ′ = [ x 1 ′ ? x n ′ ] \pmb x'=\begin{bmatrix}x_1'\\\vdots \\x_n'\end{bmatrix} x= ?x1??xn?? ?,這兩組坐標之間的關系是:
x = P x ′ \pmb x = \pmb P \pmb x' x=Px


《機器學習數學基礎》第29頁到第30頁的錯誤,是我講授《機器學習數學基礎》的課程時發現的。現在深刻體會到:教,然后知不足。教學相長,認真地研究教學,也是自我提升。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/71792.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/71792.shtml
英文地址,請注明出處:http://en.pswp.cn/web/71792.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

解鎖DeepSpeek-R1大模型微調:從訓練到部署,打造定制化AI會話系統

目錄 1. 前言 2.大模型微調概念簡述 2.1. 按學習范式分類 2.2. 按參數更新范圍分類 2.3. 大模型微調框架簡介 3. DeepSpeek R1大模型微調實戰 3.1.LLaMA-Factory基礎環境安裝 3.1大模型下載 3.2. 大模型訓練 3.3. 大模型部署 3.4. 微調大模型融合基于SpirngBootVue2…

第七課:Python反爬攻防戰:Headers/IP代理與驗證碼

在爬蟲開發過程中,反爬蟲機制成為了我們必須面對的挑戰。本文將深入探討Python爬蟲中常見的反爬機制,并詳細解析如何通過隨機User-Agent生成、代理IP池搭建以及驗證碼識別來應對這些反爬策略。文章將包含完整的示例代碼,幫助讀者更好地理解和…

Vue3——Fragment

文章目錄 一、Fragment的核心意義1. 解決Vue2的單根限制問題2. 減少不必要的 DOM 嵌套3. 語義化和結構化 二、Fragment 的實現原理三、Fragment 使用方式1. 基本用法2. 結合條件渲染3. 動態組件 四、實際應用場景1. 列表/表格組件2. 布局組件3. 語義化標簽 五、注意事項1. 屬性…

字節跳動C++客戶端開發實習生內推-抖音基礎技術

智能手機愛好者和使用者,追求良好的用戶體驗; 具有良好的編程習慣,代碼結構清晰,命名規范; 熟練掌握數據結構與算法、計算機網絡、操作系統、編譯原理等課程; 熟練掌握C/C/OC/Swift一種或多種語言&#xff…

【Linux學習筆記】Linux基本指令分析和權限的概念

【Linux學習筆記】Linux基本指令分析和權限的概念 🔥個人主頁:大白的編程日記 🔥專欄:Linux學習筆記 文章目錄 【Linux學習筆記】Linux基本指令分析和權限的概念前言一. 指令的分析1.1 alias 指令1.2 grep 指令1.3 zip/unzip 指…

數據庫索引的作用:提升數據檢索效率的關鍵

在數據庫管理系統中,數據如同浩瀚海洋中的寶藏,如何快速準確地找到所需信息,成為了一個關鍵問題。這時候,數據庫索引就如同一張精確的航海圖,指引著我們高效地定位數據。那么,數據庫索引究竟是什么&#xf…

Lab18_ SQL injection with filter bypass via XML encoding

文章目錄 前言:進入實驗室構造 payload 前言: 實驗室標題為: 通關 XML 編碼繞過過濾器的 SQL 注入 簡介: 此實驗室的庫存檢查功能中存在 SQL 注入漏洞。查詢結果在應用程序的響應中返回,因此您可以使用 UNION 攻擊…

計算機性能指標(計網筆記)

計算機性能指標:速率、帶寬、吞吐率、時延、時延帶寬積、往返時間RTT、利用率 速率 數據的傳輸速率,單位bit/s,或kbit/s,Mbit/s,Gbit/s 4*10**10bit/s40Gbit/s 常用帶寬單位: 千比每秒kb/s 兆比每秒Mb/s…

同為科技智能PDU在數據中心場景的應用與解決方案

數據中心當前處于一個快速發展和技術變革的特殊時期,全新的人工智能應用正在重塑整個世界,為社會帶來便捷的同時,也為數據中心的發展帶來了新的機遇和挑戰。智能算例的爆發式增長,對數據中心提出了大算力、高性能的新需求&#xf…

藍橋杯 C++ b組 積木畫深度解析

題目大意:有兩種積木塊,I型和L型,給定一段2*N的畫布,問擺滿總共有多少種方式? 解法:狀態壓縮dp(強烈建議拿個筆跟著畫一下狀態,慢慢就懂了) 首先我們規定一下此題解中提…

小程序事件系統 —— 32 事件系統 - 事件分類以及阻止事件冒泡

在微信小程序中,事件分為 冒泡事件 和 非冒泡事件 : 冒泡事件:當一個組件的事件被觸發后,該事件會向父節點傳遞;(如果父節點中也綁定了一個事件,父節點事件也會被觸發,也就是說子組…

【從0到1搞懂大模型】神經網絡的實現:數據策略、模型調優與評估體系(3)

一、數據集的劃分 (1)按一定比例劃分為訓練集和測試集 我們通常取8-2、7-3、6-4、5-5比例切分,直接將數據隨機劃分為訓練集和測試集,然后使用訓練集來生成模型,再用測試集來測試模型的正確率和誤差,以驗證…

Django與數據庫

我叫補三補四,很高興見到大家,歡迎一起學習交流和進步 今天來講一講alpha策略制定后的測試問題 mysql配置 Django模型體現了面向對象的編程技術,是一種面向對象的編程語言和不兼容類型能相互轉化的編程技術,這種技術也叫ORM&#…

從 GitHub 批量下載項目各版本的方法

一、腳本功能概述 這個 Python 腳本的主要功能是從 GitHub 上下載指定項目的各個發布版本的壓縮包(.zip 和 .tar.gz 格式)。用戶需要提供兩個參數:一個是包含項目信息的 CSV 文件,另一個是用于保存下載版本信息的 CSV 文件。腳本…

ECC升級到S/4 HANA的功能差異 物料、采購、庫存管理對比指南

ECC升級到S/4 HANA后,S4 將數據庫更換為HANA后性能有一定提升,對于自開發程序,可以同時將計算和部分業務邏輯下推到HANA數據庫層,減少應用層和數據庫層的交互次數和數據傳輸,只返回需要的結果到應用層和顯示層。提升自…

表格columns拼接兩個后端返回的字段(以umi框架為例)

在用組件對前端項目進行開發時,我們會遇到以下情況:項目原型中有取值范圍這個表字段,需要存放最小取值到最大取值。 而后端返回給我們的數據是返回了一個最小值和一個最大值, 在columns中我們需要對這兩個字段進行拼接&#xff0…

使用Galaxy創建生物信息學工作流的步驟詳解

李升偉 整理 Galaxy 是一個基于 Web 的生物信息學平臺,提供了直觀的用戶界面和豐富的工具,幫助用戶創建和管理生物信息學工作流。以下是使用 Galaxy 創建生物信息學工作流的主要步驟: 1. 訪問 Galaxy 平臺 打開 Galaxy 的官方網站&#xff…

藍橋杯—走迷宮(BFS算法)

題目描述 給定一個NM 的網格迷宮 G。G 的每個格子要么是道路,要么是障礙物(道路用 11表示,障礙物用 0 表示)。 已知迷宮的入口位置為 (x1?,y1?),出口位置為 (x2?,y2?)。問從入口走到出口,最少要走多少…

【GPT入門】第12課 FunctionCall 生成數據庫sql代碼

【GPT入門】第12課 FunctionCall 生成數據庫sql代碼 1.概述2. 代碼3.執行結果 1.概述 如下代碼的任務:自然語言問ai,自動生成sql并回答用戶 實現思路: 步驟1. ai會把用戶的問題,轉為sql 步驟2. 程序執行sql 步驟3.把執行的sql結果&#xff…

《白帽子講 Web 安全》之身份認證

目錄 引言 一、概述 二、密碼安全性 三、認證方式 (一)HTTP 認證 (二)表單登錄 (三)客戶端證書 (四)一次性密碼(OTP) (五)多因…