高等數學基礎(行列式和矩陣的秩)

行列式主要用于判斷矩陣是否可逆及計算特征方程

初見行列式

行列式起源于線性方程組求解
$\begin{cases} a_{11}x_1 + a_{12}x_2 = b_1 \\ a_{21}x_1 + a_{22}x_2 = b_2 \end{cases}$
通過消元法得到, $\begin{cases} (a_{11}a_{22} - a_{12}a_{21})x_1 = b_1a_{22} - b_2a_{12} \\ (a_{11}a_{22} - a_{12}a_{21})x_2 = b_2a_{11} - b_1a_{21} \end{cases}$
當 $a_{11}a_{22} - a_{12}a_{21} \ne 0$ 時, 方程有唯一解
$x_1 = \frac{b_1a_{22} - b_2a_{12}}{a_{11}a_{22} - a_{12}a_{21}}, x_2 = \frac{b_2a_{11} - b_1a_{21}}{a_{11}a_{22} - a_{12}a_{21}}$

在方程組解的表達式中, 分母是方程組的4個系數確定, 提取4個系數并按他們在方程組中的位置, 排列為二行二列的數表(橫排稱為行, 豎排稱為列)
$\begin{matrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{matrix}$ , 其中 $a_{11}a_{22}-a_{12}a_{21}$ 表示為 $\left[\begin{matrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{matrix}\right]$ , 稱為二階行列式
利用二階行列式, 方程組的解可以表示為 $x_1 = \frac{D_1}{D}$ , $x_2=\frac{D_2}{D}$ , 其中 $\left[\begin{matrix}a_{11} & a_{12} \\ a_{21} & a_{22}\end{matrix}\right]$ 稱為系數行列式 $D_1 = \left[\begin{matrix}b_1 & a_{12} \\ b_2 & a_{22} \end{matrix}\right]$ , $D_2 = \left[\begin{matrix}a_{11} & b_1 \\ a_{21} & b_2 \end{matrix}\right]$

行列式定義

從二階行列式推導到 $n$ 階行列式的定義
$\left[\begin{matrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{matrix}\right] = \sum_{j_1j_2...j_n}(-1)^la_{1j_1}a_{2j_2}\cdots a_{nj_n}$
其中 $a_{ij}$ , $i=1,2\cdots, n$ , $j=1,2,\cdots, n$ , 稱為行列式的元素, 其中 $i$ 稱為行標, 表示該元素位于哪一行, $j$ 稱為列下表, 表示該元素位于哪一列
$j_1j_2\cdots j_n$ 代表 $\sum_{j_1j_2...j_n}$ 對 $j_1j_2\cdots j_n$ 取一遍 $1,2,\cdots n$ 的一切排列求和, 共有 $n!$ 項
如, 123的排列為 $123, 132, 213, 232, 312, 321$ 排列 $321$ 的逆序數為 $3$ , $3! = 6$ 項

常見行列式計算

一階行列式
$\left[\begin{matrix} a_1 \end{matrix}\right] = a_1$
二階行列式
$\left[\begin{matrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{matrix}\right] = a_{11}a_{22} - a_{12}a_{21}$
三階行列式
$\left[\begin{matrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{matrix}\right] = a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} + a_{13}a_{21}a_{32} - a_{13}a_{22}a_{31} - a_{12}a_{21}a_{33} - a_{11}a_{23}a_{32}$
計算公式
主對角線 - 副對角線
在這里插入圖片描述
求行列式的值
$\left[\begin{matrix} 1 & -2 & 3 \\ -1 & 2 & 1 \\ -3 & -4 & -2 \end{matrix}\right]$
根據定義解得:
$\times 2 \times (-2) + (-2) \times 1 \times (-3) + 3 \times (-4) \times (-1) - 3 \times 2 \times (-3) - (-2) \times (-1) \times (-2) - 1 \times (-4) \times 1 = 40$
方陣 $A$ 的行列式可以判斷 $A$ 是否可逆, 不為0可逆, 為0不可逆

行列式和矩陣的區別

行列式

行數等于列數
共有 $n^2$ 個元素
本質是一個數值(一種矩陣的計算方式)

矩陣

行數可以不等于列數
有 $\times n$ 和元素
本質是一個數表

行列式計算

Numpy中通過np.linalg.det()函數計算

import numpy as npA = np.array([[1, 2], [3, 4]])
print("A 的行列式為 np.linalg.det(A): ", np.linalg.det(A))
print("A 矩陣是否可逆: ", np.linalg.det(A) != 0)
B = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("B 的行列式為 np.linalg.det(B): ", np.linalg.det(B))
print("B 矩陣是否可逆: ", np.linalg.det(B) != 0)

矩陣的秩

矩陣的秩代表計算線性方程組解的數目, 去掉無關項(線性相關)然后其余的數量就是矩陣的秩, 矩陣的秩可以從行和列兩個方向觀察, 首先要了解線性相關和線性無關

向量組

$\alpha_1 = \left[\begin{matrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{matrix}\right], \alpha_2 = \left[\begin{matrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{matrix}\right], \alpha_n = \left[\begin{matrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{matrix}\right]$ , 每個 $\alpha_i$ 稱為 $m$ 維列向量

$\beta_1 = \left[\begin{matrix} a_{11} & a_{21} & \cdots & a_{m1} \end{matrix}\right], \beta_2 = \left[\begin{matrix} a_{12} & a_{22} & \cdots && a_{m2} \end{matrix}\right], \beta_n = \left[\begin{matrix} a_{1n} & a_{2n} & \cdots & a_{mn} \end{matrix}\right]$ , 每個 $a_i$ 稱為 $m$ 維行向量

import numpy as npA = np.array([[1, 2, 3], [4, 5, 6]])# reshape 重新繪制向量, 否則為1維數組
print("第0行: \n", A[0, :].reshape(1, -1))
print("第1列: \n", A[:, 1].reshape(-1, 1))"""output:
第0行: [[1 2 3]]
第1列: [[2][5]]"""

向量組的線性相關和線性無關

線性相關 vs 線性無關

本質問題：這些向量里有沒有「多余的」？

線性相關（有冗余）

例子：
向量A = [1,2]，向量B = [2,4]
→ B = 2×A，B完全可以用A復制粘貼得到
→ 像拼樂高時，你已經有紅磚了，又拿了個兩倍大的紅磚，沒帶來新形狀
數學定義：
存在不全為0的系數（比如k?=2, k?=-1），使得 k?A + k?B = 0
→ 向量之間能互相「組合」出來，存在冗余

線性無關（都必要）

例子：
向量X = [1,0]（橫向箭頭），向量Y = [0,1]（縱向箭頭）
→ 無法用X造出Y，也無法用Y造出X
→ 像樂高紅磚和藍磚，拼平面必須同時需要兩者
數學意義：
沒有任何一個向量能被其他向量組合出來
→ 每個向量都貢獻了獨特的「方向」

矩陣的秩（本質：獨立信息數）

本質問題：這個矩陣里有多少個真正「有用」的向量？

直觀理解

矩陣就像行李箱打包：
每一列是一個物品（向量），秩 = 真正有用的物品數量
- 如果塞了5件衣服但都是同樣的T恤 → 秩=1（其實帶一件就夠了）
- 如果帶了T恤、外套、褲子、襪子 → 秩=4（每樣都不同）

具體例子

秩=1的矩陣：
```
[1 2 3]  
[2 4 6]  
```
→ 所有列都是[1,2]的倍數，第三列=第一列×3
→ 像只帶了一個U盤但復制了3份文件，實際信息量=1
秩=2的矩陣：
```
[1 0 1]  
[0 1 1]  
```
→ 前兩列是X/Y方向箭頭，第三列=前兩列相加
→ 雖然3列，但最多能表示二維平面里的所有點

幾何意義

秩=能撐開的空間維度
- 秩1 → 所有向量擠在一條直線上
- 秩2 → 向量鋪滿一個平面
- 秩3（三維矩陣）→ 充滿立體空間

為什么重要？

解方程：
Ax=0的解的數量 = 未知數個數 - 秩
→ 秩越小，自由度越大（比如行李箱空位多）
數據壓縮：
圖片/視頻矩陣如果秩低，說明有大量重復 → 可壓縮
機器學習：
特征向量如果線性相關，說明有冗余特征需要剔除

矩陣秩的計算

題目1：

求矩陣 $\begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{bmatrix}$ 的秩。

步驟解析：

觀察原始矩陣：
每一行的數字都很像成比例的：
- 第2行 = 第1行 × 2
- 第3行 = 第1行 × 3
  → 明顯冗余（像行李箱里塞了3個同樣的T恤）。
用行變換化簡：
目標是把矩陣變成「階梯形」，只保留獨立信息。
- 第1步：保留第1行不變。
  $\begin{bmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \end{bmatrix}$
- 第2步：用第1行消去第2行和第3行的第一個元素：
  - 第2行 → 第2行 - 2×第1行：
    $[2, 4, 6] ? 2 \times [1, 2, 3] = [0, 0, 0]$
  - 第3行 → 第3行 - 3×第1行：
    $[3, 6, 9] ? 3 \times [1, 2, 3] = [0, 0, 0]$
    結果變為：
    $\begin{bmatrix} 1 & 2 & 3 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}$
統計非零行數：
只有第1行是非零行 → 秩 = 1。

比喻解釋：

矩陣像一個行李箱，里面裝了3件物品（3行），但全是同一款T恤（成比例）。
實際有用的物品只有1件 → 秩 = 1。

題目2：

求矩陣 $\begin{bmatrix} 1 & 0 & 2 \\ 0 & 1 & 3 \end{bmatrix}$ 的秩。

步驟解析：

觀察原始矩陣：
- 第1行和第2行沒有比例關系（像一件T恤和一條褲子）。
- 已經是階梯形（每行的首項數字在右側）。
直接統計非零行數：
有2行非零行 → 秩 = 2。

幾何意義：

兩個向量 $[1, 0]$ 和 $[0, 1]$ 是正交的，可以撐開一個二維平面。
第三列 $[2, 3]$ 被前兩列組合出來（ $2 \times [1, 0] + 3 \times [0, 1] = [2, 3]$ ），屬于冗余信息。

總結方法：

核心思想：
- 秩 = 矩陣中線性無關的行（或列）的最大數量。
- 用初等行變換將矩陣簡化為階梯形，數非零行數即可。
技巧：
- 看是否有某行/列是其他行/列的倍數或組合。
- 零行或零列對秩無貢獻（像行李箱里的空袋子）。
常見陷阱：
- 誤以為矩陣的秩等于行數或列數（需看獨立信息）。
- 行變換時計算錯誤（建議分步寫中間結果）。

代碼計算

import numpy as npE = np.eye(5)
print(E)
print("單位矩陣E的秩: \n",  np.linalg.matrix_rank(E))
A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])  # 根據列算 + 1
print("A的秩: \n", np.linalg.matrix_rank(A))"""output:
[[1. 0. 0. 0. 0.][0. 1. 0. 0. 0.][0. 0. 1. 0. 0.][0. 0. 0. 1. 0.][0. 0. 0. 0. 1.]]
單位矩陣E的秩: 5
A的秩: 2"""