好的,我們來詳細講解高等數學(主要是線性代數部分)中的核心矩陣知識。矩陣是線性代數的基石,廣泛應用于數學、物理、工程、計算機科學、經濟學等眾多領域。
一、矩陣的基本概念
-
定義:
- 一個
m × n
矩陣 (Matrix) 是一個由m
行n
列元素排列成的矩形數表。 - 通常用大寫粗體字母表示,如 A, B, C。
- 矩陣中的元素稱為元或元素,用小寫字母加下標表示其位置,如
a??
表示位于矩陣 A 的第i
行、第j
列的元素。 - 矩陣可表示為:
A = [a??]_{m×n} = [a??, a??, ..., a??]
[a??, a??, ..., a??]
[... , ... , ..., ...]
[a??, a??, ..., a??]
- 一個
-
矩陣與行列式的區別:
- 矩陣是一個數表,本身不代表一個數值(除非是 1x1 矩陣)。
- 行列式 (Determinant) 是一個標量值(一個數),它是由方陣(行數=列數)按照特定規則計算出來的。行列式通常用
det(A)
或|A|
表示。 - 關鍵區別: 矩陣是數據結構,行列式是該結構(方陣)的一個屬性值。
-
特殊類型的矩陣:
- 零矩陣 (Zero Matrix): 所有元素都是零的矩陣,記作 O 或 0。
- 行矩陣/行向量 (Row Matrix/Vector): 只有一行 (
1 × n
)。 - 列矩陣/列向量 (Column Matrix/Vector): 只有一列 (
m × 1
)。 - 方陣 (Square Matrix): 行數和列數相等 (
n × n
)。 - 對角矩陣 (Diagonal Matrix): 方陣中,除主對角線 (
a??, a??, ..., a??
) 上的元素外,其他元素全為零。記作diag(d?, d?, ..., d?)
。 - 數量矩陣 (Scalar Matrix): 對角矩陣的一種特例,主對角線上的元素都相等 (
d? = d? = ... = d? = k
)。 - 單位矩陣 (Identity Matrix): 數量矩陣的一種特例,主對角線上的元素全為 1 (
k=1
),記作 I 或 E。任何矩陣 A 乘以單位矩陣 I 都等于其本身:A * I = I * A = A
。 - 上三角矩陣 (Upper Triangular Matrix): 方陣中,主對角線以下的元素全為零 (
i > j
時a?? = 0
)。 - 下三角矩陣 (Lower Triangular Matrix): 方陣中,主對角線以上的元素全為零 (
i < j
時a?? = 0
)。 - 對稱矩陣 (Symmetric Matrix): 方陣滿足
a?? = a??
(即A? = A
)。 - 反對稱矩陣 (Skew-Symmetric Matrix): 方陣滿足
a?? = -a??
(即A? = -A
),主對角線元素必須為零。 - 正交矩陣 (Orthogonal Matrix): 方陣滿足
A?A = AA? = I
。正交矩陣的行(列)向量構成標準正交基。
二、矩陣的運算
-
矩陣的加法:
- 條件: 兩個矩陣同型(即行數和列數分別相等)。
- 定義: 對應位置的元素相加。
- 運算律:
- 交換律:
A + B = B + A
- 結合律:
(A + B) + C = A + (B + C)
- 零元:
A + O = A
- 負元:
A + (-A) = O
(其中-A
是A
的負矩陣,每個元素取相反數)
- 交換律:
-
矩陣的數乘:
- 定義: 一個數
k
乘以一個矩陣 A,等于用k
乘以 A 中的每一個元素。 - 運算律:
k(A + B) = kA + kB
(k + l)A = kA + lA
k(lA) = (kl)A
1 * A = A
(-1) * A = -A
- 定義: 一個數
-
矩陣的乘法:
- 條件: 第一個矩陣 A 的列數必須等于第二個矩陣 B 的行數。若 A 是
m × p
矩陣,B 是p × n
矩陣,則它們的乘積 C = A × B (或 AB) 是一個m × n
矩陣。 - 定義: 乘積 C 的第
i
行第j
列的元素c??
等于 A 的第i
行元素與 B 的第j
列對應元素的乘積之和:
c?? = a??b?? + a??b?? + ... + a??b?? = Σ_{k=1}^p (a?? * b??)
- 重要性質:
- 不滿足交換律: 一般情況下,
AB ≠ BA
。即使AB
有意義,BA
可能無意義;即使兩者都有意義,結果通常也不同。 - 滿足結合律:
(AB)C = A(BC)
- 滿足分配律:
A(B + C) = AB + AC
和(B + C)A = BA + CA
- 單位矩陣是乘法單位元:
A * I = I * A = A
(其中 I 的階數需與乘法相容) - 零矩陣的性質:
A * O = O
,O * A = O
(零矩陣的階數需與乘法相容) - 與數乘結合律:
k(AB) = (kA)B = A(kB)
- 不滿足交換律: 一般情況下,
- 意義: 矩陣乘法表示線性變換的復合。如果矩陣 A 表示一個線性變換,矩陣 B 表示另一個線性變換,那么
AB
表示先進行 B 變換,再進行 A 變換。
- 條件: 第一個矩陣 A 的列數必須等于第二個矩陣 B 的行數。若 A 是
-
矩陣的轉置 (Transpose):
- 定義: 將矩陣 A 的行和列互換得到的新矩陣,稱為 A 的轉置矩陣,記作 A? 或 A’。即如果
A = [a??]_{m×n}
,則A? = [a??]_{n×m}
。 - 運算律:
(A?)? = A
(A + B)? = A? + B?
(kA)? = kA?
(AB)? = B?A?
(非常重要!順序反轉)
- 定義: 將矩陣 A 的行和列互換得到的新矩陣,稱為 A 的轉置矩陣,記作 A? 或 A’。即如果
-
方陣的行列式 (Determinant):
- 定義: 僅對方陣定義。行列式是一個標量值,通過矩陣元素按特定規則(遞歸定義或拉普拉斯展開)計算得出。記作
det(A)
或|A|
。 - 性質: (設 A, B 為 n 階方陣,k 為常數)
|A?| = |A|
|kA| = k?|A|
|AB| = |A||B|
(非常重要!)- 互換矩陣的兩行(列),行列式變號。
- 如果矩陣有兩行(列)相同或成比例,則行列式為 0。
- 將矩陣的某一行(列)乘以常數 k 加到另一行(列)上,行列式值不變。
- 上(下)三角矩陣的行列式等于主對角線上元素的乘積。
- 意義: 行列式具有深刻的幾何意義(表示線性變換對體積的縮放因子)和代數意義(判斷矩陣是否可逆、求解線性方程組等)。
- 定義: 僅對方陣定義。行列式是一個標量值,通過矩陣元素按特定規則(遞歸定義或拉普拉斯展開)計算得出。記作
-
方陣的跡 (Trace):
- 定義: 僅對方陣定義。跡是矩陣主對角線上所有元素的和。記作
tr(A)
。 - 性質:
tr(A + B) = tr(A) + tr(B)
tr(kA) = k * tr(A)
tr(AB) = tr(BA)
(即使AB ≠ BA
也成立)tr(A) = tr(A?)
- 意義: 在線性代數、微分方程、物理學(如量子力學)中有應用,表示某些不變量。
- 定義: 僅對方陣定義。跡是矩陣主對角線上所有元素的和。記作
-
方陣的逆 (Inverse):
- 定義: 對于 n 階方陣 A,如果存在另一個 n 階方陣 B,使得
AB = BA = I
(I 是 n 階單位矩陣),則稱 A 是可逆矩陣或非奇異矩陣,稱 B 是 A 的逆矩陣,記作 A?1。不是所有方陣都有逆矩陣,不可逆的方陣稱為奇異矩陣。 - 存在條件:
A
可逆的充分必要條件是|A| ≠ 0
。 - 求逆方法:
- 伴隨矩陣法:
A?1 = (1 / |A|) * adj(A)
(其中adj(A)
是 A 的伴隨矩陣,由 A 的代數余子式構成)。 - 初等行變換法(高斯-若爾當消元法): 將
[A | I]
通過初等行變換化為[I | B]
,則B = A?1
。這是最常用的方法。
- 伴隨矩陣法:
- 性質: (設 A, B 為可逆 n 階方陣,k 為非零常數)
(A?1)?1 = A
(kA)?1 = (1/k)A?1
(AB)?1 = B?1A?1
(非常重要!順序反轉)(A?)?1 = (A?1)?
|A?1| = 1 / |A|
- 意義: 逆矩陣對應于線性變換的逆變換。求解矩陣方程
AX = B
時,如果A
可逆,則X = A?1B
。
- 定義: 對于 n 階方陣 A,如果存在另一個 n 階方陣 B,使得
三、矩陣的初等變換與矩陣的秩
-
初等行(列)變換:
- 以下三種變換稱為矩陣的初等行變換:
- (倍法變換) 用一個非零常數
k
乘矩陣的某一行 (r? ← k * r?
)。 - (消法變換) 把矩陣某一行的
k
倍加到另一行上 (r? ← r? + k * r?
)。 - (換法變換) 互換矩陣中兩行的位置 (
r? ? r?
)。
- (倍法變換) 用一個非零常數
- 將上述“行”換成“列”,即得初等列變換。
- 初等矩陣: 由單位矩陣 I 經過一次初等變換得到的矩陣稱為初等矩陣。初等矩陣都是可逆的。
- 重要定理: 對矩陣 A 施行一次初等行變換,相當于在 A 的左邊乘以相應的初等矩陣;對矩陣 A 施行一次初等列變換,相當于在 A 的右邊乘以相應的初等矩陣。
- 以下三種變換稱為矩陣的初等行變換:
-
行階梯形矩陣 (Row Echelon Form):
- 一個矩陣稱為行階梯形矩陣,如果它滿足:
- 零行(元素全為零的行)位于非零行的下方。
- 非零行的第一個非零元(稱為該行的首非零元或主元)的列標,隨著行標的增大而嚴格增大(即每個主元都在前一行的主元的右邊)。
- 簡化行階梯形矩陣 (Reduced Row Echelon Form - RREF): 在行階梯形的基礎上,還滿足:
- 每個非零行的主元都是 1。
- 主元所在列的其它元素全為 0。
- 定理: 任何矩陣都可以通過有限次初等行變換化為行階梯形矩陣,并進一步化為簡化行階梯形矩陣。簡化行階梯形矩陣是唯一的。
- 一個矩陣稱為行階梯形矩陣,如果它滿足:
-
矩陣的秩 (Rank):
- 定義:
- 行秩: 矩陣的行向量組的最大線性無關組所含向量的個數。
- 列秩: 矩陣的列向量組的最大線性無關組所含向量的個數。
- 重要定理: 對于任意矩陣,其行秩等于其列秩。這個公共值稱為矩陣的秩,記作
rank(A)
或r(A)
。
- 性質:
0 ≤ rank(A_{m×n}) ≤ min{m, n}
rank(A) = rank(A?)
- 初等變換不改變矩陣的秩。
rank(AB) ≤ min{rank(A), rank(B)}
- 若 P, Q 可逆,則
rank(PAQ) = rank(A)
。
- 計算方法:
- 利用初等行變換將矩陣化為行階梯形矩陣。行階梯形矩陣中非零行的行數就是原矩陣的秩。
- 利用初等行變換將矩陣化為簡化行階梯形矩陣。非零行的行數也是秩。
- 意義: 秩是矩陣最重要的特征之一,它反映了矩陣行(列)向量之間的線性相關性,以及矩陣所表示的線性方程組的獨立方程個數、線性變換的像空間的維數(秩=像空間的維數)等。
- 定義:
四、線性方程組與矩陣
線性方程組可以非常方便地用矩陣表示和求解。
-
矩陣表示:
n
元線性方程組:
a??x? + a??x? + ... + a??x? = b?
a??x? + a??x? + ... + a??x? = b?
...
a??x? + a??x? + ... + a??x? = b?
- 可以寫成矩陣形式:
AX = B
- A 是
m × n
的系數矩陣:A = [a??]_{m×n}
- X 是
n × 1
的未知數列向量:X = [x?, x?, ..., x?]?
- B 是
m × 1
的常數項列向量:B = [b?, b?, ..., b?]?
- A 是
- 將系數矩陣 A 和常數項矩陣 B 合并寫成的矩陣
[A | B]
稱為方程組的增廣矩陣 (Augmented Matrix),記作ā
。
-
解的判定(克萊姆法則與一般情況):
- 克萊姆法則 (Cramer’s Rule): 只適用于方程個數等于未知數個數 (
m = n
) 且系數行列式|A| ≠ 0
的方程組。此時方程組有唯一解,解為:
x_j = |A?| / |A|
(j = 1, 2, …, n)
其中A?
是將系數矩陣 A 的第j
列替換成常數項向量 B 后得到的矩陣。 - 一般情況 (
m
和n
任意): 利用矩陣的秩判斷解的情況:- 有解的充分必要條件是:系數矩陣 A 的秩等于增廣矩陣
ā = [A | B]
的秩,即rank(A) = rank(ā)
。- 當
rank(A) = rank(ā) = n
(未知數個數) 時,方程組有唯一解。 - 當
rank(A) = rank(ā) = r < n
時,方程組有無窮多解,且有n - r
個自由變量。
- 當
- 如果
rank(A) < rank(ā)
,則方程組無解。
- 有解的充分必要條件是:系數矩陣 A 的秩等于增廣矩陣
- 克萊姆法則 (Cramer’s Rule): 只適用于方程個數等于未知數個數 (
-
求解方法:
- 高斯消元法 (Gaussian Elimination): 對增廣矩陣
ā
進行初等行變換,將其化為行階梯形矩陣。然后從最后一行開始,逐行回代求解。 - 高斯-若爾當消元法 (Gauss-Jordan Elimination): 對增廣矩陣
ā
進行初等行變換,將其化為簡化行階梯形矩陣。此時解可以直接從簡化后的矩陣中讀出(主元列對應的未知數用自由變量表示)。
- 高斯消元法 (Gaussian Elimination): 對增廣矩陣
五、特征值與特征向量
特征值和特征向量是方陣的重要屬性,在物理、化學、工程、數據科學(如主成分分析 PCA)等領域有廣泛應用。
-
定義:
- 設 A 是
n
階方陣。如果存在一個非零列向量 X 和一個數λ
,使得AX = λX
成立,則稱:λ
是矩陣 A 的一個特征值 (Eigenvalue)。- 非零向量 X 是矩陣 A 對應于特征值
λ
的特征向量 (Eigenvector)。
- 設 A 是
-
求解方法:
- 寫出特征方程: 將定義式
AX = λX
變形為(A - λI)X = 0
。這是一個齊次線性方程組。 - 特征多項式: 要使這個齊次方程組有非零解 X,其系數矩陣
(A - λI)
的行列式必須為零:|A - λI| = 0
。 - 求特征值:
|A - λI| = 0
是一個關于λ
的n
次多項式方程,稱為矩陣 A 的特征方程。該方程的根λ?, λ?, ..., λ?
(可能有重根和復根) 就是 A 的所有特征值。 - 求特征向量: 對每個特征值
λ?
,解齊次線性方程組(A - λ?I)X = 0
。該方程組的所有非零解向量,就是對應于特征值λ?
的特征向量。這些特征向量構成一個線性空間(稱為對應于λ?
的特征子空間),其維數(基礎解系所含向量個數)稱為特征值λ?
的幾何重數。特征值作為特征方程根的重數稱為其代數重數。
- 寫出特征方程: 將定義式
-
重要性質:
tr(A) = λ? + λ? + ... + λ?
(所有特征值之和等于跡)。|A| = λ? * λ? * ... * λ?
(所有特征值之積等于行列式)。- 不同特征值對應的特征向量線性無關。
- 若 A 是實對稱矩陣 (
A? = A
),則:- 所有特征值都是實數。
- 不同特征值對應的特征向量相互正交。
- 存在正交矩陣 Q (即
Q?Q = I
),使得Q?AQ = Λ
,其中Λ
是由 A 的特征值組成的對角矩陣(譜定理)。這意味著實對稱矩陣總可以正交對角化。
六、矩陣對角化
-
定義:
- 對于一個
n
階方陣 A,如果存在一個可逆矩陣 P,使得P?1AP = Λ
是一個對角矩陣Λ = diag(λ?, λ?, ..., λ?)
,則稱矩陣 A 可對角化 (Diagonalizable),稱 P 為對角化矩陣。
- 對于一個
-
可對角化的條件:
n
階方陣 A 可對角化的充分必要條件是 A 有n
個線性無關的特征向量。- 等價條件:
- A 的所有特征值的代數重數都等于其幾何重數。
- (實對稱矩陣總是可以對角化,且可以用正交矩陣對角化)。
-
對角化的步驟:
- 求出 A 的所有特征值
λ?, λ?, ..., λ?
(包括重根)。 - 對每個特征值
λ?
,求出其對應的線性無關的特征向量(即求解(A - λ?I)X = 0
的基礎解系)。 - 如果總共能找到
n
個線性無關的特征向量X?, X?, ..., X?
,則 A 可對角化。 - 以這
n
個線性無關的特征向量作為列向量,構造可逆矩陣 P = [X?, X?, …, X?]。 - 構造對角矩陣 Λ,其主對角線上的元素依次是 P 中特征向量對應的特征值
λ?, λ?, ..., λ?
(順序必須與 P 中特征向量的順序一致)。 - 則有
P?1AP = Λ
或A = PΛP?1
。
- 求出 A 的所有特征值
-
意義:
- 對角化極大地簡化了矩陣的運算,特別是矩陣的高次冪運算:
A? = PΛ?P?1
,而Λ?
只需將對角線上的元素取k
次方即可。 - 揭示了矩陣的內在結構(特征值和特征向量)。
- 是研究線性變換、動力系統、微分方程、馬爾可夫鏈等的重要工具。
- 對角化極大地簡化了矩陣的運算,特別是矩陣的高次冪運算:
七、二次型與對稱矩陣
-
二次型 (Quadratic Form):
- 定義:
n
個變量x?, x?, ..., x?
的二次齊次多項式函數稱為二次型:
f(x?, x?, ..., x?) = a??x?2 + a??x?2 + ... + a??x?2 + 2a??x?x? + 2a??x?x? + ... + 2a??????x???x?
= Σ_{i=1}^n a??x?2 + 2 Σ_{1≤i<j≤n}^n a??x?x?
- 矩陣表示: 任何二次型都可以唯一地表示為一個對稱矩陣 A 和向量 X = [x?, x?, …, x?]? 的乘積形式:
f(X) = X?AX
其中 A 是一個n
階實對稱矩陣,稱為該二次型的矩陣。a??
是 A 的元素,且a?? = a??
。
- 定義:
-
合同變換:
- 定義: 對于兩個
n
階方陣 A 和 B,如果存在一個n
階可逆矩陣 C,使得B = C?AC
成立,則稱 A 與 B 合同 (Congruent)。 - 性質: 合同關系是等價關系(自反、對稱、傳遞)。合同矩陣具有相同的秩(稱為二次型的秩)和相同的正負慣性指數(見下)。
- 定義: 對于兩個
-
化二次型為標準形:
- 標準形: 只包含平方項、不含交叉項的二次型:
f = d?y?2 + d?y?2 + ... + d?y?2
- 目標: 尋找一個可逆的線性變換
X = CY
(其中 C 可逆),將原二次型f = X?AX
化為標準形g = Y?DY = d?y?2 + d?y?2 + ... + d?y?2
,其中D = C?AC = diag(d?, d?, ..., d?)
。 - 方法:
- 配方法: 對變量逐個配方。
- 正交變換法: 利用實對稱矩陣可正交對角化的性質。
- 求出二次型矩陣 A 的特征值
λ?, λ?, ..., λ?
和對應的正交單位特征向量(即求得正交矩陣 Q 使得Q?AQ = Λ = diag(λ?, λ?, ..., λ?)
)。 - 作正交變換
X = QY
(正交變換保持向量的長度和角度不變,是一種特殊的合同變換)。 - 則
f = X?AX = (QY)?A(QY) = Y?(Q?AQ)Y = Y?ΛY = λ?y?2 + λ?y?2 + ... + λ?y?2
。
- 求出二次型矩陣 A 的特征值
- 初等變換法: 同時對矩陣 A 進行相同的初等行變換和初等列變換(相當于在兩邊乘以初等矩陣及其轉置),將其化為對角矩陣。
- 標準形: 只包含平方項、不含交叉項的二次型:
-
慣性定理與規范形:
- 慣性定理: 對于一個實二次型
f = X?AX
(A
實對稱),不論用何種可逆線性變換將其化為標準形,其中:- 正平方項的個數
p
總是相同的。 - 負平方項的個數
q
總是相同的。 p + q = rank(A)
(二次型的秩)。- 零項的個數
r - (p + q)
也相同。
- 正平方項的個數
- 稱
p
為正慣性指數,q
為負慣性指數,p - q
稱為符號差。 - 規范形: 二次型可以進一步化為只由
+1
,-1
,0
構成的規范標準形:
f = y?2 + y?2 + ... + y?2 - y???2 - ... - y??q2
其中p
和q
由慣性定理唯一確定。
- 慣性定理: 對于一個實二次型
-
正定二次型與正定矩陣:
- 定義: 對于實二次型
f(X) = X?AX
(其中 A 是實對稱矩陣):- 如果對任意非零實向量
X ≠ 0
,都有f(X) > 0
,則稱f
為正定二次型,稱 A 為正定矩陣。 - 如果對任意
X
,都有f(X) ≥ 0
,則稱f
為半正定二次型,稱 A 為半正定矩陣。
- 如果對任意非零實向量
- 判別條件 (A 是實對稱矩陣):
- A 正定 的充分必要條件:
A
的所有特征值λ? > 0
。A
的所有順序主子式都大于零。A
的正慣性指數p = n
。- 存在可逆矩陣 C,使得
A = C?C
。
- A 半正定 的充分必要條件:
A
的所有特征值λ? ≥ 0
。A
的所有主子式都大于等于零(注意:不僅僅是順序主子式)。A
的正慣性指數p = rank(A)
(負慣性指數q = 0
)。- 存在矩陣 C (不一定可逆),使得
A = C?C
。
- A 正定 的充分必要條件:
- 意義: 正定矩陣在優化(如判斷極值點)、最小二乘法、概率統計(協方差矩陣)、微分方程穩定性分析中非常重要。
- 定義: 對于實二次型
總結
矩陣理論是高等數學(線性代數)的核心內容,提供了強大的工具來處理線性關系、變換和系統。掌握矩陣的基本運算(加法、數乘、乘法、轉置、求逆)、秩、特征值與特征向量、對角化以及二次型理論,是理解和應用線性代數解決實際問題的關鍵基礎。這些知識在科學、工程、經濟、計算機等幾乎所有定量學科中都有廣泛而深刻的應用。
這份講解涵蓋了高等數學(主要是工科或非數學專業)要求的核心矩陣知識。數學專業會深入到更抽象的線性空間、線性變換、若爾當標準形、矩陣分解等更高級的內容。希望這份詳細的講解能幫助你系統地掌握矩陣知識!如果你對某個具體部分有更深入的問題,可以隨時提出。