代數——第5章——線性算子之應用(Michael Artin)

第 5 章? 線性算子之應用

(Applications of Linear Operators)

By relieving the brain from all unnecessary work,

a good notation sets it free to concentrate

on more advanced problems.( 通過減輕大腦所有不必要的工作，良好的符號可以讓大腦集中精力解決更高級的問題)

------------------------------------------------ Alfred North Whitehead

5.1? 正交矩陣和旋轉(Orthogonal matrices and rotations)

5.2? 使用連續性(Using continuity)

5.3? 微分方程組(Systems of differential equations)

5.4? 矩陣指數(The matrix exponential)(矩陣作為指數)

5.1? 正交矩陣和旋轉(Orthogonal matrices and rotations)

???????? 在本節中，標量域是實數域。

我們假設讀者已熟悉? $\mathbb{R}^{2}$ ?中向量的點積(譯注：又稱點乘，標量積，內積)， $\mathbb{R}^{n}$ ??中的列向量? $X=(x_{1},...,x_{n})^{t}$ ? 和? $Y=(y_{1},...,y_{n})^{t}$ ??的點積定義為

(5.1.1) ??????? $( X. Y ) = x_{1} y_{1} + ... + x_{n} y_{n}$ ? 。

出于方便，我們將點積記為一個行向量和一個列向量的矩陣積

(5.1.2)? ? ? ?? $( X. Y ) = X^{t} Y$ ? ?。

對于? ? $\mathbb{R}^{2}$ ??中的向量，我們有公式

(5.1.3)? ? ? ? $( X. Y ) = | X || Y |\cos(\theta)$ ? ,

其中，θ 是這兩個向量之間的夾解。此公式可通過余弦定律導出，即一個三角形的三邊 a，b , c 和邊? a 和 b 的夾解 θ ?之間存在關系

(5.1.4)??? ?? $c^{2} = a^{2} + b^{2} - 2ab\cos(\theta)$ ? ?。

為了推導出 (5.1.3) ，我們將余弦定委應用于頂點分別為 0，X，Y 的三角形。其邊長分別為 | X |，| Y |，| X - Y | ,? 因此，其余弦定律可以寫成

(5.1.5) ? ? ? $((X - Y ).( X - Y )) = ( X. X ) + ( Y. Y ) + 2| X || Y |\cos(\theta)$ ? ?。

上式左邊展開為? ( X. X ) -2(X. Y) + ( Y. Y ) ，并將其與右邊進行比較，從而得到公式(5.1.3)。此公式對? $\mathbb{R}^{n}$ ??中的向量同樣成立，但要求理解其角度的含義。但我們現在不討論這個問題(參見(8.5.2))。

對?? $\mathbb{R}^{2}$ ? 和? ? $\mathbb{R}^{3}$ ??中的向量而言最重要的意義在于：

?? 一個向量 X 的長度之平方? $X^{2}$ ??是 ? $(X , X ) = X^{t} X$ ??。和

? ?對于兩個向量 X 和 Y ，當且僅當? $X^{t} Y = 0$ ??時，此二向量是正交的(orthogonal)，記為 X ? Y?。

(譯注：向量的正交意味著二向量的方向之間沒有相似性，因此一個向量在另一個向量上的投影為零,即點積為0 。)

我們將上述兩條分別視為?? $\mathbb{R}^{n}$ ??中向量之間正交性和單向量長度(點積開根號)的定義。注意，向量的長度 | X | 是正值(除非其為0向量)，因為? $X^{2} = X^{t} X = x_{1}^{2} + ...+ x_{n}^{2}$ ??是平方之和(譯注：此解釋欠妥，度量長度當然是正值，不能用長度的平方去解釋其長度是正值，因為長度是內積開方之后的值，而內積是長度的平方 )。

定理 5.1.5 (Pythagoras定理)? 若 X ? Y ?且 Z = X + Y ?，則? $Z^{2} = X^{2} + Y^{2}$ ? 。

將?? $Z^{t}Z$ ??展開即可證明。若 X ? Y ?，則? $X^{t}Y = Y^{t}X = 0$ ???，因此

$Z^{t}Z = (X + Y)^{t}( X + Y ) = X^{t} X + X^{t} Y + Y^{t}X + Y^{t} Y = X^{t} X + Y^{t} Y$ ? 。

我們切換到小寫的向量記法。若?? $v_{1} ,..., v_{k}$ ? ?是?? $\mathbb{R}^{n}$ ??中的正交向量，若?? $w = v_{1} + ... + v_{k}$ ? ?，則根據Pythagoras 定理用歸納法可證明

(5.1.6)? ? ? ? $w^{2} = |v_{1} |^{2} + ... + |v_{n} |^{2}$ ? 。

引理 5.1.7? ??? $\mathbb{R}^{n}$ ??中的正交非零向量的任意集合 ? $( v_{1} ,... , v_{k} )$ ??都是獨立的(譯注：即線性無關的 )。證明：

令?? $w = c_{1} v_{1} + ... + c_{k} v_{k}$ ? ?為一個線性組合，其中，并非所有? $c_{i}$ ?都為零，并令? $w_{i}=c_{i}v_{i}$ ??。則 w 是正交向量(并非所有項都為0)之和? ? $w_{1} + ... + w_{k}$ ??。根據 Pythagoras 定理，有?? $|w|^{2} = |w_1 |^{2} + ... + |w_k |^{2} > 0$ ??, 因此 w ≠ 0 。

?? ?? $\mathbb{R}^{n}$ ??的一個正交基 ? $\mathbf{B} = (v_{1} ,..., v_{n})$ ??是正交單位向量(長度為1)的一個基。可用另一種方式表述此思想：若

(5.1.8)? ? ? ?? $(v_{i}. v_{j}) = \delta_{ij}$ ??

(其中，? $\delta_{ij}$ ??是Kronecker δ ，是恒等矩陣的第 i, j 項，當 i = j 時其值為1，而當 i ≠ j 時其為0)，則 B 是正交單位向量的一個基。

定義 5.1.9? 對于一個實 n × n 矩陣A , 若? $A^{t}A = I$ ??，則其是正交的，即矩陣 A 可逆且其逆是?。

引理 5.1.10? 對于一個實 n × n 矩陣，當且僅當其列構成? $\mathbb{R}^{n}$ ?的一個正交基時，此矩陣是正交的。

證明：

令? $A_{i}$ ??表示 A 的第 i 列。則? $A_{i}^{t}$ ??是?? $A^{t}$ ??的第 i 行。? $A^{t}A$ ??的第 i, j 項是? $A_{i}^{t}A_{j}$ ??,因此，當且僅當對于所有 i 和 j ,? 都有? $A_{i}^{t} A_{j} = \delta_{ij}$ ??時， $A^{t}A = I$ ? 。

不難驗證正交矩陣具有下列屬性：

命題 5.1.11?

(a)? 正交矩陣之積是正交的，一個正交矩陣之逆(其轉置，即行變為列)是正交的。正交矩陣構成了 ? $GL_{n}$ ??的一個子群? $O_{n}$ ??(譯注：取orthogonality這個單詞的首字母命名),稱為正交群。

(b)?? 一個正交矩陣的行列式是 ±1 。行列式為 1 的正交矩陣構成了一個二階正交群? ? $O_{n}$ ??的一個子群 ? $SO_{n}$ ??，稱為特殊正交群(special orthogonal group)。

定義 5.1.12? ?? $\mathbb{R}^{n}$ ??上的一個正交算子 T 是一個保留了點積的線性算子：對于每一個向量對 X ,Y ，有

????????????? ( TX ? TY ) = (X ? Y ) 。

命題 5.1.13? 對于?? $\mathbb{R}^{n}$ ??上的一個線性算子T ，當且僅當其保留向量長度或對于每一個向量X ,有 ( TX ? TX ) = (X ? X ) 時，其是正交算子。

證明：

??? 假設線性算子保留長度，令 X 和 Y 為? $\mathbb{R}^{n}$ ??中的任意向量。則

( T(X+Y ) ? T(X+Y ) ) = ((X+Y ) ?(X+Y ) ) 。

根據 ( TX ? TY ) = (X ? Y )，通過將上述等式兩邊展開并抵消相關項而證明命題。

命題 5.1.14?? 對于?? $\mathbb{R}^{n}$ ?上的一個線性算子T ，當且僅且其關于標準基的矩陣 A 是一個正交矩陣時，此算子是正交的。

證明：

???????? 若 A 是 T 的一個矩陣，則

$( TX {\cdot } TY ) = (AX)^{t} (AY ) = X^{t} (A^{t}A)Y$ ? ?。

當且僅當對于所有?X 和 Y? ，上式右邊等于? $X^{t}Y$ ???時，這個算子是正交的。我們可以將這個條件寫成?? $X^{t} (A^{t}A -I )Y = 0$ ??。下一個引理表明，當且僅當?? $A^{t}A -I=0$ ??時,這個條件是成立的，從而 A 是正交的。

引理 5.1.15? 令 M 為 n × n? 矩陣。若對于所有的列向量 X 和 Y ，都有? $X^{t}MY=0$ ??,??則 M = 0 (譯注，即零矩陣 [0] )。??

證明：

??? 對 M 的 i, j 項計算乘積? $e_{i}^{t}Me_{j}$ ??。例如

$\begin{bmatrix} 0&1 \end{bmatrix} \begin{bmatrix} m_{11}&m_{12}\\ m_{21}&m_{22} \end{bmatrix} \begin{bmatrix} 1\\0 \end{bmatrix}=m_{21}$ ? ? 。

(譯注：上述例子有誤，列向量? ? $\begin{bmatrix} 1\\0 \end{bmatrix}$ ? ?的轉置是 [1,0] ，因此上式應該是

$\begin{bmatrix} 1&0 \end{bmatrix} \begin{bmatrix} m_{11}&m_{12}\\ m_{21}&m_{22} \end{bmatrix} \begin{bmatrix} 1\\0 \end{bmatrix}=m_{11}$ ? ? 。

)

若對于所有 i, j 有?? $e_{i}^{t}Me_{j}=0$ ? ，則 M = 0 。

現在我們描述 2 × 2 正交矩陣。

?? 對于?? $\mathbb{R}^{n}$ ??上的一個線性算子T ，若其分別具有以 1 和 -1 為特征值的特征向量? $v_{1}$ ??和?? $v_{2}$ ??，則稱其為反射算子(reflection)。

因為其固定??? $v_{1}$ ??并改變正交向量?? $v_{2}$ ??的符號，這樣的一個算子關于由? $v_{1}$ ??張成的一維子空間的平面反射。關于?? $e_{1}$ ??軸反射的算子矩陣為

(5.1.16)?????? ?? $S_{0}=\begin{bmatrix} 1&0\\ 0&-1 \end{bmatrix}$ ? ?。

定理 5.1.17?

(a) 具有行列式1 的 2 × 2 正交矩陣是矩陣

(5.1.18)?? ? ? $R=\begin{bmatrix} c&-s\\ s&c \end{bmatrix}$ ? ?，

其中，c = cos(θ) 和 s = sin(θ) (對于某個角度 θ )。矩陣 R 表示平面? $\mathbb{R}^{2}$ ??關于原點并繞過角度 θ 的逆時鐘旋轉。

(b)? 具有行列式 -1 的 2 × 2 正交矩陣是矩陣

(5.1.19)?? ? ? $S=\begin{bmatrix} c&-s\\ s&-c \end{bmatrix}=RS_{0}$ ? ，

其中，c 和 s 如上。矩陣 S 關于?? $\mathbb{R}^{2}$ ??的與? $e_{1}$ ???軸呈角度 ? $\frac{1}{2}\theta$ ??的一維子空間反射平面。

證明：

??? 不妨設

???????????????????????? $A=\begin{bmatrix} c&*\\s&* \end{bmatrix}$

為一個正交矩陣。則其列是單位向量 (5.1.10),因此，點? ? $(c,s)^{t}$ ??位于單位圓內，且 c = cos(θ) 和 s = sin(θ) (對于某個角度 θ )。我們檢查積? $P = R^{t}A$ ??，其中，R?是矩陣 (5.1.18):

(5.1.20)?????? $P=R^{t}A=\begin{bmatrix} 1&*\\0&* \end{bmatrix}$ ? ?。

由于? $R^{t}$ ??和 A? 是正交的，因此 P 也是正交的。引理 5.1.10 告知我們，第二列是一個與第一列正交的單位向量。因此

(5.1.21)?????? $P=\begin{bmatrix} 1&0\\0&{\pm}1 \end{bmatrix}$ ? 。

回到問題，A? = RP ?，因此，若? det(A) = 1 ，則 A? = R ，而若? det(A) = -1 ，則? $A = S = RS_{0}$ ? 。

我們已經看到，R表示旋轉 (4.2.2) ，但我們仍然必須驗證由矩陣 S 定義的算子。S的特征多項式是? ???????? $t^{2}-1$ ? ?，因此，其特征值是 1 和 -1 。令? $X_{1}$ ??和?? $X_{2}$ ??為具有這些特征值單位長度的特征向量。因為 S 是正交的，

$(X_{1}{\cdot}X_{2}) = ( SX_{1}{\cdot}SX_{2}) = (X_{1}{\cdot}-X_{2}) = -(X_{1}{\cdot}X_{2})$ ? 。

從而可推導出? $(X_{1}{\cdot}X_{2}) =0$ ???。由于特征向量是正交的，因此? $X_{1}$ ??的張成(span)將是反射線。為了確定這條線，我們將一個單位向量 X 寫成?? $(c^{'},s^{'})^{t}$ ? (? $c^{'}=\cos{\alpha}$ ? ,? $s^{'}=\sin{\alpha}$ )。則

$SX=\begin{bmatrix} cc^{'}+ss^{'} \\ sc^{'}-cs^{'} \end{bmatrix}=\begin{bmatrix} \cos(\theta-\alpha) \\ \sin(\theta-\alpha) \end{bmatrix}$ ? 。

當?? $\alpha=\frac{1}{2}\theta$ ??時，X 是一個特征值為 1 ?的特征向量，為一個固定的向量。

下面我們描述 ?3 × 3 旋轉矩陣。

定義 5.1.22 ???? $\mathbb{R}^{3}$ ??關于原點的一個旋轉是一個線性算子 ρ ，其具有以下屬質：

?? ρ 固定一個單位向量 u ，稱為 ρ 的一個極點，以及

?? ρ? 將二維子空間 W 旋轉至與u?正交。

旋轉軸是由 u 張成的直線 𝓁 。同樣，我們稱恒等算子為一個旋轉，盡管其軸是不確定的(indeterminate)。

若一個 3 × 3 矩陣?R?是? $\mathbb{R}^{3}$ ? ?的一個旋轉，則稱 R 為一個旋轉矩陣。

(5.1.23)

------------------------------------------------? $\mathbb{R}^{3}$ ??的一個旋轉-------------------------------------------------

旋轉角的符號取決于子空間 W 如何定向。我們根據箭頭 u 的頭來定向 W 。圖中展示的角度 θ 是正的。(這稱為“右手法則”。)

當 u 是向量?? $e_{1}$ ??時，集合? $(e_{2},e_{3})$ ??將是 W 的一個基，則 ρ 的矩陣形式為

(5.1.24)

$M=\begin{bmatrix} 1&0&0 \\ 0&c&-s \\ 0&s&c \end{bmatrix}$ ? ? ,

其中，右下 ?2 × 2 ?子式是旋轉矩陣(5.1.18)。

?? 非恒等旋轉用 (u , θ) 對描述，稱為一個自旋(spin),其由一個極點 u 和一個非零旋轉角 θ 組成。

??? 具有自旋 (u , θ) 的旋轉可以記為? ? $\rho_{(u,\theta)}$ ? 。每一個不同于恒等旋轉的旋轉 ρ? 都有兩個極點，即旋轉軸 𝓁? 與? $\mathbb{R}^{3}$ ?中單位球的交集。這些是 ρ 的具有特征值 1 的單位長特征向量。一個極點 u 的選擇就定義了 𝓁 上的一個方向，且變更方向會引起符號按旋轉角變化。若 (u , θ) 是 ρ 的一個自旋，則 ( -u , -θ ) 也是ρ 的一個自旋。因此，每一個旋轉都有兩個自旋，且 ?? $\rho_{(u,\theta)}=\rho_{(-u,-\theta)}$ ?。

定理 5.1.25 (Euler 定理) ?一個 3 × 3 旋轉矩陣是行列式為 1 的 3 × 3 正交矩陣，其是特殊正交群? $\mathit{SO}_{3}$ ??之元素。

Euler 定理有一個顯著的推論，基推導基于?? $\mathit{SO}_{3}$ ??是一個正交群的事實。但不管是在代數上還是幾何上，這都不明顯。

推論 5.1.26? 關于任意兩個軸的旋轉的合成是關于某個其他軸的旋轉。

??? 因為其元素表示旋轉,因此群?? $\mathit{SO}_{2}$ ? 和?? $\mathit{SO}_{3}$ ??分別稱為二維和三維旋轉群。當維數大于 3 時，情況就變得更加復雜。

4 × 4 矩陣

(5.1.27)? ? ? ?? $\begin{bmatrix} \cos{\alpha}&-\cos{\alpha}&&\\ \sin{\alpha}&\cos{\alpha}&&\\ &&\cos{\beta}&-\sin{\beta} \\ &&\sin{\beta}&\cos{\beta} \end{bmatrix}$ ?

是?? $\mathit{SO}_{4}$ ??的一個元素，通過左乘此矩陣就將由? $(e_{1},e_{2})$ ? 張成的二維子空間旋轉角度?α，并將由 ? ? $(e_{3},e_{4})$ ??張成的二維子空間旋轉角度?β?。

在證明 Euler 定理之前，我們另注意兩個結論：

推論 5.1.28? 令 M 為?? $\mathit{SO}_{3}$ ??中表示具有自旋 (u , α) 的旋轉? $\rho_{(u,\alpha)}$ ??之矩陣。則

(a)? M??的跡是? $1+2\cos{\alpha}$ ? 。

(b) 令 B 為? $\mathit{SO}_{3}$ ??的另一個元素，并令? $u^{'}=Bu$ ??。則共軛? $M^{'} = BMB^{t}$ ??表示具有自旋? $(u^{'},\alpha)$ ??的旋轉 ? $\rho_{(u^{'},\alpha)}$ ? 。

證明：

(a)? 我們選擇? $\mathbb{R}^{3}$ ???的一個正交基，使得? $v_{1}=u$ ??。則 ρ 關于這個基的新的矩陣具有 (5.1.24) 的形式，即跡將為? $1+2\cos{\alpha}$ ? 。由于跡與基的選擇無關，因此 M 的跡也是? $1+2\cos{\alpha}$ ?。

(b)??由于? $\mathit{SO}_{3}$ ??是一個群，? $M^{'}$ ?是?? $\mathit{SO}_{3}$ ??的一個元素。則根據 Euler 定理，? $M^{'}$ ??是一個旋轉矩陣。此外，? $u^{'}$ ??是這個旋轉的一個極點：由于 B 是正交的，因此，? $u^{'}=Bu$ ??長度為1(譯注：正交矩陣的行向量和列向量均為單位向量，行向量或列向量長度均為1) ，且

$M^{'} u^{'} = BMB^{-1} u^{'} = BMu = Bu = u^{'}$ ? ?。
令?? $\alpha^{'}$ ??為?? $M^{'}$ ??關于極點?? $u^{'}$ ??的旋轉角。則 M 的跡與其共軛? $M^{'}$ ??是相等的。因此? $\cos{\alpha}=\cos{\alpha^{'}}$ ??。這意味著? $\alpha^{'}={\pm}\alpha$ ???。根據 Euler 定理，矩陣 B 也表示一個旋轉，比如，關于某個極點旋轉角度 β 。由于 B 和?? $M^{'}$ ??連續地依賴 β ，只會出現? ? $\alpha^{'}$ ??的兩個值? ${\pm}\alpha$ ? 之一的情況。當 β = 0 時，B? = I ,? $M^{'} = M$ ??, 且? $\alpha^{'}=\alpha$ ??。從而對于所有 β ，都有? $\alpha^{'}=\alpha$ ??。

引理 5.1.29? 一個行列式為 1 的 3 × 3 正交矩陣 M 有一個等于 1 的特征值。

證明：

??? 為了證明 1 是該矩陣的一個特征值，我們證明行列式 M – I 的行列式為零。若 B 是一個 n × n 矩陣，則? $\det(-B) = (-1)^{n} \det(B)$ ??。我處理的是 3 × 3 矩陣，因此?? $\det(M - I ) = - \det(I - M )$ ??。此外，? $(M - I)^{t} = \det(M - I )$ ???且 $\det(M ) = 1$ ?。

則

$\det(M - I ) = \det(M - I)^{t} = \det(M(M^{t} - I )) = \det(I - M )$ ? 。

$\det(M - I ) = \det(I - M )$ ??的這種關系表明? $\det(M - I ) = 0$ ? 。

Euler定理之證明：

假設 M 表示具有自旋? (u , α?) 的旋轉 ρ 。我們通過向 u 追加一個其正交空間W 的一個正交基的方式構成一個正交基B 。ρ 關于這個基的矩陣?? $M^{'}$ ??將具有 (5.1.24) 的形式，其行列式為1 且是正交的。此外，有? $M=PM^{'}P^{-1}$ ???，其中，矩陣 P?? 等于 [B] (3.5.13) 。由于其列是正交的，因此 ?[B] ?是正交的。從而 M 也是正交的，且其行列式等于 1? 。

反之，設M?是一個行列式為1的正交矩陣，T?表示與M?的左乘。設u?是一個特征值為1 的單位長度特征向量，W?是與?u?正交的二維空間。由于T?是一個固定u?的正交算子，它將W 映射到自身。因此W是一個T?不變子空間，我們可以將算子限制在W上。

??? 由于 T 是正交的，它保持長度不變(5.1.13)，因此它對 W 的限制也是正交的。現在 W 的維度是 2，我們知道 2 維上的正交算子：它們是旋轉和反射(5.1.17)。反射是行列式為 -1 的算子。如果算子 T 作為反射作用于 W，并固定正交向量 u，則其行列式也將為 -1。由于情況并非如此，因此? $T|_{W}$ ??是旋轉。這驗證了定義 5.1.22 的第二個條件，并表明 T 是旋轉。

5.2? 使用連續性(Using continuity)

??? 關于復矩陣的各種事實可以利用我們在此解釋的基于連續性的推理通過對角化推導出來。

對于一個 n × n 矩陣序列? $A_{k}$ ??和一個 n × n 矩陣 A ，若對于每一個 i 和 j ?， $A_{k}$ ??的第 i ，j? 項都收斂于矩陣 A 的i ，j? 項，則稱矩陣序列?? $A_{k}$ ??收斂于矩陣 A 。類似地，對于一個復系數 n 階多項式序列? $p_{k}(t)$ ???(k = 1 ,2 ,…)和一個 n 階多項式 p(t?) ，若對于每一個 j ， $p_{k}$ ??中的系數? $t^{j}$ ??都收斂于 p 的相應系數，則稱多項式序列? $p_{k}$ ??收斂于 p 。我們可以通過記法表明一個復序列，復矩陣，復多項式?? $S_{k}$ ??收斂于某個 S ，?即記為? $S_{k} \rightarrow S$ ? 。

命題 5.2.1 (根的連續性)? 令?? $p_{k}(t)$ ??為一個階數 ≤ n ?的首一(monic,首項系數為1)多項式序列，并令 p?(?t?) 為另一個n階首一多項式。令?? $\alpha_{k,1} ,... , \alpha_{k,n}$ ??和?? $\alpha_{1} ,... , \alpha_{n}$ ??分別表示這兩個多項式的根。則

(a)? 若對于 ν = 1 ，… ，n ，有? ? $\alpha_{k,v} \rightarrow \alpha_{v}$ ???，則 ? $p_{k} \rightarrow p$ ? 。

(b)? 反之，若?? $p_{k} \rightarrow p$ ????， $p_{k}$ ??的根?? $\alpha_{k,v}$ ??可以按這樣一種方式編號，即對于 ν = 1 ，… ，n ，有? $\alpha_{k,v} \rightarrow \alpha_{v}$ ??。

在 (b) 部分，每一個多項式??? $p_{k}$ ??的根必需單獨編號。

證明：

???????? ?我們注意到， $p_{k}(t) = (t - \alpha_{k,1})...(t - \alpha_{k,n})$ ??和?? $p(t) = (t - {\alpha}_{1})...(t - {\alpha}_{n})$ ???。而推導 (b) 所基于的事實是，p(t) 的系數是根的連續函數(多項式函數)，但 (b) 作為多項式的函數不明顯。

第1步：

令?? $\alpha_{k,v}$ ??為?? $p_{k}$ ??的最接近?? $\alpha_{1}$ ??的根，即其使得? $|\alpha_{k,v}-\alpha_{1}|$ ???最小。我們重寫編號? $p_{k}$ ??的根，使得這個根為?? $\alpha_{k,1}$ ???。則

$|\alpha_{1}-\alpha_{k,1} |^{n} \leq |(\alpha_{1 }- \alpha_{k,1})... (\alpha_{1} - \alpha_{k,n})| = |p_{k}(\alpha_{1})|$ ? 。

右邊收斂于?? $| p(\alpha_{1})| = 0$ ??。因此，右邊必須也收斂于此。這就證明了? $\alpha_{k,1} \rightarrow \alpha_{1}$ ???。

第2步：

我們將多項式分解，記?? $p_{k}(t) = (t - \alpha_{k,1}) q_{k}(t)$ ??和? $p(t) = (t - \alpha_{1})q(t)$ ??。則?? $q_{k}$ ??和 q 是首一多項式，它們的根分別是? $\alpha_{k,2} ,... , \alpha_{k,n}$ ??和?? $\alpha_{2} ,... ,\alpha_{n}$ ??。若我們能證明? $q_{k} \rightarrow q$ ??，則基于 n? 執行歸納，我們將能夠排列? $q_{k}$ ??的根，使其收斂于 q 的根，我們按這種方法進行。

為了證明? $q_{k} \rightarrow q$ ??，我們進行顯式分解。為了簡化記法，我們略去從 1 到? $\alpha_{1}$ ??的下標。比如，? $p(t) = t^{n} + a_{n-1} t^{n-1} + ... + a_{1}t + a_{0}$ ? ,?? $q(t) = t^{n-1} + b_{n-2} t^{n-2} + ... + b_{1}t + b_{0}$ ???，而? $p_{k}$ ? 和?? $q_{k}$ ??是類似的。方程??p(t) = (1 - α)q(t)? 意味著：

$\begin{array}{lrc} b_{n-2} = \alpha + a_{n-1} ,\\ b_{n-3} = \alpha^{2} + \alpha + a_{n-2} ,\\ \quad \vdots \\ b_{0} = \alpha^{n-1} + \alpha^{n-2} a_{n-1} + ...+ {\alpha}a_{2} + a_{1} , \end{array}$ ?

由于? ?? $\alpha_{k,1} \rightarrow \alpha_{1}$ ? ?且?? $\alpha_{k,i} \rightarrow \alpha_{i}$ ???，因此?? $b_{k,i} \rightarrow b_{i}$ ? ?成立。

命題 5.2.2? 令 A 為一個 n × n 復矩陣。則

(a) 存在一個收斂于 A 的矩陣序列 ? $A_{k}$ ??，使得對于所有的?k ，? $A_{k}$ ??的特征多項式? $p_{k}(t)$ ??具有不同的根。

(b) 若一個矩陣序列?? $A_{k}$ ??收斂于 A ，則其特征多項式? $p_{k}(t)$ ??收斂于A 的特征多項式 p(t) 。

(c) ?令 ? $\lambda_{i}$ ??為特征多項式的 p(t) 根。則若?? $A_{k} \rightarrow A$ ??，? $p_{k}$ ??的根?? $\lambda_{k,i}$ ??可以標號以使得對于每一個 i , 有?? $\lambda_{k,i} \rightarrow \lambda_{i}$ ? 。

證明：

??? 根據命題 4.6.1 ，存在一個可逆矩陣 P ，使得? $A^{'} = P^{-1} A P$ ?呈上三角陣，其特征值是此上三角陣的對角線項。令? $A_{k}^{'}$ ??為一個收斂于 A? ?的矩陣序列，其非對角線項(off-diagonal) 與?? $A^{'}$ ??的非對角線項相同，而其對角線項不同。則?? $A_{k}^{'}$ ??是上三角陣，且其特征多項式具有不同的根。令?? $A_{k}= PA_{k}^{'} P^{-1}$ ????。由于矩陣乘是連續的，因此 ?? $A_{k }\rightarrow A$ ?從而? $A_{k}$ ??的特征多項式與? $A_{k}^{'}$ ? ?的相同，因此其同樣具有不同的根。

(b) 部分由 (a) 推出，因為特征多項式的系數連續依賴于矩陣項，因此 (c) 由命題 5.2.1 得出。

??? 我們可以使用連續性來證明著名的 Cayley-Hamilton 定理。我們按其矩陣形式來表述這個定量。

定理 5.2.3(Cayley-Hamilton 定理)? 令? $p(t) = t^{n} + c_{n-1} t^{n-1} + ... + c_{1}t + c_{0}$ ??為 n × n 復矩陣 A 的特征多項式。則?? $p(A) = A^{n} + c_{n-1} A^{n-1} + ... + c_{1} A + c_{0} I$ ??是零矩陣。

例如，2 × 2 矩陣 A 的特征多項式是? $t^{2} - (a + d )t + (ad - bc)$ ???(其中，a, b, c, d ?如常 )(4.5.12)。根據定理，可斷言

(5.2.4)??? ?? $\begin{bmatrix} a&b\\ c&d \end{bmatrix}^{2}-(a+d)\begin{bmatrix} a&b\\ c&d \end{bmatrix}+(ad-bc)\begin{bmatrix} 1&0\\ 0&1 \end{bmatrix}=\begin{bmatrix} 0&0\\ 0&0 \end{bmatrix}$ ? ?。

這不難驗證。

Cayley-Hamilton 定理之證明：

第1步：A 是對角矩陣的情況。

令對角項為?? $\lambda_{1},..., \lambda_{n}$ ??。則其特征多項式是

$p(t) = (t - {\lambda}_{1}) ...(t - {\lambda}_{n})$ ? 。

此處的 p(A) 也是一個對角矩陣，其對角項是? $p(\lambda_{i})$ ??，由于?? $\lambda_{i}$ ??是 p 的根，則?? $p(\lambda_{i})=0$ ???且 p(A) = 0 。

第2步：A 的特征值不同的情況。

??? 在這種情況下，A 是可對角化的矩陣；比如， $A^{'} = P^{-1} A P$ ??是對角陣。則? $A^{'}$ ??的特征多項式與 A 的特征多項式 p?(?t?)? 相同，此外

?? $p(A) = P p(A^{'}) P^{-1}$ ??(見 (4.6.14) ) 。

根據第 1 步，? $p(A^{'}) = 0$ ??，從而 p(A) = 0 。

第3步：一般情況。?

??? 我們應用命題 5.2.2 。我們令?? $A_{k}$ ??為具有不同特征值的收斂于 A 的矩陣序列。令? $p_{k}$ ??為? $A_{k}$ ??的特征多項式。由于? $p_{k}$ ??收斂于 A 的特征多項式 p ，即?? $p_{k}(A_{k}) \rightarrow p(A)$ ? 。

根據第二步，對于所有的 k?有??? $p_{k}(A_{k})=0$ ??。從而 p(A) = 0 。

5.3? 微分方程組(Systems of differential equations)

???????? 我們知道，在微積分中，微分方程

(5.3.1) ? ? ? $\displaystyle \frac{dX}{dt}=ax$ ??

的解是?? $x(t) = ce^{at}$ ???，其中，c 是一個任意實數。我們回顧一下其證明，因為我們想再次使用這個論證。首先，?? $ce^{at}$ ???確實是這個方程的解。為了證明方程的每一個解都具有這種形式，我們令? x(t) 為一個任意解。我們利用乘積法則微分?? $e^{-at}x(t)$ ? :

(5.3.2) ?????? $\displaystyle \frac{d}{dt}{\left (e^{-at}x(t) \right )}=(-ae^{-at})x(t)+e^{-at}(ax(t))=0$ ? 。

因此，? $e^{-at}x(t)$ ??是一個常量 c ，且? $x(t)=ce^{at}$ ? 。

為了將此解擴展到常系數微分方程組，我們使用以下術語。一個向量函數(vector-valued function)或矩陣函數(matrix-valued function)是一個向量或矩陣，其項(或元素)是?t 的函數：

(5.3.3)?????????????????? $X(t)=\begin{bmatrix} X_{1}(t) \\ \vdots \\ X_{n}(t) \end{bmatrix}$ ? ?,? ?? $A(t)=\begin{bmatrix} a_{11}(t) &\cdots&a_{1n}(t)\\ \vdots && \vdots \\ a_{m1}(t)&\cdots&a_{mn}(t) \end{bmatrix}$ ? ?。

通過對每一個元素分別進行運算，取極限和微分的微積分運算擴展到向量函數和矩陣函數。向量函數或矩陣函數的導數是通過對每一個元素進行微分得到的函數：

(5.3.4) ? ? ?? $\displaystyle \frac{dX(t)}{dt}=\begin{bmatrix} X_{1}^{'}(t) \\ \vdots \\ X_{n}^{'}(t) \end{bmatrix}$ ? ,? ?? $\displaystyle \frac{dA}{dt}=A(t)=\begin{bmatrix} a_{11}^{'}(t) &\cdots&a_{1n}^{'}(t)\\ \vdots && \vdots \\ a_{m1}^{'}(t)&\cdots&a_{mn}^{'}(t) \end{bmatrix}$ ? ,

其中， $x_{i}^{'}(t)$ ??是?? $x_{i}(t)$ ??的導數，如此，等等。因此，如果每一個函數?? $x_{i}(t)$ ??可微，則微分? $\frac{dX}{dt}$ ??有定義。導數也可以按矩陣符號表示：

(5.3.5)??? ? $\displaystyle \frac{dX(t)}{dt}=\lim_{h \rightarrow 0}{\frac{X(t+h)-X(t)}{h}}$ ? 。

這里 X(t + h) - X(t?) 由向量加法計算，分母中的 h 表示與? $h^{-1}$ ??的標量乘。極限是通過分別求每一個元素的極限得到的。因此，(5.3.5) 的元素是導數?? $x_{i}^{'}(t)$ ??。類似的命題也適用于矩陣函數。

微分的許多基本性質可以推廣到矩陣函數。例如，乘積法則的證明可以作為練習：

引理 5.3.6 ?乘積法則(Product Rule)。

(a)? 令 A(t) 和 B(t) 為 t 的可微矩陣函數，且具有使得其積有定義的合適的大小。則矩陣乘積 A(t?)B(t?) 是可微的，其導數是

$\displaystyle \frac{d(AB)}{dt} =B\frac{d(A)}{dt} +A\frac{d(B)}{dt}$ ? 。

(b)? ??令?? $A_{1} ,... , A_{k}$ ? ?為?t??的可微矩陣函數序列，且具有使得其積有定義的合適的大小。則矩陣乘積? $A_{1} ... A_{k}$ ??是可微的，其導數是

$\displaystyle \frac{d}{dt}{(A_{1}...A_{k})}=\sum_{i=1}^{k}A_{1}...A_{i-1}(\frac{dA_{i}}{dt})A_{i+1}...A_{k}$ ? 。

一個齊性線性一階常系數方程組是一個矩陣方程，其形式為

(5.3.7)??? ? $\displaystyle \frac{dX}{dt}=AX$ ? ?,

其中，A 是一個常量 n × n 矩陣，X 是一個 n 維向量函數。寫出這樣一個方程組，我們就得到了一個 n 維微分方程組

(5.3.8)?

$\displaystyle \frac{dx_{1}}{dt}=a_{11}x_{1}(t)+...+a_{1n}x_{n}(t)$

............................................................

$\displaystyle \frac{dx_{n}}{dt}=a_{n1}x_{1}(t)+...+a_{nn}x_{n}(t)$ ? 。

$x_{i}(t)$ ??是未知函數，標量? $a_{ij}$ ??已知。例如，若

(5.3.9)? ? ? $A=\begin{bmatrix}3&2\\1&4 \end{bmatrix}$ ? ，

則 (5.3.7) 就成了一個具有2個未知數的由兩個方程構成的方程組

(5.3.10)??

$\displaystyle \frac{dx_{1}}{dt}=3x_{1}(t)+2x_{2}(t)$

$\displaystyle \frac{dx_{2}}{dt}=x_{1}(t)+4x_{2}(t)$ ? ?。

最簡的方程組是那些矩陣 A 是具有對角元素?? $\lambda_{i}$ ??的對角陣的方程組。則方程組 (5.3.8) 解讀為

(5.3.11)?????? $\displaystyle \frac{dx_{i}}{dt}=\lambda_{i}x_{i}(t)(i=1,2,...,n)$ ? 。

在此，未知函數? $x_{i}$ ??不會被方程混淆，因此我們可以分別對每一個方程求解：

(5.3.12)?? ?? $x_{i }= c_{i }e^{\lambda_{i}t }$ ??( 對于某個任意的常量? $c_{i}$ ? )

在很多情況下，我們可以利用以下觀察結果來求解微分方程 (5.3.7)：若 V 是 A 的一個特征為 λ 的特征向量，即 AV = λV? ?，則

(5.3.13)?????? $X = e^{?{\lambda}t}V$ ??

是 (5.3.7)的一個特解。此處?? $e^{?{\lambda}t}V$ ??? 必須解釋為標量變量?? $e^{?{\lambda}t}$ ??與常向量 V? 之積。固定 V ，微分作用于標量函數，而固定標量? $e^{?{\lambda}t}$ ??，乘以 A 則作用于向量V 。因此?? $\frac{d}{dt} e^{?{\lambda}t}V = {\lambda}e^{?{\lambda}t}V$ ? ?,?另外?? $Ae^{?{\lambda}t}V = {\lambda}e^{?{\lambda}t}V$ ??? 。例如，

$\begin{bmatrix} 1 \\ 1 \end{bmatrix}$ ? ?和?? $\begin{bmatrix} 2 \\ -1 \end{bmatrix}$ ??

是矩陣 (5.3.9) 的特征向量，其特征值分別是 5 和 2 ，且

(5.3.14)?? ? ?? $\begin{bmatrix} e^{5t} \\ e^{5t} \end{bmatrix}$ ? ?和?? $\begin{bmatrix} 2e^{2t} \\ -e^{2t} \end{bmatrix}$ ??

是方程組 (5.3.10)的解。

由此觀察，只要矩陣 A 具有不同的實特征值，我們就能求解 (5.3.7)。在這種情況下，每一個解都將是 (5.3.13) 特殊解的線性組合。為了解決這個問題，對角化是一種便捷的方法。

命題 5.3.15? 令 A 為一個 n × n 矩陣，并令 P 為一個可逆矩陣，并使得 ? $\Lambda=P^{-1}AP$ ??是對角陣，且對角元素為?? $\lambda_{1} ,..., \lambda_{n}$ ? ?。這個方程組? $\frac{dX}{dt}=AX$ ??的通解是?? $X = P\widetilde{X}$ ???，其中 ? $\widetilde{X}=(c_{1}e^{\lambda_{1}t},...,c_{n}e^{\lambda_{n}t})^{t}$ ? ?是方程?? $\frac{d\widetilde{X}}{dt}={\Lambda}\widetilde{X}$ ??的解。系數? $c_{i}$ ??是任意的。它們通常由賦預的初始條件( X 在某個特解? $t_{0}$ ??處的值)確定。

證明：

我們用 P ?乘以方程? ? $\frac{d\widetilde{X}}{dt}={\Lambda}\widetilde{X}$ ? ：? $P\frac{d\widetilde{X}}{dt}=P{\Lambda}\widetilde{X}=AP\widetilde{X}$ ? 。但由于 P ?是常量，因此?? $P\frac{d\widetilde{X}}{dt}=\frac{d(P\widetilde{X})}{dt}=\frac{dX}{dt}$ ??。從而?? $\frac{dX}{dt}=AX$ ??。這個推理可以反過來，因此，當且僅當 X 用 A 解方程時， $\widetilde{X}$ ??用 Λ 解方程。對角化矩陣 (5.3.10) 的矩陣是在 (4.6.8) 之前計算的：

(5.3.16) ? ? ? $A=\begin{bmatrix}3&2\\1&4 \end{bmatrix}$ ? ?,?? $P=\begin{bmatrix}1&2\\1&-1 \end{bmatrix}$ ??, 以及?? $\Lambda=\begin{bmatrix}5&\\&2 \end{bmatrix}$ ? 。

因此，

(5.3.17)?? ? $X=\begin{bmatrix} x_{1} \\ x_{2} \end{bmatrix}=P\widetilde{X}=\begin{bmatrix}1&2\\1&-1 \end{bmatrix}\begin{bmatrix} c_{1}e^{5t} \\ c_{2}e^{5t} \end{bmatrix}= \begin{bmatrix} c_{1}e^{5t}+2c_{2}e^{2t} \\ c_{1}e^{5t}-c_{2}e^{2t} \end{bmatrix}$ ? ?。

換言之，方程的每一個解都是兩個基本解的線性組合。

??? 我們現在考慮系數矩陣 A 具有不同特征值的情況，但它們并不完全是實數。為了復制上面使用的方法，我們首先考慮形如 (5.3.1) 的微分方程，其中a 是一個復數。恰當的解釋是，這樣一個微分方程的仍然具有形如 $ce^{at}$ ??的解。唯一需要記住的是，?? $e^{at}$ ???現在將成為實變量t的復函數。

復函數導數的定義與實函數的定義相同，只要極限 (5.3.5)存在。沒有新的特征。我們可以把任何這樣的函數 x(?t?) 寫成它的實部和虛部的形式，這樣，它們就成為實函數了，比如，

(5.3.18)?? ?? $x(t) = p(t) + iq(t)$ ? 。

則當且僅當 p?和 q 可微時，x 可微，且它們可微，則 x 的導數是? $p^{'} + iq^{'}$ ??

。這可直接根據定義推導。微分的常規法則(例如乘積規則)對復函數仍然成立。這些規則可以通過對p和 q 應用相應的實函數定理，或者復制相應的實函數的定理來證明。

??? 一個復數 r + si? ?的指數定義為

(5.3.19)?? ? $\large \displaystyle {e^{a} = e^{r + si} = e^{r(\cos(s) + i\sin(s))}}$ ? ?。

這個公式的微分表明?? $\large de^{at}/dt=ae^{at}$ ??。因此，? $\large ce^{at}$ ??是微分方程 (5.3.1) 的解，本節開頭給出的證明表明這個些是唯一的解。

將單個方程的情況擴展到復系數的情況后，當 A 是一個具有不同特征值的復矩陣時，我們可以利用對角化來求解方程組 (5.3.7)。

????????例如，令? $A=\begin{bmatrix}1&1\\-1&1 \end{bmatrix}$ ? ?。向量?? $v_{1}=\begin{bmatrix} 1 \\ i \end{bmatrix}$ ? 和? $v_{2}=\begin{bmatrix} i \\ 1 \end{bmatrix}$ ? ?是其特征向量，其特征值分別為 1 + i 和 1 - i 。令 B 表示基? $(v_{1},v_{2})$ ??。則 A 通過矩陣 P = [B] 對角化：

(5.3.20)?? ?

$\displaystyle P^{-1} AP =\frac{1}{2}\begin{bmatrix}1&-i\\-i&1 \end{bmatrix}\begin{bmatrix}1&1\\-1&1 \end{bmatrix}\begin{bmatrix}1&i\\i&1 \end{bmatrix}=\begin{bmatrix}1+i&\\&1-i \end{bmatrix}=\Lambda$ ? 。

則?? $\widetilde{X}=\begin{bmatrix} {\widetilde{x}_{1}} \\ \widetilde{x}_{2} \end{bmatrix}= \begin{bmatrix} c_{1}e^{(1+i)t} \\ c_{2}e^{(1-i)t} \end{bmatrix}$ ? 。方程 (5.3.7) 的解是

(5.3.21)??????

$\begin{bmatrix} {?{x}_{1}} \\ {x}_{2} \end{bmatrix}=P\widetilde{X}= \begin{bmatrix} c_{1}e^{(1+i)t}+ic_{2}e^{(1-i)t} \\ c_{1}e^{(1-i)t} +ic_{1}e^{(1+i)t} \end{bmatrix}$ ? ，

其中， $c_{1}$ ? ,?? $c_{2}$ ??是任意復數。因此，每一個解都是這兩個基本解

(5.3.22)? ? ? $\begin{bmatrix} e^{(1+i)t} \\ ie^{(1-i)t} \end{bmatrix}$ ? ?和? ? ? $\begin{bmatrix} ie^{(1-i)t} \\ e^{(1-i)t} \end{bmatrix}$ ? ?

的一個線性組合。然而，這些解并不令人滿意，因為我們一開始就得到了一個實系數微分方程組，而得到的答案是復數。當方程為實數時，我們需要的是實數解。我們注意到以下引理：

引理 5.3.23? 令 A 為一個實 n?×?n ?矩陣，且令 X(?t?) 為微分方程? $\frac{dX}{dt}=AX$ ???的一個復解。的實部和虛部為同一方程的解。

現在，原方程 (5.3.7) 的每一個解，無論是實解還是復解，對于某些復數? $c_{i}$ ??，都具有形式 (5.3.21)。因此，實解包含于我們已求得的解之中。為了明確地寫出它們，我們可以取復解的實部和虛部。

基本解 (5.3.22) 實部和虛部使用 (5.3.19)確定。它們是

(5.3.24)? ? ? ? ?? $\begin{bmatrix} e^{t}\cos{t} \\-e^{t}\sin{t} \end{bmatrix}$ ? 和?? $\begin{bmatrix} e^{t}\sin{t} \\e^{t}\cos{t} \end{bmatrix}$ ? ? 。

每一個實解都是這些特解的一個實數線性組合。

5.4? 矩陣指數(The matrix exponential)(矩陣作為指數)

??? 一階線性常系數微分方程組可以用矩陣指數來正式求解。

??? 一個實或復 n?×?n ?矩陣A的指數也是一個一個矩陣，可通過在? $e^{x}$ ??的Taylor級數中用 A代替x 并用 ?I?替換1 而求得。Taylor級數為

(5.4.1)??? ?? $\displaystyle e^{x} = 1 + \frac{x}{1!} + \frac{x^{2}}{2!} + \frac{x^{3}}{3!} + ...$ ? 。

因此，根據定義

(5.4.2) ?? $\displaystyle e^{A} = I + \frac{A}{1!} + \frac{A^{2}}{2!} + \frac{A^{3}}{3!} + ...$ ? ?。

我們主要的興趣點在于標量變量 t 的矩陣函數? $e^{tA}$ ??，因此我們在上式中將 A 替換為?tA:

(5.4.3) ??? ? $\displaystyle e^{tA} = I + \frac{tA}{1!} + \frac{t^{2}A^{2}}{2!} + \frac{t^{3}A^{3}}{3!} + ...$ ? ?。

定理 5.4.4

(a)? 該級數 (5.4.2) 在復矩陣的有界集上絕對且一致收斂。

(b) ?? $e^{tA}$ ??是 t 的一個可微函數，其導數是矩陣乘法 ?? $Ae^{tA}$ ?。

(c) 設 A 和 B 為可交換的復?n × n 矩陣: AB = BA 。則 ? $e^{A+B}=e^{A}e^{B}$ ? 。

為了不打斷討論，我們將該定理的證明移到了本節的末尾。

???????? A 和 B 為可交換的假設對于將基本性質? $e^{x+y}=e^{x}e^{y}$ ??推廣到矩陣至關重要。因此，(c) 非常重要。

推論 5.4.5? 對于任意 n × n 復矩陣，指數 ? $e^{A}$ ? ?是可逆的，且其逆是 ? $e^{-A}$ ? 。

證明：

??? 因為 A 和 -A 可交換，因此? $e^{A} e^{-A} = e^{A-A} = e^{0} = I$ ?。

由于矩陣乘法相對復雜，通常不容易寫下矩陣? $e^{A}$ ??的元素。除非 A 是對角矩陣，否則無法通過對 A 的元素指數化來獲得它們。若 A 是對角陣，且對角線上的元素為?? ${\lambda}_{1} ,...,{\lambda}_{n}$ ??，則通過級數檢查表明? $e^{A}$ ??也是呈對角化的，且其對角線元素為?? $e^{?{\lambda}_{i}}$ ? 。

對于一個三角 2 ?× 2 矩陣，這個指數也相當容易計算。例如，若

$A=\begin{bmatrix}1&1\\&2\end{bmatrix}$ ? ,

則

(5.4.6)??? ?? $\displaystyle e^{A}=\begin{bmatrix}1&\\&1\end{bmatrix}+ \frac{1}{1!}\begin{bmatrix}1&1\\&2\end{bmatrix}+\frac{1}{2!}\begin{bmatrix}1&3\\&4\end{bmatrix}+...+\begin{bmatrix}1&*\\&e^{2}\end{bmatrix}$ ? 。

直接從級數計算缺失項 * 是一個非常好的習題。?

只要我們知道某一個矩陣P ?，其使得? $\Lambda = P^{-1} AP$ ??呈對角化，則我們就可以確定??? $e^{A}$ ??的指數。使用法則? $P^{-1} A^kP = (P^{-1} AP)^{k}$ ??(4.6.12) 以及矩陣乘法的分配律，得到

(5.4.7) ? ? ? ? ?? $\displaystyle P^{-1} e^{A}P = (P^{-1}IP ) + \frac{P^{-1}AP}{1!} + \frac{({P^{-1}AP})^{2}}{2!} + ...+e^{P^{-1}AP}=e^{\Lambda}$ ? 。

假設 Λ? 呈對角化，且其對角化元素為? $\lambda_{i}$ ??。則? $e^{\Lambda}$ ?也呈對角化，且其對角化元素為? $e^{\lambda_{i}}$ ??。在這種情況下，我們可以顯式地計算?? $e^{A}$ ??：

(5.4.8)??? ? ? ? $e^{A} = Pe^{\Lambda} P^{-1}$ ? 。

例如，若? ?? $A=\begin{bmatrix}1&1\\&2\end{bmatrix}$ ? ?而? $P=\begin{bmatrix}1&1\\&1\end{bmatrix}$ ??，則?? $P^{-1} AP=\Lambda=\begin{bmatrix}1&\\&2\end{bmatrix}$ ? ?。因此

$e^{A} = Pe^{\Lambda}P^{-1}=\begin{bmatrix}1&1\\&1\end{bmatrix}\begin{bmatrix}e&\\&e^{2}\end{bmatrix}\begin{bmatrix}1&-1\\&1\end{bmatrix}=\begin{bmatrix}e&e^{2}-e\\&e^{2}\end{bmatrix}$ ? 。

下一個定理將矩陣指數與微分方程聯系起來：

定理 5.4.9? 令 A? 為一個實或復 n × n 矩陣。則矩陣? $e^{tA}$ ??的列構成微分方程 ??? $\frac{dX}{dt}=AX$ ??的解空間的一個基。

證明：

根據定理 (5.4.4)(b)，? $e^{tA}$ ??的列是微分方程的解。為了證明微分方程的每一個解都是列的一個線性組合，我們復制 5.3 節開頭已經的這個證明。令 X(t?) 為一個任意解。我們用乘法法則 (5.3.6) 微分? $e^{-tA}X(t)$ ??：

(5.4.10)?????? ? $\displaystyle \frac{d}{dt}{\left (e^{-tA}X(t)\right )}=(-Ae^{-tA})X(t)+e^{-tA}(AX(t))$ ? 。

慶幸的是，A 和? $e^{-tA}$ ??可交換。這一特性可直接根據指數的定義推導。因此函數的導數是零。從而?? $e^{-tA}X(t)$ ? ??是一個常量列向量，不妨設其為?? $C = (c_{1},...,c_{n})^{t}$ ??，則?? $X(t) = e^{tA} C$ ??。這樣就將? X?(t?)? 表示成了? ? $e^{tA}$ ? ?的列向量的線性組合，且系數為?? $c_{i}$ ??。且這種表示是唯一的，因為?? $e^{tA}$ ???是一個可逆矩陣。

雖然矩陣指數總是能解微分方程 (5.3.7)，但它可能不容易應用于具體情況，因為指數的計算可能很困難。但如果 A 可對角化，則可以像 (5.4.8) 中那樣計算指數。我們可以用這種求?? $e^{tA}$ ??的方法來解方程 (5.3.7)。當然，我們會得到和之前相同的解。因此，如果 A、P 和 A 與 (5.3.16) 中一樣，則

$\displaystyle e^{tA }= Pe^{t}{\Lambda} P^{-1}\\\\\\ =\begin{bmatrix}1&1\\&2\end{bmatrix}\begin{bmatrix}e^{5t}&1\\&e^{2t}\end{bmatrix}(-\frac{1}{3})\begin{bmatrix}-1&-2\\-1&1\end{bmatrix}\\\\ \\\\= \displaystyle \frac{1}{3}\begin{bmatrix}(e^{5t}+2e^{2t})&(2e^{5t}-2e^{2t})\\(e^{5t}-e^{2t})&(2e^{5t}+2e^{2t})\end{bmatrix}$ ? ?。

右側矩陣的列構成了解空間的第二個基，該基是在 (5.3.17) 中求得的。

??? 我們也可以使用 Jordan 形來解微分方程。任意 k × k? Jordan 塊? $J_{\lambda}$ ???(4.7.5) 都可以通過計算矩陣指數來確定。我們記?? $J_{\lambda} = {\lambda}I + N$ ??，和 (4.7.12) 中一樣，其中 N 是 k × k? Jordan 塊? ? $J_{0}$ ??且? $N^{k}=0$ ??，因此

?? $\displaystyle e^{tN} = I + \frac{tN}{1!} +... + \frac{t^{k-1}N^{k-1}}{(k-1)!}$ ? 。

由于 N 和 λI 可交換，

???? $\displaystyle e^{tJ} = e^{?{\lambda}tI}e^{tN}= e^{?{\lambda}t}\left (I + \frac{tN}{1!} +... + \frac{t^{k-1}N^{k-1}}{(k-1)!} \right )$ ? 。

因此，若 J 是 3 ×3 ??Jordan 塊，即

? $J=\begin{bmatrix}3&&\\ 1&3& \\ &1&3 \end{bmatrix}$ ? ,

則

$\displaystyle e^{tJ} =\begin{bmatrix}e^{3t}&&\\&e^{3t}& \\ &&e^{3t} \end{bmatrix}\begin{bmatrix}1&&\\t&1& \\ \frac{1}{2!}t^{2} &t&1 \end{bmatrix}=\begin{bmatrix}e^{3t} &&\\te^{3t} &e^{3t} & \\ \frac{1}{2!}t^{2}e^{3t} &te^{3t} &e^{3t} \end{bmatrix}$ ? ? 。

這個矩陣的列構成了微分方程?? $\frac{dX}{dt}=JX$ ??的解空間的一個基。

現在我們回過頭來證明定理 5.4.4 。我們將用到的關于級數極限的主要事實如下，并參考了[Mattuck]和[Rudin]的文獻。這些作者只考慮了實函數，但其證明也適用于復函數，因為復函數的極限和導數可以通過分別處理實部和虛部來定義。

??? 若 r 和 s 是實數且 r < s? 。記法 [?r, s?] 表示區間 r ≤ t ≤ s 。

定理 5.4.11 ([Mattuck], 定理 22.2B, ?[Rudin], 定理7.9) ???令? $m_{k}$ ??為一個正實數序列，且使得? $\sum{m_{k}}$ ??收斂。若 ? $u^{(k)}(t)$ ??是閉區間 [?r, s?] 上的一個函數，且若對于此區間中的所有?t?和所有 k ,有? $| u^{(k)}(t)| \leq m_{k}$ ??。則級數? ? $\sum{u^{(k)}(t)}$ ??在此區間上于致收斂。

定理 5.4.12 ?([Mattuck], 定理 11.5B, ?[Rudin], 定理7.17)??? 令?? $u^{(k)}(t)$ ??為一個在區間 [r, s] 上具有連續導數物函數序列。假設級數? $\sum{u^{(k)}(t)}$ ??收斂于一個函數 f (t?) ,且其導數組數??? $\sum{u^{'(k)}(t)}$ ??在這個區間上一致收斂于一個函數 g?(t?) 。則函數? f? 在此區間上可微且其導數為? g 。

定理 5.4.4 之證明。

(a): 在此，我們用? $(A)_{ij}$ ??一個矩陣 A 的第 i,?j 個元素。因此，? $(AB)_{ij}$ ??表示乘積矩陣 AB? 的元素。而? $(A^{k} )_{ij}$ ? ?表示第 k? 個冪? $A^{k}$ ??的元素。按照這種記法，? $e^{A}$ ??的第 i,?j 個元素是級數和?

(5.4.13)? ? ? ?? $\displaystyle (e^{A})_{ij}=(I)_{ij}+\frac{(A)_{ij}}{1!}+\frac{(A^{2})_{ij}}{2!}+\frac{(A^{3})_{ij}}{3!}+...$ ? ? ? 。

為了證明指數級數絕對且一致地收斂，我們需要證明冪?? $A^{k}$ ??的元素(項)不會增長得太快。

我們用?? $||A||$ ??表示矩陣 A 元素的最大絕對值，即滿足以下條件的最小實數：

(5.4.14)?????? $|(A)_{ij}| \leq ||A||$ ? ??(對于所有 i,?j ) 。

其基本屬性為：

引理 5.4.15? 令 A 和 B 為復 n × n 矩陣。則? $||AB|| \leq \Vert A \Vert \Vert B \Vert$ ??，且對于所有 k > 0 , 有?，且對于所有 k > 0 , 有?? $\Vert A^{k} \Vert \leq n^{k-1} \Vert A \Vert^{k}$ ? 。

證明：

??? 我們估算 AB? 的 i?,?j 元素的大小：

$\displaystyle \bigg |(AB)_{ij} \bigg |=\bigg |\sum_{\nu=1}^{n}(A)_{i\nu}(B)_{?{\nu}j} \bigg | \leq \bigg |\sum_{\nu=1}^{n}(A)_{i\nu}(B)_{?{\nu}j} \bigg | \leq n \Vert A \Vert \Vert B \Vert$ ? ?。

第二個不等式是通過第一個不等式歸納得出的。

現在我們估算指數級數：令 a 為一個正實數，且使得?? $n\Vert A \Vert \leq a$ ??。根據引理得到

$|(A^{k})_{ij}| \leq a^{k}$ ??( 為簡單起見 n 取1 ) 。因此

(5.4.16)??

$\begin{array}{rlc} \displaystyle |(e^{A})_{ij}|&\displaystyle \leq |(I)_{ij}| + |(A)_{ij}|+\frac{1}{2!} |(A^{2})_{ij}|+\frac{1}{3!} |(A^{3})_{ij}|+... \\ \\ &\displaystyle \leq 1+\frac{a}{1!}+\frac{a^{2}}{2!}+\frac{a^{3}}{3!}+... \end{array}$ ?。

比率驗證表明，最后一個級數收斂(顯然收斂于?? $e^{a}$ ??) 。根據定理 5.4.11，? $e^{A}$ ??的級數對于所有? ? $A$ ?(? $n\Vert A \Vert \leq a$ ?)??絕對且一致收斂于。

定理 5.4.4 之證明。

??? (b),(c):? ?我們使用一種技巧來縮短證明。即，首先微分? $e^{tA+B}$ ??的級數。假設 A 和 B 是可交換的 n × n 矩陣。tA + B 的導數是 A ，且?

(5.4.17)?????? $\displaystyle e^{tA+B}=I+\frac{(tA+B)}{1!}+\frac{(tA+B)^{2}}{2!}+...$ ? 。

使用乘積法則 (5.3.6) 我們可以看到，對于 k > 0 , 這個級數的 k 次項的導數是

$\displaystyle \frac{d}{dt}{\left (\frac{(tA+B)^{k}}{k!} \right )}=\left (\frac{1}{k!}\sum_{i=1}^{k}(tA+B)^{i-1}A(tA+B)^{k-i} \right )$ ? 。

因為 AB = BA，我們可以將中間的 A 拉到左邊：

(5.4.18)

$\displaystyle \frac{d}{dt}{\left (\frac{(tA+B)^{k}}{k!} \right )}=kA\frac{(tA+B)^{k-1}}{k!}=A\frac{(tA+B)^{k-1}}{(k-1)!}$ ? 。

這是矩陣 A 與指數級數的 (k - 1) 次項之積。因此對 (5.4.17) 逐項微分即可得出?? $Ae^{tA+B}$ ??的級數。

為了驗證逐項微分，我們應用定理 (5.4.4) (a)。定理表明，對于已知的 A和 B ，指數級數?? $e^{tA+B}$ ??在任意區間 r ≤ t ≤ s? 一致收斂。此外，導數級數一致收斂于??? $Ae^{tA+B}$ ???。

根據定理 5.4.12 ，? $e^{tA+B}$ ??的導數可以逐項計算，因此對于任意可交換的矩陣對 A ，B ?，有

$\displaystyle \frac{d}{dt}{e^{tA+B}}=Ae^{tA+B}$ ? 。

取 B? = 0 可證明定理 (5.4.4) (b) 。

??? 接下來，我們復制定理 5.4.9 的證明中所使用的方法。我們微分乘積

$e^{-tA}e^{tA+B}$ ? ，同樣，假設 A和 B 可交換。同在 (5.4.10) 一樣，我們求得

$\displaystyle \frac{d}{dt}{\left (e^{-tA}e^{tA+B} \right )}=(-Ae^{-tA})(e^{tA+B})+(e^{-tA})(Ae^{tA+B})=0$ ? ?。

因此，?? $e^{-tA}e^{tA+B}=C$ ??，其中，C 是一個常量矩陣。令 t = 0 可證明? $e^{B}=C$ ???。令 B = 0 即證明?? ? $e^{-tA}=e^{(tA)^{-1}}$ ??。則?? $e^{(tA)^{-1}}e^{tA+B}=e^{B}$ ? 。令 t = 1 證明? $e^{A+B} = e^{A} e^{B}$ ??。這樣就證明了定理 (5.4.4)(c) 。

我們將在第 9 章中再次使用矩陣指數的顯著性質。

I have not thought it necessary to undertake the labour ofa formal proof of the theorem in the general case.( 我認為沒有必要對一般情況下的定理進行形式化證明。

----------------------------------------Arthur Cayley(注：Cayley-Hamilton以其名字命名的數學家之一,他在他的一篇論文中提出了 n × n ?矩陣的該定理，然后檢驗了 2×2 的情況(參見 5.2.4)。他用這里引用的這句話結束了對該定理的討論。)

內容來源：

<<Algebra>> ?Michael Artin, 2th