文章目錄
- 1 Hermite矩陣
- 2 Hermite二次型
- 3 Hermite正定(非負定矩陣)
- 4 矩陣不等式
1 Hermite矩陣
-
定義
設 A A A為 n n n階方陣,如果稱 A A A為Hermite矩陣,則需滿足 A H = A A^H=A AH=A,其中 A H A^H AH表示 A A A的共軛轉置,也稱Hermite轉置,具體操作如下:
- 將矩陣的每個元素取共軛。對于復數 a + b i a+bi a+bi,它的共軛是 a ? b i a-bi a?bi,其中 a a a和 b b b 是實部和虛部
- 將矩陣的行和列互換
Hermite矩陣與實對稱矩陣的性質和證明方法都十分相似
-
Hermite矩陣性質
若 A , B A,B A,B為 n n n階Hermite矩陣,則
- A A A的所有特征值全是實數
- A A A的不同特征值所對應的特征向量是相互正交的
- 對正整數 k k k, A k A^k Ak也是Hermite矩陣
- 若 A A A可逆,則 A ? 1 A^{-1} A?1也是Hermite矩陣
- 對實數 k , p , k A + p B k,p,kA+pB k,p,kA+pB也是Hermite矩陣
-
Hermite矩陣充分必要條件
設 A ∈ C n × n , B ∈ C n × n A\in C^{n\times n},B\in C^{n\times n} A∈Cn×n,B∈Cn×n
-
A A A是Hermite矩陣的充要條件是存在酉矩陣 U U U使得
U H A U = Λ = d i a g ( λ 1 , . . . , λ n ) U^HAU=\Lambda =diag(\lambda_1,...,\lambda_n) UHAU=Λ=diag(λ1?,...,λn?)
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?均為實數。實對稱矩陣則是存在正交矩陣 U . . . U... U... -
A是Hermite矩陣的充要條件是對任意方陣 S S S, S H A S S^HAS SHAS是Hermite矩陣
-
如果 A , B A,B A,B是Hermite陣,則 A B AB AB是Hermite矩陣的充要條件是 A B = B A AB=BA AB=BA
-
-
相合標準形
設 A A A為 n n n階Hermite矩陣,則 A A A相合矩陣
D 0 = ( I s 0 0 0 ? I r ? s 0 0 0 O n ? r ) D_0=\begin{pmatrix} I_s & 0 & 0 \\ 0 & -I_{r-s} & 0 \\ 0 & 0 & O_{n-r} \end{pmatrix} D0?= ?Is?00?0?Ir?s?0?00On?r?? ?
其中 r = r a n k ( A ) r=rank(A) r=rank(A), s s s是 A A A的正特征值(重特征值按重數計算)的個數。矩陣 D 0 D_0 D0?則稱為 n n n階Hermite矩陣 A A A的相合標準形。 -
Sylvester慣性定律
設 A , B A,B A,B為 n n n階Hermite矩陣,則 A A A與 B B B相合的充要條件是
I n ( A ) = I n ( B ) In(A)=In(B) In(A)=In(B)
其中 I n ( A ) In(A) In(A)稱為 A A A的慣性, I n ( A ) = { π ( A ) , v ( A ) , δ ( A ) } In(A)=\{\pi(A),v(A),\delta(A)\} In(A)={π(A),v(A),δ(A)}。其中 π ( A ) \pi(A) π(A), v ( A ) v(A) v(A), δ ( A ) \delta(A) δ(A)分別表示 A A A的正、負和零特征值的個數(重特征值按重數計算)。則 A A A非奇異的充要條件為 δ ( A ) = 0 \delta(A)=0 δ(A)=0且 π ( A ) + v ( A ) = r a n k ( A ) \pi(A)+v(A)=rank(A) π(A)+v(A)=rank(A)。
2 Hermite二次型
-
Hermite二次型定義
由 n n n個復變量 x 1 , . . . , x n x_1,...,x_n x1?,...,xn?,系數為負數的二次齊式
f ( x 1 , . . . , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i ˉ x j ˉ f(x_1,...,x_n)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}\bar{x_i}\bar{x_j} f(x1?,...,xn?)=i=1∑n?j=1∑n?aij?xi?ˉ?xj?ˉ?
其中 a i j = a j i a_{ij}=a_{ji} aij?=aji?,稱為Hermite二次型。Hermite二次型可寫為 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,我們稱 A A A的秩就為Hermite二次型的秩。 -
Hermite二次型的標準形定理
對Hermite二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在酉線性變換 x = U y x=Uy x=Uy(其中 U U U是酉矩陣)使得Hermite二次型 f ( x ) f(x) f(x)變成標準形(只包含平方項的二次型)
f ( x ) = λ 1 y 1 ˉ y 1 + . . . + λ n y n ˉ y n f(x)=\lambda_1\bar{y_1}y_1+...+\lambda_n\bar{y_n}y_n f(x)=λ1?y1?ˉ?y1?+...+λn?yn?ˉ?yn?
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?為 A A A的特征值。 -
Hermite二次型化標準形(酉線性變換)
設 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A為 n n n階Hermite矩陣
-
求出二次型矩陣 A A A的特征值 λ 1 , . . . λ n \lambda_1,...\lambda_n λ1?,...λn?和特征向量 v 1 , . . . , v n v_1,...,v_n v1?,...,vn?,并將特征向量 v 1 , . . . , v n v_1,...,v_n v1?,...,vn?規范正交
-
令 U = ( v 1 , . . . , v n ) , x = U y U=(v_1,...,v_n),x=Uy U=(v1?,...,vn?),x=Uy,則
f ( x ) = ( U y ) H A ( U y ) = y H U H A U y = y H ( U H A U ) y = y H Λ y = λ 1 ∣ y 1 ∣ 2 + . . . + λ n ∣ y n ∣ 2 f(x)=(Uy)^HA(Uy)=y^HU^HAUy=y^H(U^HAU)y\\=y^H\Lambda y=\lambda_1|y_1|^2+...+\lambda_n|y_n|^2 f(x)=(Uy)HA(Uy)=yHUHAUy=yH(UHAU)y=yHΛy=λ1?∣y1?∣2+...+λn?∣yn?∣2
-
-
Hermite二次型規范形定理
對二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在可逆線性變換 x = P y x=Py x=Py使得Hermite二次型 f ( x ) f(x) f(x)化為
f ( x ) = y 1 ˉ y 1 + . . . + y s ˉ y s ? y s + 1 ˉ y s + 1 ? . . . ? y r ˉ y r f(x)=\bar{y_1}y_1+...+\bar{y_s}y_s-\bar{y_{s+1}}y_{s+1}-...-\bar{y_r}y_r f(x)=y1?ˉ?y1?+...+ys?ˉ?ys??ys+1?ˉ?ys+1??...?yr?ˉ?yr?
其中 r = r a n k ( A ) , s = π ( A ) r=rank(A),s=\pi(A) r=rank(A),s=π(A)。上式則為Hermite二次型 f ( x ) f(x) f(x)的規范形,其中 s s s和 ( r ? s ) (r-s) (r?s)分別稱為Hermite二次型的正慣性指數和負慣性指數。 -
二次型化規范形
設 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A為 n n n階Hermite矩陣
-
將二次型化為標準形,得到標準形 f ( x ) = y H Λ y f(x)=y^H\Lambda y f(x)=yHΛy和酉矩陣 U U U
-
將對角線元素提取出來,即只保留 λ i \lambda_i λi?的正負性,則
f ( x ) = y H Λ y = y H ( Λ 1 D 0 Λ 1 ) y = y H ( Λ 1 H D 0 Λ 1 ) y = ( Λ 1 y ) H D 0 ( Λ 1 y ) f(x)=y^H\Lambda y=y^H(\Lambda_1 D_0 \Lambda_1)y=y^H(\Lambda_1^HD_0\Lambda_1)y\\ =(\Lambda_1y)^HD_0(\Lambda_1y) f(x)=yHΛy=yH(Λ1?D0?Λ1?)y=yH(Λ1H?D0?Λ1?)y=(Λ1?y)HD0?(Λ1?y)
其中 Λ 1 \Lambda_1 Λ1?為對角矩陣,對角線元素為 ∣ λ i ∣ ( 1 ≤ i ≤ n ) \sqrt {|\lambda_i}|(1\leq i \leq n) ∣λi??∣(1≤i≤n)。 -
令 y = Λ 1 ? 1 z y=\Lambda_1^{-1} z y=Λ1?1?z,則
f ( x ) = ( Λ 1 Λ 1 ? 1 z ) H D 0 ( Λ 1 Λ 1 ? 1 z ) = z H D 0 z = z 1 ˉ z 1 + . . . + z s ˉ y s ? z s + 1 ˉ z s + 1 ? . . . ? z r ˉ z r f(x)=(\Lambda_1\Lambda_1^{-1}z)^HD_0(\Lambda_1\Lambda_1^{-1}z)=z^HD_0z\\=\bar{z_1}z_1+...+\bar{z_s}y_s-\bar{z_{s+1}}z_{s+1}-...-\bar{z_r}z_r f(x)=(Λ1?Λ1?1?z)HD0?(Λ1?Λ1?1?z)=zHD0?z=z1?ˉ?z1?+...+zs?ˉ?ys??zs+1?ˉ?zs+1??...?zr?ˉ?zr? -
故 x = U Λ ? 1 z x=U\Lambda^{-1}z x=UΛ?1z,可逆矩陣 P = U Λ ? 1 P=U\Lambda^{-1} P=UΛ?1
-
-
正定相關概念
設 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx為Hermite二次型
- 如果 f ( x ) > 0 f(x)>0 f(x)>0(等價 s = r = n s=r=n s=r=n),則稱 f ( x ) f(x) f(x)為正定的;
- 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)≥0(等價 s = r < n s=r<n s=r<n),則稱 f ( x ) f(x) f(x)為半正定(非負定的)的;
- 如果 f ( x ) < 0 f(x)<0 f(x)<0(等價 s = 0 , r = n s=0,r=n s=0,r=n),則稱 f ( x ) f(x) f(x)為負定的;
- 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)≤0(等價 s = 0 , r < n s=0,r<n s=0,r<n),則稱 f ( x ) f(x) f(x)為半負定的;
- 如果 f ( x ) f(x) f(x)有時為正有時為負(等價 0 < s < r ≤ n 0<s<r\leq n 0<s<r≤n),則稱 f ( x ) f(x) f(x)為不定的;
3 Hermite正定(非負定矩陣)
-
定義
根據Hermite二次型的正定(非負定)可以定義Hermite矩陣的正定(非負定)。
設 A A A為 n n n階Hermite矩陣, f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx
- 如果 f ( x ) > 0 f(x)>0 f(x)>0,則稱 A A A為正定的,記作 A > 0 A>0 A>0;
- 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)≥0,則稱 A A A為半正定(非負定的)的,記作 A ≥ 0 A\geq 0 A≥0;
- 如果 f ( x ) < 0 f(x)<0 f(x)<0,則稱 A A A為負定的,記作 A < 0 A<0 A<0;
- 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)≤0,則稱 A A A為半負定的,記作 A ≤ 0 A\leq 0 A≤0;
- 如果 f ( x ) f(x) f(x)有時為正有時為負,則稱 A A A為不定的;
-
判斷 n n n階Hermite矩陣 A A A正定
- 通過正定矩陣的定義
- A A A的 n n n個特征值均為正數
- A A A的順序主子式 Δ k = A ( 1 … k 1 … k ) > 0 , ( k = 1 , . . . , n ) \Delta_k=A\begin{pmatrix}1&\dots&k\\1&\dots&k\end{pmatrix}>0,(k=1,...,n) Δk?=A(11?……?kk?)>0,(k=1,...,n)均為正數
- A A A的所有主子式全大于 0 0 0
- 存在 n n n階非奇異下三角矩陣 L L L,使得 A = L L H A=LL^H A=LLH(該分解稱為Cholesky分解)
- 存在 n n n階非奇異矩陣,使得 A = B H B A=B^HB A=BHB
- 存在 n n n階非奇異Hermite矩陣 A = S 2 A=S^2 A=S2
-
判斷 n n n階Hermite矩陣 A A A半正定
- 通過半正定矩陣的定義
- A A A的 n n n個特征值均為非負數
- A A A的所有主子式均非負
-
定理證明
設 A , B A,B A,B均為 n n n階Hermite矩陣,且 B > 0 B>0 B>0,則存在非奇異矩陣 P P P使得
P H A P = d i a g ( λ 1 , . . . , λ n ) , P H B P = I P^HAP=diag(\lambda_1,...,\lambda_n),P^HBP=I PHAP=diag(λ1?,...,λn?),PHBP=I
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?是廣義特征值問題的特征值證明:
∵ B > 0 \because B >0 ∵B>0
$\therefore 存在非奇異矩陣 存在非奇異矩陣 存在非奇異矩陣P_1 使得 使得 使得P_1^HBP_1=I$
又 ∵ P 1 H A P 1 \because P_1^HAP_1 ∵P1H?AP1?仍為
Hermite
矩陣∴ \therefore ∴酉矩陣 U U U使得
U H ( P 1 H A P 1 ) U = d i a g ( λ 1 , . . . , λ n ) U^H(P_1^HAP_1)U=diag(\lambda_1,...,\lambda_n) UH(P1H?AP1?)U=diag(λ1?,...,λn?)
令 P = P 1 U P=P_1U P=P1?U∵ P \because P ∵P非奇異,根據定理 P H B P = I P^HBP=I PHBP=I
∴ P H B P = ( P 1 U ) H B ( P 1 U ) = U H P 1 H B P 1 U = I \therefore P^HBP=(P_1U)^HB(P_1U)\\=U^HP_1^HBP_1U=I ∴PHBP=(P1?U)HB(P1?U)=UHP1H?BP1?U=I
又 ∵ P 1 \because P_1 ∵P1?非奇異,使得 P 1 H B P 1 = I P_1^HBP_1=I P1H?BP1?=I
∴ \therefore ∴
P H B P = U H P 1 H B P 1 U = U H ( P 1 H B P 1 ) U = U H I U = U H U = I P^HBP= U^HP_1^HBP_1U=U^H(P_1^HBP_1)U\\=U^HIU=U^HU=I PHBP=UHP1H?BP1?U=UH(P1H?BP1?)U=UHIU=UHU=I
∴ \therefore ∴
P H A P = U H P 1 H A P 1 U = d i a g ( λ 1 , . . . , λ n ) P^HAP=U^HP_1^HAP_1U=diag(\lambda_1,...,\lambda_n) PHAP=UHP1H?AP1?U=diag(λ1?,...,λn?)
∴ \therefore ∴我們可以對上式右乘 P ? 1 P^{-1} P?1和 B ? 1 B^{-1} B?1,得到
P H B P = I P H = P ? 1 B ? 1 P^HBP=I \\ P^H=P^{-1}B^{-1} PHBP=IPH=P?1B?1
∴ \therefore ∴ 得到
P ? 1 B ? 1 A P = d i a g ( λ 1 , . . . , λ n ) P^{-1}B^{-1}AP=diag(\lambda_1,...,\lambda_n) P?1B?1AP=diag(λ1?,...,λn?)
即 B ? 1 A B^{-1}A B?1A相似于對角矩陣,故 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?是矩陣 B ? 1 A B^{-1}A B?1A的特征值,即 λ 1 , . . . , λ n ) \lambda_1,...,\lambda_n) λ1?,...,λn?)是廣義特征值問題的特征值。廣義特征值問題 A x = λ B x Ax=\lambda Bx Ax=λBx,左乘 B ? 1 B^{-1} B?1,即為 B ? 1 A x = λ x B^{-1}Ax=\lambda x B?1Ax=λx
4 矩陣不等式
-
定義
設 A , B A,B A,B都是 n n n階Hermite矩陣,如果 A ? B ≥ 0 A-B\geq 0 A?B≥0則稱 A A A大于或等于 B B B(或稱 B B B小于等于 A A A),記作 A ≥ B A\geq B A≥B(或 B ≤ A B\leq A B≤A),即 A ? B A-B A?B半正定;如果 A ? B > 0 A-B>0 A?B>0,則稱 A A A大于 B B B(或稱 B B B小于 A A A),記作 A > B A>B A>B(或 B < A B<A B<A),即== A ? B A-B A?B正定==。
-
性質
設 A , B , C A,B,C A,B,C均為 n n n階Hermite矩陣,則
- A ≥ B ( A > B ) ? ? A ≤ ? B ( ? A < ? B ) ? A\geq B(A>B) \Longleftrightarrow-A\leq -B(-A<-B)\Longleftrightarrow A≥B(A>B)??A≤?B(?A<?B)?對任意 n n n階可逆矩陣 P P P都有 P H A P ≥ P H B P ( P H A P > P H B P ) P^HAP\geq P^HBP(P^HAP>P^HBP) PHAP≥PHBP(PHAP>PHBP)
- 若 A > 0 ( A ≥ 0 ) , C > 0 ( C ≥ 0 ) A>0(A\geq 0),C>0(C\geq 0) A>0(A≥0),C>0(C≥0),且 A C = C A AC=CA AC=CA,則 A C > 0 ( A C ≥ 0 ) AC>0(AC\geq 0) AC>0(AC≥0)
- 若 A > B A>B A>B, P P P為 n × m n\times m n×m列滿秩矩陣,則 P H A P > P H B P P^HAP>P^HBP PHAP>PHBP
- 若 A ≥ B A\geq B A≥B, P P P為 n × m n\times m n×m矩陣,則 P H A P ≥ P H B P P^HAP\geq P^HBP PHAP≥PHBP
-
定理
設 A , B A,B A,B都是 n n n階Hermite矩陣,且 A ≥ 0 , B > 0 A\geq 0,B>0 A≥0,B>0,則
- B ≥ A B\geq A B≥A的充要條件是 ρ ( A B ? 1 ) ≤ 1 \rho(AB^{-1})\leq 1 ρ(AB?1)≤1
- B > A B>A B>A的充要條件是 ρ ( A B ? 1 ) < 1 \rho(AB^{-1})<1 ρ(AB?1)<1
設 A A A是 n n n階Hermite矩陣,則 λ m i n ( A ) I ≤ A ≤ λ m a x I \lambda_{min}(A)I\leq A\leq\lambda_{max}I λmin?(A)I≤A≤λmax?I,這時 λ m i n \lambda_{min} λmin?和 λ m a x \lambda_{max} λmax?分別表示 A A A的最大和最小特征值。
設 A , B A,B A,B均為 n n n階Hermite正定矩陣,則
- 若 A ≥ B > 0 A\geq B>0 A≥B>0,則 B ? 1 ≥ A ? 1 > 0 B^{-1}\geq A^{-1}>0 B?1≥A?1>0
- 若 A > B > 0 A>B>0 A>B>0,則 B ? 1 > A ? 1 > 0 B^{-1}>A^{-1}>0 B?1>A?1>0
設 A , B A,B A,B均為 n n n階Hermite正定矩陣,且 A B = B A AB=BA AB=BA,則
-
若 A ≥ B A\geq B A≥B,則 A 2 ≥ B 2 A^2\geq B^2 A2≥B2
證明: A 2 ? B 2 = ( A ? B ) ( A + B ) = ( A + B ) ( A ? B ) A^2-B^2=(A-B)(A+B)=(A+B)(A-B) A2?B2=(A?B)(A+B)=(A+B)(A?B),易知 ( A ? B ) ≥ 0 , A + B > 0 (A-B)\geq0,A+B>0 (A?B)≥0,A+B>0,則克制
-
若 A ≥ B A\geq B A≥B,則 A 2 > B 2 A^2> B^2 A2>B2
同理得證
設 A A A是 m × n m\times n m×n行滿秩矩陣, B B B是 n × k n\times k n×k矩陣,則
B H B ≥ ( A B ) H ( A A H ) ? 1 ( A B ) B^HB\geq (AB)^H(AA^H)^{-1}(AB) BHB≥(AB)H(AAH)?1(AB)
等號成立當且僅當存在一個 m × k m\times k m×k矩陣 C C C使得 B = A H C B=A^HC B=AHC