
在幾個月以前,曾經有一位知乎好友邀請我回答一個問題:“如何證明馬爾可夫矩陣至少存在一個所有分量均不小于零的特征向量。”當時我思考了大概半個小時,給出了嚴謹的證明。事后由該問題引發我至少三度思考,對于此問題,我提出了幾個猜想,并最終證明、證偽了這些結論。本文章內容均是作者自己的研究成果,如有與其他人暗合之處,純屬巧合。如果有人通知到我,我也會及時作出響應。
在闡述馬爾可夫矩陣之前,我們先要清楚什么是馬爾可夫矩陣。
定義:若矩陣的任意一個列向量,所有分量均為非負數,并且所有分量的和為1,亦即所有列向量均滿足分量和為1,則稱該矩陣為馬爾可夫矩陣。
學過概率論的朋友應該都知道,馬爾可夫矩陣
即某一個狀態轉移到各個狀態的總概率為1,且概率永遠不能小于零,這便是馬爾可夫矩陣定義的由來,在概率論與數理統計中有著重要的意義。
現將馬爾可夫矩陣的若干研究成果羅列如下,隨后給出證明(限于篇幅問題,證明的過程不一定是100%公式化的,但是思想和過程絕對是嚴謹的。)
- 對于馬爾可夫矩陣的任意一個特征值
, 均有
- 馬爾可夫矩陣所對應的變換不改變向量的分量之和
- 馬爾可夫矩陣的所有分量和不為零的向量的特征值必然為
- 馬爾可夫矩陣至少存在一個所有分量均不小于零的特征向量,并且由上一條立即可知它的特征值為
,將該向量的分量和歸一化以后得到的向量記為
- 馬爾可夫矩陣的全體分量和為零的向量構成馬爾可夫變換的不變子空間,我們將該子空間記為
, 將空間記為
- 向量空間可以寫成第4條中所述向量
與
的直和,即
- 對于任意一個矩陣
為馬爾可夫矩陣的充分必要條件是將集合
依舊映射到該集合上。
- 定義
,
為馬爾可夫矩陣的充分必要條件是
存在一個特征值為
且各個分量均不小于
的特征向量,并且
將
上的元素依舊映射到
上。
- 馬爾可夫變換在
上可能存在虧損現象,因此馬爾可夫矩陣存在不能對角化的情況(后面會構造反例,并陳述反例的構造思路)
下面我們來證明這些結論:
1.我們先將馬爾可夫矩陣
而
2.設
因此馬爾可夫矩陣不改變向量的分量和。其實道理很簡單,因為矩陣的每一列和均為1,用向量
3.對于特征向量
其中
4.此條就是當初知友提問的問題,即如何證明馬爾可夫矩陣存在各分量均不小于零的特征向量。我們知道馬爾可夫矩陣所有元素均為非負,且馬爾可夫變換保證向量的分量和不變,因此在馬爾可夫變換下向量集
的像集依然在該集合內部,因此必然存在不動點,該不動點就是我們要找的特征向量。證明該映射存在不動點,如果嚴格用數學語言論述篇幅不小。限于篇幅問題,我在這里只詳細闡述思路,細節由感興趣的讀者自行思考或補充。顯然對于二維空間該集合就是一個線段,由線段到線段上的連續映射,顯然存在不動點;對于三維空間,該集合是一個三角形,三角形的拓撲結構與矩形是相同的,因此只需要證明矩形到矩形的連續映射存在不動點即可。而證明矩形存在映射不動點,顯然可先證明存在一條經過映射以后縱坐標不變的曲線,而這條曲線經過映射的像又全部在該曲線上,因此必然存在不動點。對于
5.首先,分量和為零的全部向量關于加法和數乘封閉,因此它是一個子空間;其次,馬爾可夫變換不改變向量的分量和,因此該子空間是不變子空間。
6.因為不變子空間
7.首先,必要性顯然,此結論我們在證明第4條時已經用過。現在證明充分性,只需證明所有元素均不小于零并且所有列向量的分量和為
這與假設產生矛盾。假定
也與假設產生矛盾。
8. 由于第6條,任意一個向量
其中,
顯然
9.本條結論是困擾我時間較長的結論,此問題經過三度思考,最終在某一天回家的路上產生靈感,悟出第7條結論,從而成功構造出不能對角化的反例。有了第7條結論,我們只需要構造出一個在集合上
并假定
在基矢
則特征向量構成的矩陣為
其逆矩陣為
因此有
如此我們便構造出了不可對角化的馬爾可夫矩陣。
我們討論一下向量
其中
其中
當
其中
最后,希望感興趣的朋友關注我的知乎專欄數學妙談,高等代數精深簡明講義,以及公眾號丞申通匯文化平臺,私人電話:18612313613(微信同)