協方差矩陣
- 協方差矩陣
(從隨機變量講起)
隨機變量x:表示隨機試驗各種結果的 實值 單值函數,就是說隨機變量x是一個函數映射,其取值為標量。
隨機變量有離散型和連續型,離散型:拋10次硬幣,硬幣正面朝上的次數。連續型:某一地區一天內每一時刻的溫度。
隨機變量的性質由其統計量表示,常用的統計量有隨機變量的:均值與方差
離散型隨機變量x,取值序列{x1,x2,....,xn}\{x_1,x_2,....,x_n\}{x1?,x2?,....,xn?}的均值為:
μ=1n∑i=1nxi\mu=\frac{1}{n}\sum_{i=1}^nx_iμ=n1?i=1∑n?xi?
均值可以 量化 這個隨機變量值 大小。
離散型隨機變量x,取值序列{x1,x2,....,xn}\{x_1,x_2,....,x_n\}{x1?,x2?,....,xn?}的方差為:
σ=1n∑i=1n(xi?μ)2\sigma=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2σ=n1?i=1∑n?(xi??μ)2
方差表明取值序列的 離散程度。
當分析兩個隨機變量x,y之間關系的時候,協方差 的概念 由此引出:
兩個隨機變量取值序列{x1,x2,....,xn}\{x_1,x_2,....,x_n\}{x1?,x2?,....,xn?},{y1,y2,....,yn}\{y_1,y_2,....,y_n\}{y1?,y2?,....,yn?}之間的協方差:
cov(x,y)=1n∑i=1n(xi?μx)(yi?μy)cov(x,y)=\frac{1}{n}\sum_{i=1}^n(x_i-\mu_x)(y_i-\mu_y)cov(x,y)=n1?i=1∑n?(xi??μx?)(yi??μy?)
協方差矩陣
我們在實際中,經常會遇到協方差矩陣,給定一個n個d?1d*1d?1維的(列)向量數據{x1,x2,...,xn}\{\bm{x_1},\bm{x_2},...,\bm{x_n}\}{x1?,x2?,...,xn?},這組數據的協方矩陣為:
Σ=1n∑i=1n(xi?μ)(xi?μ)T\Sigma=\frac{1}{n}\sum_{i=1}^n(\bm{x_i}-\bm{\mu})(\bm{x_i}-\bm{\mu})^TΣ=n1?i=1∑n?(xi??μ)(xi??μ)T
其中:μ=1n∑xi\bm{\mu}=\frac{1}{n}\sum\bm{x_i}μ=n1?∑xi?
以上協方差矩陣Σ\SigmaΣ實際是記錄 以向量x\bm{x}x各個(d個)維度為隨機變量 的d個隨機變量之間的協方差。
xij\bm{x}_i^jxij?下標表示第iii個向量數據,上標表示第iii個向量的第jjj個分量,則Σ\SigmaΣ是一個d?dd*dd?d的矩陣:
Σ=1n∑[xi1?μ1xi2?μ2...xid?μd]?[xi1?μ1,xi2?μ2,...,xid?μd]\Sigma=\frac{1}{n}\sum \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1}\\ \bm{x_i^2}-\bm{\mu^2}\\ ...\\ \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right] * \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1} ,& \bm{x_i^2}-\bm{\mu^2},& ...,& \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right] Σ=n1?∑?????xi1??μ1xi2??μ2...xid??μd???????[xi1??μ1,?xi2??μ2,?...,?xid??μd?]
=1n∑[(xi1?μ1)(xi1?μ1),(xi1?μ1)(xi2?μ2),...,(xi1?μ1)(xid?μd)(xi2?μ2)(xi1?μ1),(xi2?μ2)(xi2?μ2),...,(xi2?μ2)(xid?μd)...(xid?μd)(xi1?μ1),(xid?μd)(xi2?μ2),...,(xid?μd)(xid?μd)]=\frac{1}{n}\sum \left[ \begin{matrix} ( \bm{x_i^1}-\bm{\mu^1})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^d}-\bm{\mu^d})\\ ( \bm{x_i^2}-\bm{\mu^2})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^d}-\bm{\mu^d})\\ ...\\ ( \bm{x_i^d}-\bm{\mu^d})( \bm{x_i^1}-\bm{\mu^1}) ,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^2}-\bm{\mu^2}),&...,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^d}-\bm{\mu^d})\\ \end{matrix} \right] =n1?∑?????(xi1??μ1)(xi1??μ1),(xi2??μ2)(xi1??μ1),...(xid??μd)(xi1??μ1),?(xi1??μ1)(xi2??μ2),(xi2??μ2)(xi2??μ2),(xid??μd)(xi2??μ2),?...,...,...,?(xi1??μ1)(xid??μd)(xi2??μ2)(xid??μd)(xid??μd)(xid??μd)??????
在PCA 算法中就需要對樣本協方差矩陣進行特征值分解。