學點數學(4)-協方差矩陣

協方差矩陣

協方差矩陣

（從隨機變量講起）
隨機變量x：表示隨機試驗各種結果的實值單值函數，就是說隨機變量x是一個函數映射，其取值為標量。

隨機變量有離散型和連續型，離散型：拋10次硬幣，硬幣正面朝上的次數。連續型：某一地區一天內每一時刻的溫度。

隨機變量的性質由其統計量表示，常用的統計量有隨機變量的：均值與方差

離散型隨機變量x,取值序列 ${x_1,x_2,....,x_n\}$ 的均值為：
$μ=1n∑i=1nxi\mu=\frac{1}{n}\sum_{i=1}^nx_i$
均值可以量化這個隨機變量值大小。

離散型隨機變量x,取值序列 ${x_1,x_2,....,x_n\}$ 的方差為：
$σ=1n∑i=1n(xi?μ)2\sigma=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2$
方差表明取值序列的 離散程度。

當分析兩個隨機變量x,y之間關系的時候，協方差 的概念由此引出:
兩個隨機變量取值序列 ${x_1,x_2,....,x_n\}$ , ${y_1,y_2,....,y_n\}$ 之間的協方差：
$cov(x,y)=1n∑i=1n(xi?μx)(yi?μy)cov(x,y)=\frac{1}{n}\sum_{i=1}^n(x_i-\mu_x)(y_i-\mu_y)$

協方差矩陣

我們在實際中，經常會遇到協方差矩陣，給定一個n個 $d ? 1$ 維的(列)向量數據 ${x1,x2,...,xn}\{\bm{x_1},\bm{x_2},...,\bm{x_n}\}$ ,這組數據的協方矩陣為:
$Σ=1n∑i=1n（xi?μ）(xi?μ)T\Sigma=\frac{1}{n}\sum_{i=1}^n（\bm{x_i}-\bm{\mu}）(\bm{x_i}-\bm{\mu})^T$
其中： $μ=1n∑xi\bm{\mu}=\frac{1}{n}\sum\bm{x_i}$

以上協方差矩陣 $Σ\Sigma$ 實際是記錄以向量 $x\bm{x}$ 各個（d個）維度為隨機變量的d個隨機變量之間的協方差。

$xij\bm{x}_i^j$ 下標表示第 $i$ 個向量數據，上標表示第 $i$ 個向量的第 $j$ 個分量，則 $Σ\Sigma$ 是一個 $d ? d$ 的矩陣：
$Σ=1n∑[xi1?μ1xi2?μ2...xid?μd]?[xi1?μ1,xi2?μ2,...,xid?μd]\Sigma=\frac{1}{n}\sum \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1}\\ \bm{x_i^2}-\bm{\mu^2}\\ ...\\ \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right] * \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1} ,& \bm{x_i^2}-\bm{\mu^2},& ...,& \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right]$

$=1n∑[(xi1?μ1)(xi1?μ1),(xi1?μ1)(xi2?μ2),...,(xi1?μ1)(xid?μd)(xi2?μ2)(xi1?μ1),(xi2?μ2)(xi2?μ2),...,(xi2?μ2)(xid?μd)...(xid?μd)(xi1?μ1),(xid?μd)(xi2?μ2),...,(xid?μd)(xid?μd)]=\frac{1}{n}\sum \left[ \begin{matrix} ( \bm{x_i^1}-\bm{\mu^1})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^d}-\bm{\mu^d})\\ ( \bm{x_i^2}-\bm{\mu^2})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^d}-\bm{\mu^d})\\ ...\\ ( \bm{x_i^d}-\bm{\mu^d})( \bm{x_i^1}-\bm{\mu^1}) ,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^2}-\bm{\mu^2}),&...,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^d}-\bm{\mu^d})\\ \end{matrix} \right]$

在PCA 算法中就需要對樣本協方差矩陣進行特征值分解。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/445072.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/445072.shtml
英文地址，請注明出處：http://en.pswp.cn/news/445072.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！