學點數學(4)-協方差矩陣

協方差矩陣

  • 協方差矩陣

(從隨機變量講起)
隨機變量x:表示隨機試驗各種結果的 實值 單值函數,就是說隨機變量x是一個函數映射,其取值為標量。

隨機變量有離散型和連續型,離散型:拋10次硬幣,硬幣正面朝上的次數。連續型:某一地區一天內每一時刻的溫度。

隨機變量的性質由其統計量表示,常用的統計量有隨機變量的:均值方差

離散型隨機變量x,取值序列{x1,x2,....,xn}\{x_1,x_2,....,x_n\}{x1?,x2?,....,xn?}的均值為:
μ=1n∑i=1nxi\mu=\frac{1}{n}\sum_{i=1}^nx_iμ=n1?i=1n?xi?
均值可以 量化 這個隨機變量值 大小。

離散型隨機變量x,取值序列{x1,x2,....,xn}\{x_1,x_2,....,x_n\}{x1?,x2?,....,xn?}的方差為:
σ=1n∑i=1n(xi?μ)2\sigma=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2σ=n1?i=1n?(xi??μ)2
方差表明取值序列的 離散程度

當分析兩個隨機變量x,y之間關系的時候,協方差 的概念 由此引出:
兩個隨機變量取值序列{x1,x2,....,xn}\{x_1,x_2,....,x_n\}{x1?,x2?,....,xn?},{y1,y2,....,yn}\{y_1,y_2,....,y_n\}{y1?,y2?,....,yn?}之間的協方差:
cov(x,y)=1n∑i=1n(xi?μx)(yi?μy)cov(x,y)=\frac{1}{n}\sum_{i=1}^n(x_i-\mu_x)(y_i-\mu_y)cov(x,y)=n1?i=1n?(xi??μx?)(yi??μy?)

協方差矩陣

我們在實際中,經常會遇到協方差矩陣,給定一個n個d?1d*1d?1維的(列)向量數據{x1,x2,...,xn}\{\bm{x_1},\bm{x_2},...,\bm{x_n}\}{x1?,x2?,...,xn?},這組數據的協方矩陣為:
Σ=1n∑i=1n(xi?μ)(xi?μ)T\Sigma=\frac{1}{n}\sum_{i=1}^n(\bm{x_i}-\bm{\mu})(\bm{x_i}-\bm{\mu})^TΣ=n1?i=1n?xi??μ(xi??μ)T
其中:μ=1n∑xi\bm{\mu}=\frac{1}{n}\sum\bm{x_i}μ=n1?xi?

以上協方差矩陣Σ\SigmaΣ實際是記錄 以向量x\bm{x}x各個(d個)維度為隨機變量 的d個隨機變量之間的協方差。

xij\bm{x}_i^jxij?下標表示第iii個向量數據,上標表示第iii個向量的第jjj個分量,則Σ\SigmaΣ是一個d?dd*dd?d的矩陣:
Σ=1n∑[xi1?μ1xi2?μ2...xid?μd]?[xi1?μ1,xi2?μ2,...,xid?μd]\Sigma=\frac{1}{n}\sum \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1}\\ \bm{x_i^2}-\bm{\mu^2}\\ ...\\ \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right] * \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1} ,& \bm{x_i^2}-\bm{\mu^2},& ...,& \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right] Σ=n1??????xi1??μ1xi2??μ2...xid??μd???????[xi1??μ1,?xi2??μ2,?...,?xid??μd?]

=1n∑[(xi1?μ1)(xi1?μ1),(xi1?μ1)(xi2?μ2),...,(xi1?μ1)(xid?μd)(xi2?μ2)(xi1?μ1),(xi2?μ2)(xi2?μ2),...,(xi2?μ2)(xid?μd)...(xid?μd)(xi1?μ1),(xid?μd)(xi2?μ2),...,(xid?μd)(xid?μd)]=\frac{1}{n}\sum \left[ \begin{matrix} ( \bm{x_i^1}-\bm{\mu^1})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^d}-\bm{\mu^d})\\ ( \bm{x_i^2}-\bm{\mu^2})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^d}-\bm{\mu^d})\\ ...\\ ( \bm{x_i^d}-\bm{\mu^d})( \bm{x_i^1}-\bm{\mu^1}) ,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^2}-\bm{\mu^2}),&...,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^d}-\bm{\mu^d})\\ \end{matrix} \right] =n1??????(xi1??μ1)(xi1??μ1),(xi2??μ2)(xi1??μ1),...(xid??μd)(xi1??μ1),?(xi1??μ1)(xi2??μ2),(xi2??μ2)(xi2??μ2),(xid??μd)(xi2??μ2),?...,...,...,?(xi1??μ1)(xid??μd)(xi2??μ2)(xid??μd)(xid??μd)(xid??μd)??????

在PCA 算法中就需要對樣本協方差矩陣進行特征值分解。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/445072.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/445072.shtml
英文地址,請注明出處:http://en.pswp.cn/news/445072.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

RedLock

概念 Redis 官方站這篇文章提出了一種權威的基于 Redis 實現分布式鎖的方式名叫 Redlock,此種方式比原先的單節點的方法更安全。它可以保證以下特性: 安全特性:互斥訪問,即永遠只有一個 client 能拿到鎖避免死鎖:最終…

GCC中常用的優化的參數

-pipe 的作用: 使用管道代替編譯中臨時文件, -pipe 加速編譯 gcc -pipe foo.c -o foo 加速 在將源代碼變成可執行文件的過程中,需要經過許多中間步驟,包含預處理、編譯、匯編和連接。這些過程實際上是由不同的程序負責完成的。大多數情況下 GCC 可以為 …

Linux與時間相關的結構體及相關用法

1. Linux下與時間有關的結構體 struct timeval { int tv_sec; int tv_usec; }; 其中tv_sec是由凌晨開始算起的秒數,tv_usec則是微秒(10E-6 second)。 struct timezone { …

算法(3)-數據結構-數組和字符串

leetcode-explore-learn-數據結構-數據結構-數組和字符串1. 一維數組1.0 概況1.1 尋找數組的中心索引1.2 搜索插入位置1.3 合并區間1.4 至少是其他數字兩倍大的最大數1.5 加一2. 二維數組2.1旋轉矩陣本系列博文為leetcode-explore-learn子欄目學習筆記,如有不詳之處…

redis的入門/原理/實戰大總結

入門 Redis是一款基于鍵值對的NoSQL數據庫,它的值支持多種數據結構: 字符串(strings)、哈希(hashes)、列表(lists)、集合(sets)、有序集合(sorted sets)等。 ? Redis將所有的數據都存放在內存中,所以它的讀寫性能十分驚人,用作數…

創建與打開IPC通道的POSIX和SYSTEM V方法

先說POSIX的吧: mq_open,sem_open,shm_open著三個函數用于創建或者打開一個IPC通道。 由此可見,消息隊列的讀寫權限是任意的,然而信號燈就沒有,…

算法(4)-leetcode-explore-learn-數據結構-數組2

leetcode-explore-learn-數據結構-數組21.簡述2.例題2.1 二維數組的對角線遍歷2.2 螺旋遍歷2.3 楊輝三角本系列博文為leetcode-explore-learn子欄目學習筆記,如有不詳之處,請參考leetcode官網:https://leetcode-cn.com/explore/learn/card/ar…

軟件測試基礎知識

第一章 1.1 軟件測試背景知識和發展史 互聯網公司職位架構:產品 運營 技術 市場 行政軟件測試:使用人工或自動化手段,來運行或測試某個系統的過程,其目的在于檢驗它是否滿足規定的需求或弄清預期結果與實際結果之間的差別&#…

key_t IPC鍵和ftok函數詳解和剖析

統建立IPC通訊(如消息隊列、共享內存時)必須指定一個ID值。通常情況下,該id值通過ftok函數得到。 ftok原型如下: key_t ftok( char * fname, int id ) fname就時你指定的文件名(該文件必須是存在而且可以訪問的),id是子…

算法(5)-leetcode-explore-learn-數據結構-字符串

leetcode-explore-learn-數據結構-數組3-字符串1.簡述2.例題2.1 二進制求和2.2實現strStr()2.3最長公共前綴本系列博文為leetcode-explore-learn子欄目學習筆記,如有不詳之處,請參考leetcode官網:https://leetcode-cn.com/explore/learn/card…

ipcs命令查看管道,消息隊列,共享內存

修改消息隊列大小: root:用戶: /etc/sysctl.conf kernel.msgmnb 4203520 #kernel.msgmnb 3520 kernel.msgmni 2878 保存后需要執行 sysctl -p ,然后重建所有消息隊列 ipcs -q : 顯示所有的消息隊列 ipcs -qt : 顯示消息隊列的創建時…

Jmeter-基礎篇

常用壓力測試工具對比 1、loadrunner 性能穩定,壓測結果及細粒度大,可以自定義腳本進行壓測,但是太過于重大,功能比較繁多 2、apache ab(單接口壓測最方便) 模擬多線程并發請求,ab命令對發出負載的計算機…

消息隊列接口API(posix 接口和 system v接口)

消息隊列 posix API消息隊列(也叫做報文隊列)能夠克服早期unix通信機制的一些缺點。信號這種通信方式更像\"即時\"的通信方式,它要求接受信號的進程在某個時間范圍內對信號做出反應,因此該信號最多在接受信號進程的生命…

算法(6)-leetcode-explore-learn-數據結構-數組字符串的雙指針技巧

leetcode-explore-learn-數據結構-數組4-雙指針技巧1.雙指針技巧--適用情形11.1概述1.2 例題1.2.1 反轉字符串1.2.2數組拆分1.2.3 兩數之和22雙指針技巧-適用情形22.1概述2.2例題2.2.1 移除元素2.2.2 最大連續1的個數2.2.3長度最小的子數組本系列博文為leetcode-explore-learn子…

POSIX和SYSTEM的消息隊列應該注意的問題

首先看看POSIX的代碼&#xff1a; 1.posix_mq_server.c #include <mqueue.h> #include <sys/stat.h> #include <string.h> #include <stdio.h> #define MQ_FILE "/mq_test" #define BUF_LEN 128 int main() { mqd_t mqd; char b…

算法(7)-leetcode-explore-learn-數據結構-數組-小結

leetcode-explore-learn-數據結構-數組5-小結1.概述2.例題2.1旋轉數組2.2 楊輝三角22.3翻轉字符串里的單詞2.4反轉字符串中的單詞32.5 刪除排序數組中的重復項2.6 移動零本系列博文為leetcode-explore-learn子欄目學習筆記&#xff0c;如有不詳之處&#xff0c;請參考leetcode官…

fcntl函數詳解

功能描述&#xff1a;根據文件描述詞來操作文件的特性。 #include <unistd.h> #include <fcntl.h> int fcntl(int fd, int cmd); int fcntl(int fd, int cmd, long arg); int fcntl(int fd, int cmd, struct flock *lock); [描述] fcntl()針對(文件)描述符提供控…

使用nohup讓程序永遠后臺運行

使用nohup讓程序永遠后臺運行 Unix/Linux下一般比如想讓某個程序在后臺運行&#xff0c;很多都是使用 & 在程序結尾來讓程序自動運行。比如我們要運行mysql在后臺&#xff1a; /usr/local/mysql/bin/mysqld_safe --usermysql &但是加入我們很多程序并不象mysqld一樣做…

算法(8)-leetcode-explore-learn-數據結構-鏈表

leetcode-explore-learn-數據結構-鏈表11.概述1.1 鏈表插入操作1.2 鏈表刪除操作2.設計鏈表本系列博文為leetcode-explore-learn子欄目學習筆記&#xff0c;如有不詳之處&#xff0c;請參考leetcode官網&#xff1a;https://leetcode-cn.com/explore/learn/card/linked-list/所…

Mysql索引優化實例講解

MYSQL描述&#xff1a;一個文章庫&#xff0c;里面有兩個表&#xff1a;category和article。category里面有10條分類數據。article里面有20萬條。article里面有一個"article_category"字段是與category里的"category_id"字段相對應的。article表里面已經把…