目錄
- 二維隨機變量及其分布
- 離散型隨機變量
- 連續型隨機變量
- 邊緣分布
- 邊緣概率密度
- 舉例
- 邊緣概率密度
- 條件概率密度
- 邊緣概率密度與條件概率密度的區別
- 邊緣概率密度
- 條件概率密度
- 舉個具體例子
- 參考資料
二維隨機變量及其分布
離散型隨機變量
把所有的概率,都理解成不同質量的物體,這些物體就分布在二維平面上(左圖)。再把這些物體都看成是精簡的質點。
如果 f ( x , y ) f(x,y) f(x,y)是其中的某個點的話,那么 F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X≤x, Y≤y) F(x,y)=P(X≤x,Y≤y)就是該點左下角所有質點的質量疊加。
連續型隨機變量
它就不再是一個個質點了,而是一個個物體。 F ( x , y ) F(x,y) F(x,y)叫聯合分布函數。其分布函數仍然是質量。概率密度就是面密度(例如kg/m^2).
如果你要給愛人送一個禮物,中間部分是黃金做的,邊緣部分是鐵做的。從金到鐵有一個漸變的過程,這就導致每個點的密度不太一樣。(此處,這個物體是個薄片、扁平的,不研究它的厚度)。這個密度就叫概率密度 f ( x , y ) f(x,y) f(x,y)
F ( x , y ) F(x,y) F(x,y)還是表示點 ( x , y ) (x,y) (x,y)左下角的質量。也就是對面密度做積分,得到的就是質量。
把質量對應概率,把密度對應成面密度。
邊緣分布
F X ( x ) = P ( X ≤ x ) F_X(x)=P(X≤x) FX?(x)=P(X≤x)與 F ( x , y ) = P ( X ≤ x , Y ≤ y ) F(x,y)=P(X≤x, Y≤y) F(x,y)=P(X≤x,Y≤y)的關系,如下圖所示。
邊緣概率密度
覺得禮品不太好看,沿著y方向壓縮,一直壓縮到從數學上來說y的厚度已經沒有了(0),如下圖所示
此時,這根線的密度,就叫線密度(g/cm)。
壓縮過程如下。其代表的是x位于不同點的時候的密度。
所以,右側圖中線上每個點的質量(概率),其實就是左側圖片中對應的豎線的質量,豎直做積分。
同理 F Y ( y ) F_Y(y) FY?(y)就是水平做積分。
舉例
下圖中,黃顏色代表大多數人都位于這個位置,集中在身高和體重的均值附近,概率密度比較大。
F(1.6, 100),計算的是身高≤1.6m,體重≤100kg的概率。從質量的角度來說,算的是質量。
而邊緣概率,是身高小于1.6的人的概率,也可以理解為x<1.6的質量。
邊緣概率密度
把同身高、不同體重的人進行積分,就得到單獨身高的密度分布,
條件概率密度
它和邊緣概率密度有點像,但又不一樣。它研究的是單獨某一條線(水平或豎直)的密度問題。常用于求條件概率密度。
如下圖,讓Y=b,此時就叫條件概率密度。只研究一條線的概率密度,
以身高體重為例子,研究體重為101斤的人,它的身高的分布,
同樣,身高1m85的人,其體重的分布
邊緣概率密度與條件概率密度的區別
讓我用更簡單的方式來解釋這兩個概念。
邊緣概率密度
想象一下,你和朋友在玩一種抽獎游戲。這個抽獎游戲有兩個轉盤,一個轉盤上有各種顏色(紅色、綠色、藍色),另一個轉盤上有各種動物(狗、貓、鳥)。每次抽獎,你會同時轉動這兩個轉盤,然后得到一個顏色和一個動物的組合。
現在,我們只對顏色感興趣,不管動物是什么。這就像我們只看第一個轉盤,不看第二個轉盤。這時候,我們就得到了顏色的邊緣概率密度。就是說,我們只關心顏色的分布情況,比如有多少次是紅色的,有多少次是綠色的等等。
條件概率密度
繼續這個抽獎游戲的例子。如果這次我們知道抽到的動物是狗,我們想知道在這種情況下顏色的分布情況。比如,在抽到狗的時候,有多少次是紅色的,有多少次是綠色的等等。這就是條件概率密度。
條件概率密度告訴我們:在已知某個條件下(比如已經知道抽到的是狗),其他東西(比如顏色)的分布情況。
舉個具體例子
假設我們玩了很多次這個游戲,統計結果如下:
- 總共抽了100次。
- 抽到紅色的有30次,綠色的有50次,藍色的有20次(這就是顏色的邊緣概率)。
- 抽到狗的有40次,貓的有30次,鳥的有30次。
- 在抽到狗的40次里,紅色的有10次,綠色的有20次,藍色的有10次(這就是抽到狗時顏色的條件概率)。
所以,邊緣概率密度就像我們只看顏色的總體情況,而條件概率密度就像我們知道抽到狗后再來看顏色的分布情況。
參考資料
[1] 邊緣概率密度,條件概率密度,邊緣分布函數,聯合分布函數關系;