我之前一直很糾結為什么離散型隨機變量分布律中有隨機變量的出現,而連續型隨機變量概率密度中沒有隨機變量的出現。那對于連續型隨機變量而言,如何建立隨機變量和取值之間的聯系。也就是說看到連續型隨機變量的概率密度,我怎么知道描述的是哪個隨機變量。
有一次為了圖像復原中描述噪聲,和廖老師討論隨機變量的表示,終于明白了兩者之間的本質。
連續型隨機變量與離散型隨機變量的本質區別在于,在離散情況下,單個點的概率可以非零;而在連續情況下,由于取值的無限性,單點的概率為零,概率密度函數描述了概率在區間上的分布情況。
對于離散型隨機變量 X X X,在單點處是概率值。所以這里的 P P P表示概率。
而對于連續型隨機變量 X X X,其概率密度函數為 f ( x ) f(x) f(x),這里的 f ( x ) f(x) f(x)表示的是密度函數,密度很重要。在任意單點 x = a x = a x=a處的概率為零,即:
P ( X = a ) = 0 P(X = a) = 0 P(X=a)=0
這是因為連續型隨機變量取任一特定值的概率都是無窮小。雖然概率密度函數 f ( a ) f(a) f(a)可以不為零,但單點 a a a的“長度”或“寬度”為零,導致該點的概率積分結果為零:
P ( X = a ) = ∫ a a f ( x ) d x = 0 P(X = a) = \int_a^a f(x) \, dx = 0 P(X=a)=∫aa?f(x)dx=0
換句話說,連續隨機變量在單個點上沒有概率質量(英文是mass,但是在中文教材中上沒有直譯mass,稱為概率函數,凡是將mass譯為質量,就是不說人話,一看就是沒有系統學過概率論與統計學),其概率是通過在某個區間上對概率密度函數積分來計算的。
例如,隨機變量 X X X落在區間 [ a , b ] [a, b] [a,b]內的概率為:
P ( a ? X ? b ) = ∫ a b f ( x ) d x P(a \leqslant X \leqslant b) = \int_a^b f(x) \, dx P(a?X?b)=∫ab?f(x)dx
這表明,連續隨機變量的概率分布由概率密度函數在區間上的積分決定,而非單點處的函數值。
在電子相關領域中,一直習慣用大寫的 P P P的表示概率,小寫的 p p p表示概率密度。但在概率論與統計學中,大寫的 P P P表示分布律,小寫的 p p p表示概率函數。能夠寫成離散函數的,隨機變量不用出現,這樣寫簡便,此時用小寫的 p p p。
之前區分離散和連續,這在實際中很難區分。但是區分概率和概率密度就很清楚了。我的概率老師講概率就講如何代入公式計算了,照本宣科。自從有了擴散模型之后才發現原來概率如此博大精深。強烈建議這樣講課的老師去賣紅薯。