目錄
- Beta分布
- Dirichlet分布
- Beta分布&Dirichlet分布
- 從Dirichlet分布生成Beta樣本
- Beta分布&Dirichlet分布應用
Beta分布
Beta分布是定義在區間 [ 0 , 1 ] [0, 1] [0,1]上的連續概率分布,通常用于模擬概率或比例的隨機變量。Beta分布的概率密度函數(PDF)如下:
f ( x ; α , β ) = Γ ( α + β ) Γ ( α ) Γ ( β ) x α ? 1 ( 1 ? x ) β ? 1 f(x; \alpha, \beta) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha - 1}(1 - x)^{\beta - 1} f(x;α,β)=Γ(α)Γ(β)Γ(α+β)?xα?1(1?x)β?1其中:
- x x x是隨機變量,取值范圍在 [ 0 , 1 ] [0, 1] [0,1] 之間。
- α \alpha α和 β \beta β是形狀參數,它們都是正實數 ( α > 0 , β > 0 ) ( \alpha > 0, \beta > 0 ) (α>0,β>0)。
- Γ \Gamma Γ是伽馬函數,它是階乘函數在實數與復數域上的擴展。
Beta分布的概率密度函數可以進一步簡化為:
f ( x ; α , β ) = x α ? 1 ( 1 ? x ) β ? 1 B ( α , β ) f(x; \alpha, \beta) = \frac{x^{\alpha - 1}(1 - x)^{\beta - 1}}{B(\alpha, \beta)} f(x;α,β)=B(α,β)xα?1(1?x)β?1?
其中 ( B(\alpha, \beta) ) 是Beta函數,定義為:
B ( α , β ) = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)} B(α,β)=Γ(α+β)Γ(α)Γ(β)?
Beta函數是兩個伽馬函數的比值,它確保了概率密度函數的積分總和為1。
Dirichlet分布
Dirichlet分布是定義在K維實數向量上的多項分布的共軛先驗,通常用于模擬多類別分布。Dirichlet分布的概率密度函數(PDF)如下:
f ( x ; α ) = Γ ( ∑ i = 1 K α i ) ∏ i = 1 K Γ ( α i ) ∏ i = 1 K x i α i ? 1 f(\mathbf{x}; \boldsymbol{\alpha}) = \frac{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}{\prod_{i=1}^K \Gamma(\alpha_i)} \prod_{i=1}^K x_i^{\alpha_i - 1} f(x;α)=∏i=1K?Γ(αi?)Γ(∑i=1K?αi?)?i=1∏K?xiαi??1?
其中:
- x = ( x 1 , x 2 , … , x K ) \mathbf{x} = (x_1, x_2, \ldots, x_K) x=(x1?,x2?,…,xK?)是隨機變量,每個 x i x_i xi?取值范圍在 [ 0 , 1 ] [0, 1] [0,1] 之間,并且 ∑ i = 1 K x i = 1 \sum_{i=1}^K x_i = 1 ∑i=1K?xi?=1。
- α = ( α 1 , α 2 , … , α K ) \boldsymbol{\alpha} = (\alpha_1, \alpha_2, \ldots, \alpha_K) α=(α1?,α2?,…,αK?)是形狀參數,每個 α i \alpha_i αi?都是正實數 ( α i > 0 ) ( \alpha_i > 0 ) (αi?>0)。
- Γ \Gamma Γ是伽馬函數。
Dirichlet分布的概率密度函數可以進一步簡化為:
f ( x ; α ) = ∏ i = 1 K x i α i ? 1 Dir ( α ) f(\mathbf{x}; \boldsymbol{\alpha}) = \frac{\prod_{i=1}^K x_i^{\alpha_i - 1}}{\text{Dir}(\boldsymbol{\alpha})} f(x;α)=Dir(α)∏i=1K?xiαi??1??
其中 ( \text{Dir}(\boldsymbol{\alpha}) ) 是Dirichlet函數,定義為:
Dir ( α ) = Γ ( ∑ i = 1 K α i ) ∏ i = 1 K Γ ( α i ) \text{Dir}(\boldsymbol{\alpha}) = \frac{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}{\prod_{i=1}^K \Gamma(\alpha_i)} Dir(α)=∏i=1K?Γ(αi?)Γ(∑i=1K?αi?)?
Dirichlet函數確保了概率密度函數的積分總和為1。
Beta分布&Dirichlet分布
-
Beta分布和Dirichlet分布的概率密度函數都涉及到了伽馬函數 ( Γ ) (\Gamma) (Γ)。這種函數在數學中非常重要,特別是在處理與概率和統計相關的問題時。
-
兩者的概率密度函數都具有冪函數的形式,其中Beta分布是一維的,而Dirichlet分布是多維的。Dirichlet分布可以看作是Beta分布的多維推廣。
從Dirichlet分布生成Beta樣本
- Dirichlet分布的一個有趣性質是,它可以用于生成Beta分布的樣本。具體來說,如果我們從Dirichlet分布 Dir ( α ) \text{Dir}(\boldsymbol{\alpha}) Dir(α) 中生成一個樣本 x = ( x 1 , x 2 , … , x K ) \mathbf{x} = (x_1, x_2, \ldots, x_K) x=(x1?,x2?,…,xK?),那么對于任意 i i i 和 j j j ( i ≠ j ) (i \neq j) (i=j),比值 x i x i + x j \frac{x_i}{x_i + x_j} xi?+xj?xi??服從參數為 α i \alpha_i αi?和 α j \alpha_j αj?的Beta分布。
Beta分布&Dirichlet分布應用
- Beta分布:常用于貝葉斯統計中,作為二項分布的共軛先驗。它也可以用于建模概率或比例,例如在信用評分、市場研究等領域。
- Dirichlet分布:常用于貝葉斯統計中,作為多項分布的共軛先驗。它也可以用于建模多類別分布,例如在主題模型、聚類分析等領域。
這些分布的概率密度函數在貝葉斯統計和機器學習中非常重要,因為它們提供了一種自然的方式來表示和處理概率分布。