概率基礎——幾何分布
介紹
在統計學中,幾何分布是描述了在一系列獨立同分布的伯努利試驗中,第一次成功所需的試驗次數的概率分布。在連續拋擲硬幣的試驗中,每次拋擲結果為正面向上的概率為 p p p,反面向上的概率為 1 ? p 1-p 1?p。幾何隨機變量 X X X表示連續拋擲硬幣直到第一次出現正面向上的試驗次數。
理論及公式
幾何分布的概率質量函數(PMF)為:
P ( X = k ) = ( 1 ? p ) k ? 1 × p P(X = k) = (1 - p)^{k-1} \times p P(X=k)=(1?p)k?1×p
其中, k k k是試驗次數, p p p 是每次試驗成功(正面向上)的概率。
幾何分布的期望和方差可以通過其概率質量函數得到。設幾何隨機變量為 X X X,表示第一次成功所需的試驗次數。
- 期望(均值):
E ( X ) = 1 p E(X) = \frac{1}{p} E(X)=p1?
- 方差:
V a r ( X ) = 1 ? p p 2 Var(X) = \frac{1-p}{p^2} Var(X)=p21?p?
其中, p p p是每次試驗成功(正面向上)的概率。
這些公式可以幫助我們計算幾何分布的期望和方差,從而更好地理解該分布的特征和性質。
示例與繪圖
接下來,我們將使用Python來實現繪制幾何分布的概率質量函數圖。
import matplotlib.pyplot as plt
from scipy.stats import geomfig, ax = plt.subplots(2, 1)
params = [0.5, 0.3]x = range(1, 11)for i in range(len(params)):geom_rv = geom(params[i])ax[i].plot(x, geom_rv.pmf(x), 'ro', lw=5, alpha=0.6, label='Geometric PMF')ax[i].vlines(x, 0, geom_rv.pmf(x), colors='r')ax[i].set_xlim(0, 10)ax[i].set_ylim(0, 0.6)ax[i].set_title('p = %.2f' % params[i])ax[i].set_xticks(x)ax[i].set_yticks([0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6])ax[i].grid(ls='--')
plt.show()
運行以上代碼,將會得到一個幾何分布的概率質量函數圖。從圖中可以看出,隨著試驗次數的增加,成功的概率逐漸減小,但總體上呈指數下降的趨勢。這是因為每次試驗成功的概率 p p p乘以 ( 1 ? p ) k ? 1 (1-p)^{k-1} (1?p)k?1,隨著 k k k的增加, ( 1 ? p ) k ? 1 (1-p)^{k-1} (1?p)k?1的值逐漸減小,從而導致整體概率下降。
from scipy.stats import geom
import matplotlib.pyplot as pltx = range(1, 20)
geom_rv = geom(p=0.5)
geom_rvs = geom_rv.rvs(size=100000)
plt.hist(geom_rvs, bins=20, density=True, alpha=0.75, edgecolor='black')
plt.gca().axes.set_xticks(range(1, 20))mean, var, skew, kurt = geom_rv.stats(moments='mvsk')
print("Mean:", mean)
print("Variance:", var)
plt.grid(ls='--')
plt.show()
總結
本文介紹了幾何分布及Python實現,利用了函數包的各個方法計算出各個理論統計值,利用采樣樣本數據計算出來的值和理論值基本算都是相等的。