目錄
- 正態、
- 威布爾、
- 指數分布、
- 3.1 概念介紹
- 概率密度函數(PDF)
- 累積分布函數(CDF)
- 性質
- 應用
- 3.2 參數及繪圖
- 參數
- 概率密度函數(PDF)
- 累積分布函數(CDF)
- 繪圖
- 圖像解讀
- 3.3 指數分布擬合
- 代碼解讀
- 指數分布的參數
- 指數分布擬合
- 例子
- 伽馬分布、
- 對數正態分布介紹
正態、
威布爾、
指數分布、
3.1 概念介紹
指數分布(Exponential Distribution)是連續概率分布的一種,常用于描述時間間隔或距離等連續變量。它的概率密度函數(PDF)和累積分布函數(CDF)如下所示:
概率密度函數(PDF)
對于參數 λ > 0 \lambda > 0 λ>0,指數分布的概率密度函數為:
f ( x ; λ ) = { λ e ? λ x x ≥ 0 0 x < 0 f(x; \lambda) = \begin{cases} \lambda e^{-\lambda x} & x \ge 0 \\ 0 & x < 0 \end{cases} f(x;λ)={λe?λx0?x≥0x<0?
這里, λ \lambda λ 是分布的參數,稱為速率參數,它決定了分布的形狀。
累積分布函數(CDF)
指數分布的累積分布函數為:
F ( x ; λ ) = { 1 ? e ? λ x x ≥ 0 0 x < 0 F(x; \lambda) = \begin{cases} 1 - e^{-\lambda x} & x \ge 0 \\ 0 & x < 0 \end{cases} F(x;λ)={1?e?λx0?x≥0x<0?
性質
- 無記憶性:指數分布是無記憶的,即對于任何 s , t ≥ 0 s, t \ge 0 s,t≥0,有
P ( X > s + t ∣ X > s ) = P ( X > t ) P(X > s + t \mid X > s) = P(X > t) P(X>s+t∣X>s)=P(X>t) - 均值和方差:如果 X ~ Exponential ( λ ) X \sim \text{Exponential}(\lambda) X~Exponential(λ),則
- 均值: E [ X ] = 1 λ \mathbb{E}[X] = \frac{1}{\lambda} E[X]=λ1?
- 方差: Var ( X ) = 1 λ 2 \text{Var}(X) = \frac{1}{\lambda^2} Var(X)=λ21?
應用
指數分布在許多領域都有廣泛應用,例如:
- 排隊論:用于描述客戶到達間隔時間。
- 可靠性工程:用于描述設備無故障運行時間。
- 生存分析:用于描述某事件發生的時間間隔。
3.2 參數及繪圖
讓我們更深入地了解指數分布的參數,并通過繪圖來展示其特性。
參數
指數分布的關鍵參數是速率參數 λ \lambda λ。這個參數決定了事件發生的速率。具體來說:
- 速率參數 λ \lambda λ:表示事件發生的速率。單位時間內發生事件的期望次數。通常, λ \lambda λ 值越大,事件發生得越快。
- 均值 μ = 1 λ \mu = \frac{1}{\lambda} μ=λ1?:表示事件發生的平均時間間隔。通常, μ \mu μ 值越大,事件發生的間隔時間越長。
概率密度函數(PDF)
f ( x ; λ ) = λ e ? λ x for x ≥ 0 f(x; \lambda) = \lambda e^{-\lambda x} \quad \text{for} \quad x \ge 0 f(x;λ)=λe?λxforx≥0
累積分布函數(CDF)
F ( x ; λ ) = 1 ? e ? λ x for x ≥ 0 F(x; \lambda) = 1 - e^{-\lambda x} \quad \text{for} \quad x \ge 0 F(x;λ)=1?e?λxforx≥0
繪圖
我們將繪制不同 (\lambda) 值下的指數分布的概率密度函數(PDF)和累積分布函數(CDF)。接下來,我們使用 Python 繪制這些圖。
import numpy as np
import matplotlib.pyplot as plt# 定義參數
lambdas = [0.5, 1.0, 1.5] # 不同的lambda值
x = np.linspace(0, 10, 400) # x范圍# 繪制PDF
plt.figure(figsize=(14, 6))# PDF
plt.subplot(1, 2, 1)
for lambd in lambdas:pdf = lambd * np.exp(-lambd * x)plt.plot(x, pdf, label=f'λ = {lambd}')
plt.title('Exponential Distribution - PDF')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.legend()# CDF
plt.subplot(1, 2, 2)
for lambd in lambdas:cdf = 1 - np.exp(-lambd * x)plt.plot(x, cdf, label=f'λ = {lambd}')
plt.title('Exponential Distribution - CDF')
plt.xlabel('x')
plt.ylabel('F(x)')
plt.legend()plt.tight_layout()
plt.show()
以上代碼將生成兩個圖,一個是概率密度函數(PDF),另一個是累積分布函數(CDF),每個圖中都展示了不同 λ \lambda λ 值(0.5、1.0、1.5)下的分布情況。現在,我將生成這些圖并展示給你。
以上的圖像展示了不同速率參數 (\lambda) 下的指數分布的概率密度函數(PDF)和累積分布函數(CDF)。
圖像解讀
-
PDF 圖像:
- λ = 0.5 \lambda = 0.5 λ=0.5: 曲線下降較慢,表示事件發生的速率較低,間隔時間較長。
- λ = 1.0 \lambda = 1.0 λ=1.0: 曲線下降適中,表示事件發生的速率為中等。
- λ = 1.5 \lambda = 1.5 λ=1.5: 曲線下降較快,表示事件發生的速率較高,間隔時間較短。
-
CDF 圖像:
- λ = 0.5 \lambda = 0.5 λ=0.5: 曲線上升較慢,表示在較長的時間范圍內事件才有較高的發生概率。
- λ = 1.0 \lambda = 1.0 λ=1.0: 曲線上升適中。
- λ = 1.5 \lambda = 1.5 λ=1.5: 曲線上升較快,表示在較短的時間范圍內事件就有較高的發生概率。
通過這些圖像,可以直觀地理解不同速率參數 λ \lambda λ 對于指數分布的影響。
3.3 指數分布擬合
loc_expon, scale_expon = expon.fit(data)expon_pdf = expon.pdf(x, loc_expon, scale_expon)
這行代碼 loc_expon, scale_expon = expon.fit(data)
是使用 Python 的 SciPy 庫中的 expon
(指數分布)來擬合數據 data
。具體來說,它使用指數分布來估計數據的參數。
代碼解讀
-
expon.fit(data)
:- 這是 SciPy 庫中
expon
對象的方法,用于擬合指數分布到數據data
。 data
是你要擬合的數據數組。
- 這是 SciPy 庫中
-
返回值:
expon.fit(data)
返回兩個參數:loc
和scale
,分別對應指數分布的定位參數和尺度參數。loc_expon
是定位參數(loc
)。scale_expon
是尺度參數(scale
)。
指數分布的參數
-
定位參數(
loc
):- 這是指數分布的平移參數,默認情況下為 0。它決定了分布的起點位置。
-
尺度參數(
scale
):- 這是指數分布的尺度參數,與速率參數 λ \lambda λ 有關。具體來說,尺度參數等于速率參數的倒數,即 scale = 1 λ \text{scale} = \frac{1}{\lambda} scale=λ1?。
指數分布擬合
指數分布的概率密度函數(PDF)為:
f ( x ; λ ) = λ e ? λ ( x ? loc ) f(x; \lambda) = \lambda e^{-\lambda (x - \text{loc})} f(x;λ)=λe?λ(x?loc)
擬合數據時,我們實際上在估計參數 λ \lambda λ和 loc \text{loc} loc 以使得這個分布最符合數據 data
。
例子
假設我們有一組數據,并希望用指數分布來擬合它們,代碼可能如下:
import numpy as np
from scipy.stats import expon# 生成一些示例數據
data = np.random.exponential(scale=2, size=1000)# 擬合指數分布到數據
loc_expon, scale_expon = expon.fit(data)print(f"loc: {loc_expon}, scale: {scale_expon}")
在這個例子中,我們生成了一些服從指數分布的數據,然后使用 expon.fit
方法來擬合這些數據并估計參數 loc
和 scale
。結果 loc_expon
和 scale_expon
將分別是定位參數和尺度參數。