參數估計
通過取樣本,并用樣本構造函數,達成估計分布函數參數的目的
矩估計法
本質:用樣本的各階矩代替總體的各階矩,即取:
E(X)=X ̄=1n∑iXiE(X2)=1n∑iXi2E(X)=\overline{X}=\dfrac{1}{n}\sum_i X_i\\ E(X^2)=\dfrac{1}{n}\sum_iX_i^2 E(X)=X=n1?i∑?Xi?E(X2)=n1?i∑?Xi2?
極大似然估計法
本質:將使得樣本 AAA 發生概率最大的參數值作為估計值
1、寫出總體概率/密度函數
2、構造似然函數 L(λ)L(\lambda)L(λ)
3、兩邊取 ln?\lnln
4、對 λ\lambdaλ 求導
點估計的優良性準則
一、無偏性:E(θ^)=θE(\hat{\theta})=\thetaE(θ^)=θ
定理:總體為 XXX,且 E(X)=μE(X)=\muE(X)=μ,D(X)=σ2D(X)=\sigma^2D(X)=σ2,樣本為 (X1,?,Xn)(X_1,\cdots,X_n)(X1?,?,Xn?),那么有:
1、X ̄\overline{X}X 是 μ\muμ 的無偏估計
2、樣本方差 S2S^2S2 是 σ2\sigma^2σ2 的無偏估計
3、取 μ^=C1X1+?+CnXn\hat{\mu}=C_1X_1 + \cdots + C_nX_nμ^?=C1?X1?+?+Cn?Xn?,若 C1+?+Cn=1C_1+\cdots + C_n=1C1?+?+Cn?=1,則 μ^\hat{\mu}μ^? 是 μ\muμ 的無偏估計
證明:
1 與 2:
已經在 上一份筆記 中證明過 E(X ̄)=μE(\overline{X})=\muE(X)=μ 和 E(S2)=σ2E(S^2)=\sigma^2E(S2)=σ2
3:
E(μ^)=E(C1X1+?+CnXn)=E(C1X1)+?+E(CnXn)=C1E(X1)+?+CnE(Xn)=(C1+?+Cn)μ=μ\begin{align*} E(\hat{\mu}) &= E(C_1X_1 + \cdots + C_nX_n)\\ &=E(C_1X_1)+\cdots+E(C_nX_n)\\ &=C_1E(X_1)+\cdots+C_nE(X_n)\\ &=(C_1+\cdots+C_n)\mu\\ &=\mu \end{align*} E(μ^?)?=E(C1?X1?+?+Cn?Xn?)=E(C1?X1?)+?+E(Cn?Xn?)=C1?E(X1?)+?+Cn?E(Xn?)=(C1?+?+Cn?)μ=μ?
!注意:θ^\hat{\theta}θ^ 是 θ\thetaθ 的無偏估計,但是 g(θ^)g(\hat{\theta})g(θ^) 不一定是 g(θ)g(\theta)g(θ) 的無偏估計
例如:S2S^2S2 是 σ2\sigma^2σ2 的無偏估計,而 SSS 不是 σ\sigmaσ 的無偏估計(性質)
該性質的證明:
D(S)=E(S2)?E(S)2=σ2?E(S)2?E(S)=σ2?D(S)?σ\begin{align*} &D(S) = E(S^2)-E(S)^2\\ &=\sigma^2-E(S)^2\\ &\Rightarrow E(S)=\sqrt{\sigma^2-D(S)}\leqslant\sigma \end{align*} ?D(S)=E(S2)?E(S)2=σ2?E(S)2?E(S)=σ2?D(S)??σ?
二、有效性:D(θ1^)?D(θ2^)D(\hat{\theta_1})\leqslant D(\hat{\theta_2})D(θ1?^?)?D(θ2?^?)
定理:總體為 XXX,且 E(X)=μE(X)=\muE(X)=μ,D(X)=σ2D(X)=\sigma^2D(X)=σ2,樣本為 (X1,?,Xn)(X_1,\cdots,X_n)(X1?,?,Xn?),若 a1+?+an=1a_1+\cdots+a_n=1a1?+?+an?=1,則現有兩種 μ\muμ 的估計:a1X1+?+anXna_1X_1+\cdots+a_nX_na1?X1?+?+an?Xn? 與 X ̄\overline{X}X,由有效性準則認為,X ̄\overline{X}X 更優
證明:
由 上一份筆記 知 D(X ̄)=σ2nD(\overline{X})=\dfrac{\sigma^2}{n}D(X)=nσ2?
那么有:
D(θ^)=D(a1X1+?+anXn)=a12D(X1)+?+an2D(Xn)=σ2(a12+?+an2)?σ2n\begin{align*} D(\hat{\theta})&=D(a_1X_1+\cdots+a_nX_n)\\ &=a_1^2D(X_1)+\cdots+a_n^2D(X_n)\\ &=\sigma^2(a^2_1+\cdots+a^2_n)\\ &\geqslant \dfrac{\sigma^2}{n} \end{align*} D(θ^)?=D(a1?X1?+?+an?Xn?)=a12?D(X1?)+?+an2?D(Xn?)=σ2(a12?+?+an2?)?nσ2??
三、相合性(一致性):lim?n→+∞P(∣θ^?θ∣<ε)=1\lim\limits_{n\to +\infty}P(|\hat{\theta}-\theta|<\varepsilon)=1n→+∞lim?P(∣θ^?θ∣<ε)=1
置信區間
區間估計時,區間長度 和 落在區間的概率 十分重要
若 P(θ1?θ?θ2)=1?αP(\theta_1 \leqslant \theta \leqslant \theta_2)=1-\alphaP(θ1??θ?θ2?)=1?α,則 1?α1-\alpha1?α 稱為 置信度,而 [θ1,θ2][\theta_1,\theta_2][θ1?,θ2?] 則是估計區間
定義:
1、I=I(T,θ)I=I(T,\theta)I=I(T,θ),其中 θ\thetaθ 是未知參數,TTT 是已知的,隨機變量 III 的分布 FFF 已知且其分布與 θ\thetaθ 無關,則將 III 稱為 樞軸變量
2、給定 1?α1-\alpha1?α,確定 FFF 的上 α2\dfrac{\alpha}{2}2α? 分位數為 vα2v_{\frac{\alpha}{2}}v2α??,上 1?α21-\dfrac{\alpha}{2}1?2α? 為 v1?α2v_{1-\frac{\alpha}{2}}v1?2α??,則:
P(vα2?I(T,θ)?v1?α2)=1?αP\left(v_{\frac{\alpha}{2}}\leqslant I(T,\theta) \leqslant v_{1-\frac{\alpha}{2}}\right)=1-\alpha P(v2α???I(T,θ)?v1?2α??)=1?α
一個正態總體的均值和方差的區間估計
設 v=n(X ̄?μ)σ~N(0,1)v=\dfrac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\sim N(0,1)v=σn?(X?μ)?~N(0,1)
給定 1?α1-\alpha1?α,令 P(v>uα2)=α2P(v>u_{\frac{\alpha}{2}})=\dfrac{\alpha}{2}P(v>u2α??)=2α?
1、σ2\sigma^2σ2 已知,對 μ\muμ 的區間估計:
P(?uα2?n(X ̄?μ)σ?uα2)=1?αP(?σuα2n?X ̄?μ?σuα2n)=1?αP(X ̄?σuα2n?μ?X ̄+σuα2n)=1?α\begin{align*} &P\left(-u_{\frac{\alpha}{2}}\leqslant \dfrac{\sqrt{n}(\overline{X}-\mu)}{\sigma} \leqslant u_{\frac{\alpha}{2}}\right)=1-\alpha\\ &P\left(-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\leqslant\overline{X}-\mu\leqslant\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right)=1-\alpha\\ &P\left(\overline{X}-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\leqslant\mu\leqslant\overline{X}+\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right)=1-\alpha \end{align*} ?P(?u2α???σn?(X?μ)??u2α??)=1?αP(?n?σu2α????X?μ?n?σu2α???)=1?αP(X?n?σu2α????μ?X+n?σu2α???)=1?α?
也就是說,有 1?α1-\alpha1?α 的把握,認為 μ\muμ 在區間 [X ̄?σuα2n,X ̄+σuα2n]\left[\overline{X}-\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}, \overline{X}+\dfrac{\sigma u_{\frac{\alpha}{2}}}{\sqrt{n}}\right][X?n?σu2α???,X+n?σu2α???] 中
2、σ2\sigma^2σ2 未知,對 μ\muμ 的區間估計:
構造樞軸變量:T=n(X ̄?μ)S~t(n?1)T=\dfrac{\sqrt{n}(\overline{X}-\mu)}{S}\sim t(n-1)T=Sn?(X?μ)?~t(n?1)
P(?tα2(n?1)?n(X ̄?μS?tα2(n?1))=1?α?P(X ̄?Sntα2(n?1)?μ?X ̄+Sntα2(n?1))=1?α\begin{align*} &P\left(-t_{\frac{\alpha}{2}}(n-1)\leqslant\dfrac{\sqrt{n}(\overline{X}-\mu}{S}\leqslant t_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha\\ &\Rightarrow P\left(\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1) \leqslant \mu \leqslant \overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha \end{align*} ?P(?t2α??(n?1)?Sn?(X?μ??t2α??(n?1))=1?α?P(X?n?S?t2α??(n?1)?μ?X+n?S?t2α??(n?1))=1?α?
也就是說,有 1?α1-\alpha1?α 的把握,認為 μ\muμ 在區間 [X ̄?Sntα2(n?1),X ̄+Sntα2(n?1)]\left[\overline{X}-\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1), \overline{X}+\dfrac{S}{\sqrt{n}}t_{\frac{\alpha}{2}}(n-1)\right][X?n?S?t2α??(n?1),X+n?S?t2α??(n?1)] 中
3、μ\muμ 已知,對 σ2\sigma^2σ2 的區間估計:
構造樞軸變量:χ2=1σ2∑i=1n(Xi?μ)2~χ2(n)\chi^2=\dfrac{1}{\sigma^2}\sum\limits_{i=1}^n(X_i-\mu)^2\sim \chi^2(n)χ2=σ21?i=1∑n?(Xi??μ)2~χ2(n),給定 1?α1-\alpha1?α、χ1?α22(n)\chi^2_{1-\frac{\alpha}{2}}(n)χ1?2α?2?(n) 及 χα22(n)\chi^2_{\frac{\alpha}{2}}(n)χ2α?2?(n)
注意:之所以不繼續使用正態分布的樞軸變量,是因為 σ\sigmaσ 在開平方后不是無偏估計
P(χ1?α22(n)?1σ2∑i=1n(Xi?μ)2?χα22(n))=1?α?∑i=1n(Xi?μ)2χα22(n)?σ2?∑i=1n(Xi?μ)2χ1?α22(n)\begin{align*} &P\left(\chi^2_{1-\frac{\alpha}{2}}(n)\leqslant\dfrac{1}{\sigma^2}\sum_{i=1}^n(X_i-\mu)^2\leqslant\chi^2_{\frac{\alpha}{2}}(n)\right)=1-\alpha\\ &\Rightarrow \dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)}\leqslant\sigma^2\leqslant\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)} \end{align*} ?P(χ1?2α?2?(n)?σ21?i=1∑n?(Xi??μ)2?χ2α?2?(n))=1?α?χ2α?2?(n)∑i=1n?(Xi??μ)2??σ2?χ1?2α?2?(n)∑i=1n?(Xi??μ)2??
也就是說,有 1?α1-\alpha1?α 的把握,認為 σ2\sigma^2σ2 在區間 [∑i=1n(Xi?μ)2χα22(n),∑i=1n(Xi?μ)2χ1?α22(n)]\left[\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{\frac{\alpha}{2}}(n)},\dfrac{\sum_{i=1}^n(X_i-\mu)^2}{\chi^2_{1-\frac{\alpha}{2}}(n)}\right][χ2α?2?(n)∑i=1n?(Xi??μ)2?,χ1?2α?2?(n)∑i=1n?(Xi??μ)2?] 中
4、μ\muμ 未知,對 σ2\sigma^2σ2 的區間估計:
構造樞軸變量:χ2=(n?1)S2σ2~χ2(n?1)\chi^2=\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1)χ2=σ2(n?1)S2?~χ2(n?1),給定 1?α1-\alpha1?α、χ1?α22(n?1)\chi^2_{1-\frac{\alpha}{2}}(n-1)χ1?2α?2?(n?1) 及 χα22(n?1)\chi^2_{\frac{\alpha}{2}}(n-1)χ2α?2?(n?1)
P(χ1?α22(n?1)?(n?1)S2σ2?χα22(n?1))=1?α?P((n?1)S2χα22(n?1)?σ2?(n?1)S2χ1?α22(n?1))=1?α\begin{align*} &P\left(\chi^2_{1-\frac{\alpha}{2}}(n-1)\leqslant\dfrac{(n-1)S^2}{\sigma^2}\leqslant\chi^2_{\frac{\alpha}{2}}(n-1)\right)=1-\alpha\\ &\Rightarrow P\left(\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}\leqslant\sigma^2\leqslant\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right)=1-\alpha \end{align*} ?P(χ1?2α?2?(n?1)?σ2(n?1)S2??χ2α?2?(n?1))=1?α?P(χ2α?2?(n?1)(n?1)S2??σ2?χ1?2α?2?(n?1)(n?1)S2?)=1?α?
也就是說,有 1?α1-\alpha1?α 的把握,認為 σ2\sigma^2σ2 在區間 [(n?1)S2χα22(n?1),(n?1)S2χ1?α22(n?1)]\left[\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)},\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}\right][χ2α?2?(n?1)(n?1)S2?,χ1?2α?2?(n?1)(n?1)S2?] 中