参数估计
点估计
概念
设总体X 的分布函数为F(x;\theta) (可以是多维的),其中\theta 是一个未知参数,X_1,X_2,...,X_n 是总体X 的一个样本,由样本构造一个适当的统计量\hat{\theta}(X_1,X_2,...,X_n) 为\theta 的估计量,通常记为\hat{\theta}=\hat{\theta}(X_1,X_2,...,X_n)
方法
矩估计法
设总体X 的分布中有k 个未知参数\theta_1,...,\theta_k ,X_1,...,X_n 是来自总体X 的样本,且X 的原点矩存在,即E(X^l)(l=1,2,...,k) 存在,令样本矩=总体矩,则有\frac{1}{n}\sum_{i=1}^nX_i^l=E(X^l)(l=1,2,...,k) ,是包含k 个未知参数\theta_1,...,\theta_k 的k 个联立方程组,可解得\hat{\theta}_l=\hat{\theta}_l(X_1,X_2,...,X_n)(l=1,2,...,k) ,则\hat\theta_i 为\hat\theta 的矩估计量,\hat\theta_l(x_1,...,x_n) 为\theta_l 的矩估计值
最大似然估计法
对未知参数\theta 进行估计时,在该参数可坑的取值范围I 内选取,选取使样本获得观测值x_1,x_2,...,x_n 的概率最大的参数值\hat\theta 作为\theta 的估计,这样的选定最有利于样本观测值x_1,...,x_n 的出现
1、连续型
对于总体X 是连续型随机变量的情形,设其概率密度函数为f(x;\theta),\theta\in I 是连续或者分段连续的,则样本的似然函数为L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod_{i=1}^nf(x_i;\theta) ,若存在\hat\theta=\hat\theta(x_1,...,x_n)\in I ,使得L(\hat\theta)=\max_{\theta\in I}\prod_{i=1}^nf(x_i;\theta) ,则\hat\theta(X_1,...,X_n)=\arg\max_{\theta\in I}\prod_{i=1}^nf(x_i;\theta) 为\theta 的极大似然估计量
2、离散型
对于总体X 是离散型随机变量的情形,设其概率分布为P\{X=x\}=p(x;\theta),\theta\in I ,则样本的似然函数为L(\theta)=L(x_1,...,x_n;\theta)=\prod_{i=1}^np(x_i;\theta) ,若存在\hat\theta=\hat\theta(x_1,...,x_n)\in I ,使得L(\hat\theta)=\max_{\theta\in I}\prod_{i=1}^np(x_i;\theta) ,则\hat\theta(X_1,...,X_n)=\arg\max_{\theta\in I}\prod_{i=1}^np(x_i;\theta) 为\theta 的极大似然估计量
3、计算方法
1)写出样本的似然函数L(\theta)
2)对于可微部分,利用导数求L(\theta) 或\ln L(\theta) 的最大值
3)对于不可微部分,用图像或者定义法求最大值
4、性质
最大似然估计量具有对于单值可逆函数具有不变性
估计量的评价标准
无偏性
对于参数\theta 的估计量\hat\theta(X_1,X_2,...,X_n) 对于一切n 以及\theta\in I ,有E\hat\theta=\theta ,则称\hat\theta 为\theta 的无偏估计量
有效性(最小方差性)
设\hat\theta_1(X_1,X_2,...,X_n),\hat\theta_2(X_1,X_2,...,X_n) 都是\theta 的无偏估计量,若D(\hat\theta_1)[InvalidCharacterError: "D(\HAT\THETA_2)<" did not match the Name production] ,则称\hat\theta_1 比\hat\theta_2 有效
一致性(相合性)
设\hat\theta=\hat\theta(X_1,X_2,...,X_n) 为参数\theta 的估计量,若对任意\varepsilon>0 ,有\lim_{n\to\infty}P\{|\hat\theta-\theta|<\varepsilon\}=1 ,则称\hat\theta 为\theta 的一致估计量(或相合估计量)
区间估计
概念
对于总体X 的一个未知参数\theta ,\alpha(0<\alpha<1) 是一个给定的正数,若由样本X_1,X_2,...,X_n 确定的两个统计量\hat\theta_1=\hat\theta_1(X_1,X_2,...,X_n),\hat\theta_2=\hat\theta_2(X_1,X_2,...,X_n) 满足P\{\hat\theta_1(X_1,...,X_n)<\theta<\hat\theta_2(X_1,...,X_n)\}=1-\alpha ,
则称随机区间(\hat\theta_1,\hat\theta_2) 是\theta 置信度为1-\alpha 的置信区间,\hat\theta_1,\hat\theta_2 分别称为\theta 的置信度为1-\alpha 的双侧置信区间的置信下限和置信上限,1-\alpha 称为置信度或者置信水平,\alpha 称为显著性水平
给定置信水平或者显著性水平,求位置的参数置信区间的问题,称为参数区间估计问题
正态总体均值的置信区间(置信水平为[InvalidCharacterError: "SP<" did not match the Name production] )