第11节 假设检验
假设检验
相关定义
第一章阐述样本统计量与总体属性的关系。
第二章参数估计,通过样本的统计量对总体的参数进行估计。并对估计的优劣进行判断,求最优的统计量。区间估计主要是通过置信水平,求置信区间。
第三章假设检验。总体分布已知,参数已知。通过样本的统计量,对参数的正确性进行验证。
本节的逻辑
- 对参数做出假设,$\Theta_0,\Theta_1$。
- 计算检验统计量的接受拒绝区间$W^c,W$。
- 检验统计量的拒绝接受区间对应的概率。称为势和势函数。
定义1:原假设与备择假设
- 所要检验的假设称为原假设或零假设,记为$H_0$。
- 与$H_0$不相容的假设称为备择假设或对立假设,记为$H_1$。
- 对参数分布族${p(x;\theta):\theta\in\Theta}$,原假设和备择假设这对矛盾统一体,称为假设检验:
$$
H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1
$$
定义2:拒绝域、接受域、检验统计量、检验函数
这里最奇怪的地方是反向表示,拒绝、失信为首选方,使用简单的方式表示。$\alpha,W,\varphi(x)=1$
假设检验就是根据某一法则,在原假设和备择假设之间做出选择,基于样本做出拒绝$H_0$或接受$H_0$所依赖的法则称为检验。
检验法则:若$(x_1,\dotsm,x_n)\in W$,则拒绝$H_0$,否则由$(x_1,\dotsm,x_n)\in W^c$,就接受$H_0$。称$W$为拒绝域,$W^c$称为接受域。
拒绝度$\alpha$与拒绝域$W$一一对应。置信度$1-\alpha$与接受域(置信区间)$1-\alpha$一一对应。
检验统计量:能够由统计量确定拒绝域W,则统计量为检验统计量。检验统计量的检验临界值,能够区分两个检验区间。样本空间可以分为拒绝域和接受域,但是无法用数学关系式定量表达。需要使用样本的统计量的不等式,定量表示拒绝域和接受域的范围,而区分这个范围的量称为检验临界值。
示性函数或者检验函数
$$
\varphi(x)=\begin{cases}
1,&x\in W\
0,&x\notin W^c
\end{cases}
$$这里$\varphi(x)$所属的区间$W,W^c$是依赖于真实情况的,而不是假设检验中假设。所以他是没有错误的,不受假设错误影响的示性函数、检验函数。
比如,假设本身错误,备择假设成立。这个时候假设的$W^c$接受域为原假设接受范围,假设的拒绝域$W$为备择假设的范围。但是示性函数拒绝域的范围为假设的接受域的范围$W^c$,接受域的范围为假设的拒绝域的范围$W$
定义3:两类错误
第一类错误:当原假设$H_0$本来成立,样本观察值落入拒绝与$W$,我们错误的拒绝了$H_0$,称为弃真错误,其概率:
$$
\alpha(\theta)=P_\theta{x\in W},\theta\in\Theta_0
$$第二类错误:当原假设$H_0$本来不成立时,样本观察值落入接受域$W^c$,我们错误的接受了$H_0$,称为取伪错误,其概率为:
$$
\beta(\theta)=P_\theta{x\notin W}=1-P_\theta{x\in W},\theta\in\Theta_1e
$$
$$
p(x\in W|H_0为真)=\alpha 接受域放弃 \
p(x\in W^c|H_0为真) 接受域本身错误
$$
$\alpha$越大,第一类错误发生的错误越小,第二类错误发生的概率越大。
不能同时减小,增加了样本容量可以减少两类错误。
定义4:势和势函数
本质上是用来衡量犯错的理论概率的,与样本检验是否犯错并没有本质联系。
这里的势是一种概率,与区间估计的拒绝度对应。
这里的势不依赖于假设,而是一种本质的基于总体真正的属性的计算值。(假设是一种猜测,验证后才可以使准确地)$\varphi(x)$是显示总体本身真实属性的函数,不依赖于假设,与是否犯错无关。
$H_0$不成立时,成功拒绝$H_0$的概率,称为势和功效。
$$
\gamma(\theta)=P_\theta{x\in W}
$$势函数,相当于拒绝度的衡量。
$$
g(\theta)=P_\theta{x\in W}=E_\theta(\varphi(x)),\theta\in\Theta\
$$
- 势函数的计算
关键点在于,\theta的范围。
$$
当\theta\in\Theta_0,g(\theta)=\alpha(\theta)\
当\theta\in\Theta_1,\beta(\theta)=p_\theta{x\not\in W}=1-g(\theta)\
当\theta\in\Theta_1,g(\theta)=\gamma(\theta)
$$
区间估计与假设检验
二者都具有:总体、参数、(统计量的)区间、概率。
区间估计。总体分布已知。参数未知。参数的分布范围与概率对应。本质上在于确定区间范围与概率的对应。是一种理论计算,不涉及具体的样本。
假设检验。总体分布已知。参数未知。估计参数,使用统计量的区间进行判定。概率表示出错的范围。本质上在于确定区间范围与参数假设的对应。是一种实际的计算,需要具体的样本验证。
这里在逻辑上没有说接受概率和拒绝概率。接受概率和拒绝概率是区间估计那里的置信度和拒绝度。而这里用犯错概率来引入概率的影响,因为这里的接受和拒绝依赖于实际的样本,而区间估计并不依赖于实际的样本,是一种理论计算。所以犯错依赖于概率。
定义:检验水平
分析:这里的检验水平就是拒绝水平。如果能在一个水平下拒绝,那么肯定也能在更大范围内拒绝,即包含真实拒绝域的拒绝域,肯定是拒绝域。因为,如果能在一个范围内接收,肯定能在更小的范围下接受。,即属于真实接受域的子集一定是接受域。
- 条件
$$
\alpha\in(0,1),\forall \theta\in\Theta\
E_\theta(\varphi(x))\leq\alpha
$$ - 结论
$$
\varphi(x)是一个显著性水平为\alpha 的检验函数。
$$
- 条件
$$
\alpha<\alpha’<1
$$ - 结论
$$
\varphi(x)也是一个显著性水平为\alpha’的检验函数
$$ - 条件
$$
\alpha=sup{E_\theta(\varphi(x)),\theta\in\Theta}
$$ - 结论
$$
\alpha 称为真实水平
$$
说明:
分位数:概率和概率分位数
区间估计:置信区间和置信水平
假设检验:接受域、拒绝域和概率
本质上都是区间积分与值的关系。在概率分布函数图像中即面积和面积临界值的关系。
对应关系说明
将$\theta,W$分开理解,会比较好。但是一个题中如何分开看,如何将二者都计算出来。应该是$\theta$是个条件,$g(\theta)$势函数用来计算拒绝域与接受域的概率。
- 假设检验:$H_0,H_1$(命题的划分,不一定包含所有的情况,并集不为全集)
- 接受域拒绝域:$W^c,W$(样本空间的划分,反向定义,包含所有的情况,互补)
- 检验统计量-检验临界值区分$c$(检验统计量的划分,与样本空间的接受域和拒绝域意义对应)
- 置信度拒绝度:$1-\alpha,\alpha$(包含所有的情况,是一个琳结婚之,与检验临界值一一对应,在假设检验部分对应真实水平)










