假设检验

相关定义

第一章阐述样本统计量与总体属性的关系。
第二章参数估计，通过样本的统计量对总体的参数进行估计。并对估计的优劣进行判断，求最优的统计量。区间估计主要是通过置信水平，求置信区间。
第三章假设检验。总体分布已知，参数已知。通过样本的统计量，对参数的正确性进行验证。

本节的逻辑

对参数做出假设，$\Theta_0,\Theta_1$。

计算检验统计量的接受拒绝区间$W^c,W$。

检验统计量的拒绝接受区间对应的概率。称为势和势函数。

所要检验的假设称为原假设或零假设，记为$H_0$。
与$H_0$不相容的假设称为备择假设或对立假设，记为$H_1$。
对参数分布族${p(x;\theta):\theta\in\Theta}$，原假设和备择假设这对矛盾统一体，称为假设检验：
$$
H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1
$$

这里最奇怪的地方是反向表示，拒绝、失信为首选方，使用简单的方式表示。$\alpha,W,\varphi(x)=1$

假设检验就是根据某一法则，在原假设和备择假设之间做出选择，基于样本做出拒绝$H_0$或接受$H_0$所依赖的法则称为检验。
检验法则：若$(x_1,\dotsm,x_n)\in W$，则拒绝$H_0$，否则由$(x_1,\dotsm,x_n)\in W^c$，就接受$H_0$。称$W$为拒绝域，$W^c$称为接受域。

拒绝度$\alpha$与拒绝域$W$一一对应。置信度$1-\alpha$与接受域（置信区间）$1-\alpha$一一对应。
检验统计量：能够由统计量确定拒绝域W，则统计量为检验统计量。检验统计量的检验临界值，能够区分两个检验区间。样本空间可以分为拒绝域和接受域，但是无法用数学关系式定量表达。需要使用样本的统计量的不等式，定量表示拒绝域和接受域的范围，而区分这个范围的量称为检验临界值。
示性函数或者检验函数
$$
\varphi(x)=\begin{cases}
1,&x\in W\
0,&x\notin W^c
\end{cases}
$$

这里$\varphi(x)$所属的区间$W,W^c$是依赖于真实情况的，而不是假设检验中假设。所以他是没有错误的，不受假设错误影响的示性函数、检验函数。
比如，假设本身错误，备择假设成立。这个时候假设的$W^c$接受域为原假设接受范围，假设的拒绝域$W$为备择假设的范围。但是示性函数拒绝域的范围为假设的接受域的范围$W^c$，接受域的范围为假设的拒绝域的范围$W$

第一类错误：当原假设$H_0$本来成立，样本观察值落入拒绝与$W$，我们错误的拒绝了$H_0$，称为弃真错误，其概率：
$$
\alpha(\theta)=P_\theta{x\in W},\theta\in\Theta_0
$$
第二类错误：当原假设$H_0$本来不成立时，样本观察值落入接受域$W^c$，我们错误的接受了$H_0$，称为取伪错误，其概率为：
$$
\beta(\theta)=P_\theta{x\notin W}=1-P_\theta{x\in W},\theta\in\Theta_1e
$$

$$
p(x\in W|H_0为真)=\alpha 接受域放弃 \
p(x\in W^c|H_0为真) 接受域本身错误
$$

$\alpha$越大，第一类错误发生的错误越小，第二类错误发生的概率越大。
不能同时减小，增加了样本容量可以减少两类错误。

本质上是用来衡量犯错的理论概率的，与样本检验是否犯错并没有本质联系。

这里的势是一种概率，与区间估计的拒绝度对应。

这里的势不依赖于假设，而是一种本质的基于总体真正的属性的计算值。（假设是一种猜测，验证后才可以使准确地）$\varphi(x)$是显示总体本身真实属性的函数，不依赖于假设，与是否犯错无关。

$$
g(\theta)=P_\theta{x\in W}=E_\theta(\varphi(x)),\theta\in\Theta\
$$

二者都具有：总体、参数、（统计量的）区间、概率。
区间估计。总体分布已知。参数未知。参数的分布范围与概率对应。本质上在于确定区间范围与概率的对应。是一种理论计算，不涉及具体的样本。
假设检验。总体分布已知。参数未知。估计参数，使用统计量的区间进行判定。概率表示出错的范围。本质上在于确定区间范围与参数假设的对应。是一种实际的计算，需要具体的样本验证。
这里在逻辑上没有说接受概率和拒绝概率。接受概率和拒绝概率是区间估计那里的置信度和拒绝度。而这里用犯错概率来引入概率的影响，因为这里的接受和拒绝依赖于实际的样本，而区间估计并不依赖于实际的样本，是一种理论计算。所以犯错依赖于概率。