概率论与数理统计
文章
第10节 Minimax估计和Bayes估计
Minimax估计和Bayes估计1 一致占优定义1:损失定义损失,是一种距离。$$L(\theta,T(x))=(T(x)-\theta)^2$$ 损失函数,这只是鬼畜了风险函数的一种 定义2:风险函数风险,平均损失$$R(\theta,T)=E_XL(\theta,T(x))=E_X(T(x)-\theta)^2$$ 均方误差是损失函数的期望,也是一种风险 定义3:一致占优$$R(\theta,T_1)\leq R(\theta,T_2),\forall \theta$$ 2 Minimax估计定义1:Minimax$$\sup_\theta R(\theta,T_1)\leq \sup_\theta(\theta,T_2)$$先找到最大风险,再找到最大风险最小的策略 3 定义2:Bayes估计 把参数\theta当成随机变量处理 $$E_\theta(R(\theta,T_1))\leq E_\theta(R(\theta,T_2))$$ $E_theta$与$E_X$不同,在bayes理论中,条件期望$$ E_X(L(\theta,...
第11节 假设检验
假设检验相关定义 第一章阐述样本统计量与总体属性的关系。第二章参数估计,通过样本的统计量对总体的参数进行估计。并对估计的优劣进行判断,求最优的统计量。区间估计主要是通过置信水平,求置信区间。第三章假设检验。总体分布已知,参数已知。通过样本的统计量,对参数的正确性进行验证。 本节的逻辑 对参数做出假设,$\Theta_0,\Theta_1$。 计算检验统计量的接受拒绝区间$W^c,W$。 检验统计量的拒绝接受区间对应的概率。称为势和势函数。 定义1:原假设与备择假设 所要检验的假设称为原假设或零假设,记为$H_0$。 与$H_0$不相容的假设称为备择假设或对立假设,记为$H_1$。 对参数分布族${p(x;\theta):\theta\in\Theta}$,原假设和备择假设这对矛盾统一体,称为假设检验:$$H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1$$ 定义2:拒绝域、接受域、检验统计量、检验函数 这里最奇怪的地方是反向表示,拒绝、失信为首选方,使用简单的方式表示。$\alpha,W,\varphi(x)=1$ ...
第12节 正太总体参数的假设检验
正太总体参数的假设检验 一会单独复习这里 1 单个总体-方差已知-均值检验假设检验类型$$\begin{aligned}H_0:\mu=\mu_0,& H_1:\mu>\mu_0\H_0:\mu\leq\mu_0,&H_1:\mu>\mu_0\H_0:\mu=\mu_0,&H_1:\mu<\mu_0\H_0:\mu\geq\mu_0,&H_1:\mu<\mu_0\end{aligned}$$ 假设检验-z检验步骤 关于假设检验,需要使用样本统计量和临界值对应样本空间的接受域和拒绝域。 命题假设$H_0:\mu\in\Theta_0,H_1:\mu\in\Theta_1$ 检验统计量$z=\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$ 根据检验水平计算拒绝域的临界值$\双侧检验W={(x_1,\dotsm,x_n:|z|\geq z_{1-\frac{\alpha}{2}}}\单侧检验W...
第13节 Pearson检验法
Pearson检验1 总体分布的$\chi^2$拟合检验定理:Pearson定理 条件$$样本容量n充分(n>=50),无论总体服从何种分布F_0(x)\\chi^2=\sum_{i=1}^k\frac{(f_i-np_i)^2}{np_i}\$$ 结论$$统计量\chi^2服从自由度为k-1的\chi^2分布$$ 步骤 把实轴$(-\infin,+\infin)$分成k个互不相交的区间$A_i=(a_i,a_{i+1}],i=1,2,\dotsm,k$,其中$a_1,a_{k+1}$分别取$-\infin,+\infin$。区间划分视具体情况而定。 计算概率。计算$np_i$称为理论频数$$p_i = P{X\in A}=F_0(a_{i+1})-F_0(a_i),i=1,2,\dotsm,k\$$ 计算样本观察值$x_1,\dotsm,x_n$落在区间$A_i$上的个数$f_i$,称为实际频数。 通过计算公式计算$\chi^2$的值 对于给定的显著性水平$\alpha$可得临界值$\chi...
第14节 似然比检验
似然比检验1 似然比检验似然比 假设检验$$H_0:\theta\in\Theta_0,H_1:\theta\in\Theta_1\\Theta=\Theta_0\cup\Theta_1$$ 似然比统计量$$\lambda(x)=\frac{\sup_{\theta\in\Theta_1}{p(x_1,\dotsm,x_n;\theta)}}{\sup_{\theta\in\Theta_0}{p(x_1,\dotsm,x_n;\theta)}}\or\\lambda(x)=\frac{\sup_{\theta\in\Theta}{p(x_1,\dotsm,x_n;\theta)}}{\sup_{\theta\in\Theta_0}{p(x_1,\dotsm,x_n;\theta)}}\$$ 临界值$$\lambda(x)\geq c\W={(x_1,x_2,\dotsm,x_n):\lambda(x)\geq c}\P_{\the...
第15节 检验的优良性
检验的优良性1 Neyman-Pearson引理定义:最优势检验 声明$$检验问题:H_0:\theta=\theta_0,H_1:\theta=\theta_1$$ 条件$$存在检验水平\alpha的检验函数\varphi^\in\varPhi_\alpha,\任一水平为\alpha的检验\varphi\in\varPhi_\alpha,有:\E_{\theta_1}(\varphi^(x))\geq E_{\theta_1}(\varphi(x))成立\$$ 结论$$成检验函数\varphi^*为假设检验的水平为\alpha的最优势检验。(MPT)$$ 定理:Neyman-Pearson基本引理 声明$$检验水平\alpha,检验函数\varphi(x),\varphi\in\varPhi_\alpha$$ 条件$$\varphi(x)=\begin{cases} 1,\lambda(x)>k\ 0,\lambda(x)<k\end{cases}\E_{\theta_0}(\varphi(x))=\alpha\检验函数...
第16节 一元线性回归
一元线性回归1 回归分析理解变量关系 确定性关系:可用函数来描述。 非确定性关系:不能用函数来描述。 回归分析 回归模型:变量间相关关系无法用完全确定的函数关系描述,但在平均意义下,有一定的函数表示式。通过大量数据,估计函数表示式,称为回归分析。回归分析中根据观测数据建立的反映变量间相关关系的统计模型称为回归模型。 回归分析分类 随机变量间的相关关系。 随机变量与普通变量间的相关关系。 随机变量与普通变量的相关关系的回归分析:普通变量更像一个参数,能够决定随机分布的参数。建立的函数关系式是参数$E(Y)=\mu$与普通变量之间的关系。 相关定义响应变量和解释变量 响应变量+解释变量:在随机变量与普通变量的回复分析中,随机变量是因变量,或响应变量。普通变量为自变量,或解释变量。 回归分析的元 一元回归分析:一个响应变量+一个解释变量 多元回归分析:一个响应变量+多个解释变量 多元多重回复分析:多个响应变量+多个解释变量 回归分析的方法 线性回归:线性统计模型 多项式回归: 神经网络(常数回归?): 支持向量积(不知道诶): 这里很难用同一个分...
第17节 多元线性回归
多远线性回归1 多元线性回归的数学描述定义:多元线性回归 声明$$随机变量与,p个普通变量x_1,\cdots,x_p$$ 多元线性回归表示$$\begin{cases} y=\beta_0+\beta_1x_1+\cdots+\beta_px_p+\varepsilon\ E(\varepsilon)=0,Var(\varepsilon)=\sigma^2<+\infin\end{cases}$$ 样本方程组表示(矩阵向量) $$Y=X\beta+\varepsilon\E(\varepsilon)=0,Var(\varepsilon)=\sigma^2I_n\Y=\begin{bmatrix} y_1\ \vdots\ y_n\end{bmatrix},X=\begin{bmatrix} 1 &x_{11} &\cdots &x_{1p}\ \vdots &\vdots &&\vdots\ 1&...
第18节 方差分析
方差分析1 单因素试验方差分析 第三章假设检验,主要用来检验两个总体的均值和方差的关系。这里的方差分析,主要用来检验多个不同的因素的均值和方差的关系。 关于假设检验部分的内容的补充: 首先,假设随机变量总体符合某种分布,其均值、方差或者方差应该是已知的。 可以得到样本的一致最小方差无偏估计,估计总体的均值、方差或者其他参数。 可以给定一个置信水平,能够得到取值的一个分布区间,如果样本取值分布在这个区间中,表示检验可靠。 如果样本总体的均值、方差或者数据特征,本身的一致最小方差无偏估计的分布很难求,可以构造正太总体、正太统计量。检验水平—-对应总体均值、方差的统计量分布区间—-对应总体均值、方差构造的函数的统计量的分布区间。 定义:水平 因素:影响实验结果的原因 水平:实验中因素所处的不同状态。 模型构建1 问题重述 因素A有p个不同的水平,$A_1\cdots A_p$ 每个水平$A_i$下总体$X_i$服从同方差的正太分布$N(\mu_i,\sigma^2)$,参数未知。 检验p个样本的均值$\mu_i$是否具有显著性差异 样本观察值,因素A下每个检验水平有$n_...
第19节 正交实验设计
正交试验设计1 无交互作用的正交试验极差分析正交表$$L_9(3^4)$$ 9次实验,9行 3个水平,3个可取值。 4个因素,4列 正交表性质 每个因素的每个水平都出现过,且不同水平出现的次数相同 任意两列中,所有可能的有序对数出现的次数相同。 正交表极差分析 $T_{2j}$表示某个因素,第2个水平求和的值 $R_j$表示极差 主次影响 最优方案 2 有交互作用的正交试验极差分析正交表的极差分析 $A \times B$表示AB交互影响的列,通过交互作用表决定其位置 $T_{2j}$表示某个因素,第2个水平求和的值 $R_j$表示极差 主次影响 最优方案。选取最优方案时,确定数值越小越好还是越大越好。交互作用单独列表,写出每种搭配,选取最后搭配。 3 无交互作用的正交试验方差分析正交表$$L_n(t^m)\n-1=m(t-1)$$ n表示实验的次数 t表示因素的水平数 m表示因素的个数,包括空列 方差分析$$S_T = \sum_{i=1}^n(y_i-\overline{y})^2=\sum_{i=1}^n-\f...













