# 数理统计基本概念 ## 1 总体、个体、样本、随机变量 ### 基本概念 灯泡总体 N 个,次品N$\theta$,随机抽取n个,n$\ll$N。不放回抽样,前一次抽取结果对后一次结果有影响。 * **总体**:研究对象的全体 * **个体**:总体中的每个对象。 * **随即变量**:个体某一方面的指标 * **独立同分布**:任意两个灯泡之间没有影响,这种独立性是一种近似假设,其实相互之间存在影响,因为太大;n个个体具有相同的概率分布特点 * **样本**:$X_1,X_2,X_3,\ldots$总体的一个子集 * **样本容量**:样本中个体的数量 * **样本空间**:样本所有的可能的取值构成的空间$X$。 > 通过抽样结果,推断总体的统计规律。首先说,概率论描述的是未发生的事件的概率。而数理统计描述的是对已经发生的事件的总结。统计规律包括概率(分布律和概率密度)、分布函数、均值、方差等统计量。 > 总体与样本的概率分布区别。 > * 总体符合的分布规律与个体符合的分布规律相同。 > * 样本的概率分布是样本个数的累加后的概率分布。 ### 参数空间与总体分布族 * **参数空间**:总体概率分布中参数所属的空间称为参数空间$\Theta=\{\theta:0<\theta<1\}$ * **总体分布族**:总体的分布是基于参数变化的,总体的分布范围$\{P^\theta:\theta\in\Theta\}$称为总体分布族。 > 常见的题型:由样本对总体的特性进行推断:已知含有参数的总体分布,通过样本来确定参数。 ## 2 统计模型-离散型随机变量 ### 两点分布 $$ X\sim B(1,p)\\ P(X=k)=p^k(1-p)^{1-k},k=0,1\\ E(X)=p \\ D(X)=p(1-p) \\ $$ ### 二项分布 $$ X\sim B(n,p)\\ P(X=k)=C_n^k p^k(1-p)^{n-k},k=0,1,\dotsm,n \\ E(X)=np \\ D(X)=np(1-p) \\ $$ ### 泊松分布 $$ X\sim \pi(\lambda) \\ P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda} \\ E(x)=\lambda \\ D(X)=\lambda \\ $$ ### 几何分布 $$ X\sim G(p) \\ P(X=k)=(1-p)^{k-1}p,k=1,2,\dotsm \\ E(X)=\frac{1}{p}\\ D(X)=\frac{1-p}{p^2} $$ ### 超几何分布 总数N,特殊品M,无放回抽取n次,抽中M类的数量X $$ X\sim H(N,M,n)\\ P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\\ E(X)=\frac{nM}{N}\\ D(X)=\frac{nM}{N}-(\frac{nM}{N})^2+\frac{n(n-1)M(M-1)}{N(N-1)} $$ 当N趋近于正无穷时,超几何分布趋近于二项分布 ## 3 统计模型-连续型随机变量 ### 均匀分布 $$ X\sim U(a,b) \\ f(x)=\begin{cases} \frac{1}{b-a}& a\leq x \leq b \\ 0 & else\\ \end{cases} \\ E(x)=\frac{a+b}{2} \\ D(X)=\frac{(b-a)^2}{12} \\ $$ ### 指数分布 $$ X\sim E(\lambda) \\ f(x)=\begin{cases} \lambda e^{-\lambda x}&x>0\\ 0 & x\leq 0 \\ \end{cases} \\ E(X)=\frac{1}{\lambda}\\ D(X)=\frac{1}{\lambda^2}\\ $$ ### 正态分布 $$ X\sim N(\mu,\sigma^2) \\ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{{(x-\mu)}^2}{2 \sigma^2}},-\infin < x < + \infin \\ E(X)=\mu \\ D(X)=\sigma^2 \\ $$ ## 4 特殊统计模型 ### 对数正太分布 $$ \ln X\sim N(\mu,\sigma^2)\\ f(x)=\frac{1}{\sqrt{2\pi}\sigma x}e^{-\frac{{(\ln x-\mu)}^2}{2 \sigma^2}},-\infin < x < + \infin \\ E(X)=e^{\mu+\frac{\sigma^2}{2}} \\ D(X)=(e^{\sigma^2}-1)e^{2\mu+\sigma^2}\\ $$