您的位置:首页 > 其它

假设检验

2015-06-02 11:33 134 查看

假设检验

思想是“带概率的反证法”:作一个假设,算出合理结果,和抽样的结果进行比较,选择拒绝或者不拒绝原假设。不是纯粹的反证法,而是认为小概率事件在一次观察中基本不可能发生。

零假设:要检验的假设,记作H0H_0,是关于随机变量X(总体)的一个“看法”

备择假设:也叫对立假设,与零假设互斥的假设。

检验法

检验水平:拒绝H_0的标准

接受域

拒绝域:也叫否定域,记作WW,一般用统计量确定

一般希望得到拒绝原假设的结论

错误

第一类错误:否定H0H_0的错误为第一类错误,用α\alpha表示。

第二类错误:接受H0H_0的错误,用β\beta表示。

假设检验的原则:控制第一类错误在一定水平以下。

一般是固定一个检验水平α\alpha,找到原假设不成立条件下功效尽可能小的检验法,这样的结果比较可信。

功效函数:拒绝原假设的概率。原假设成立时功效函数就是犯I型错误的概率;在原假设不成立的条件下是不犯II型错误的概率。

在原假设成立条件下,功效函数越小越好;反之越大越好。

检验统计量

临界值:与检验水平对应的检验统计量的取值。

假设检验一般步骤

利用样本,求出θ\theta的一个较好点估计θ^=θ^(X1,...,Xn)\hat \theta=\hat\theta(X_1,...,X_n)

以θ^\hat\theta为基础,构造检验统计量T=φ(X1,...,Xn)=g(θ^)T=\varphi(X_1,...,X_n)=g(\hat\theta),使得当θ=θ0\theta=\theta_0时,TT分布为标准分布

以T为基础,构造拒绝域或者计算pp值

在显著水平α\alpha下,判断拒绝或不拒绝H0H_0.

单个样本正态总体假设检验

四种问题:

类型统计量分布
已知方差,检验均值H0:u=u0H_0:u=u_0X¯¯¯−μ0σ2/n−−−−√\dfrac{\overline X-\mu_0}{\sqrt{\sigma^2/n}}正态分布
未知方差,检验均值H0:u=u0H_0:u=u_0X¯¯¯−μ0S2/n−−−−−√\dfrac{\overline X-\mu_0}{\sqrt{S^2/n}}tt分布,t(n−1)t(n-1)
未知均值,检验方差H0:σ2=σ20H_0:\sigma^2=\sigma_0^2(n−1)S2σ20\dfrac{(n-1)S^2}{\sigma_0^2}χ2\chi^2分布,χ2(n−1)\chi^2(n-1)
未知均值,检验方差H0:σ2≤σ20H_0:\sigma^2\leq\sigma_0^2(n−1)S2σ2\dfrac{(n-1)S^2}{\sigma^2}χ2\chi^2分布,χ2(n−1)\chi^2(n-1)

双侧假设 vs 单侧假设

p值

单边检验中pp值是能否定H0H_0的最小的检验水平。样本值落入否定域的充分必要条件是pp值小于等于α\alpha.

双边检验中pp值同样是能否定H0H_0的最小检验水平。

两个正态总体的假设检验

四种问题

1. 未知两个方差,知道两者相等,零假设:两个均值相等。独立两样本t检验

2. 未知两个均值,零假设:两个方差相等

3. 未知两个均值,零假设:σ2≤σ2\sigma^2\leq\sigma^2

4. 未知两个方差,知道两者不相等,零假设:两个均值相等

- 四种问题:

类型统计量分布
方差相等,检验均值H0:u=u0H_0:u=u_0X¯−Y¯(1n1+1n2)σ^2−−−−−−−−−−√\dfrac{\bar X-\bar Y}{\sqrt{(\frac 1{n_1}+\frac1{n_2})\hat\sigma^2}}t(n1+n2−2)t(n_1+n_2-2)
未知均值,检验方差H0:σ2=σ20H_0:\sigma^2=\sigma_0^2S21S22\dfrac{S_1^2}{S_2^2}F(n1−1,n2−1)F(n_1-1,n_2-1)
未知均值,检验方差H0:σ2≤σ20H_0:\sigma^2\leq\sigma_0^2S21S22\dfrac{S_1^2}{S_2^2}F(n1−1,n2−1)F(n_1-1,n_2-1)
方差不等,检验均值H0:u=u0H_0:u=u_0X¯−Y¯S21n1+S22n2−−−−−−−√\dfrac{\bar X-\bar Y}{\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}}t(m∗)t(m^*)
σ^2=1n1+n2−2[∑(xi−x¯2)+∑(yi−y¯2)]m=(S21n1+S22n2)21n1−1(S21n1)2+1n2−1(S22n2)2\hat\sigma^2=\frac1{n_1+n_2-2}[\sum(x_i-\bar x^2)+\sum(y_i-\bar y^2)]\\m=\frac{(\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2})^2}{\frac{1}{n_1-1}(\frac{S_1^2}{n_1})^2+\frac{1}{n_2-1}(\frac{S_2^2}{n_2})^2}

查表时取距离m∗m^*最近的整数

各个分布之间的关系

X∼N(0,1)⇒X2∼χ2(1)X\sim N(0,1)\Rightarrow X^2\sim \chi^2{(1)}

X∼t(n)⇒X2∼F(1,n)X\sim t(n)\Rightarrow X^2\sim F(1,n)

比率的假设检验

总体分布的假设检验

Q-Q图

列联表的独立性检验

只知道相关关系,不知道因果关系
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: