统计之 - 独立性检验
2014-10-27 11:22
218 查看
独立性检验(Testfor Independence)是根据频数来判断两类因子是彼此独立还是彼此相关的一种假设检验。假如对某一个数据集有X(值域为x1,x2)跟Y(值域为y1,y2)变量,下面是他们的频数表:
我们可以使用独立性检验来了解变量x与y是否有关系,并且能较准确的给出这种判断的可靠程度。具体做法是由上面的频数表计算出随机变量K2的值:
其中K方的值越大,说明变量X与变量Y有关系的可能性越大。当频数表中a、b、c、d的值都不小于5的时候,可以查阅下表来确定“X与Y有关系”的可信程度:
我们为什么不能只凭列联表中的数据和由其绘出的图形得出两个变量是否有关系的结论呢?这是因为由列联表可以粗略地估计出两个变量(两类对象)是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用独立性检验的方法确认所得结论在多大程度上适用于总体。
x1 | x2 | 汇总 | |
y1 | a | b | a+b |
y2 | c | d | c+d |
汇总 | a+c | b+d | a+b+c+d |
其中K方的值越大,说明变量X与变量Y有关系的可能性越大。当频数表中a、b、c、d的值都不小于5的时候,可以查阅下表来确定“X与Y有关系”的可信程度:
我们为什么不能只凭列联表中的数据和由其绘出的图形得出两个变量是否有关系的结论呢?这是因为由列联表可以粗略地估计出两个变量(两类对象)是否有关(即粗略地进行独立性检验),但2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用独立性检验的方法确认所得结论在多大程度上适用于总体。
相关文章推荐
- Excel在统计分析中的应用—第九章—非参数检验-独立性检验
- Excel在统计分析中的应用—第九章—非参数检验-独立性检验(x2统计量简化公式应用)
- 数据挖掘基础:独立性检验
- Excel在统计分析中的应用—第八章—假设检验-方差未知且为大样本下总体均值检验
- 独立性检验的基本思想和初步应用
- 基于卡方的独立性检验
- Netstat用于显示与IP、TCP、UDP和ICMP协议相关的统计数据,一般用于检验本机各端口的网络连接情况
- P 值(p value)与统计检验
- 【经验分享】卡方检验实战--检验次日留存率与用户分类的独立性
- 统计模型检验
- 独立性检验
- matlab概率及数理统计学习-T检验、卡方检验、直方图分布检验
- Excel在统计分析中的应用—第八章—假设检验-总体比例之差是否为不为零常数的检验
- 概率数理统计-- 1.3 事件的运算、条件概率与独立性
- 概率与数理统计11--随机变量的独立性
- Netstat用于显示与IP、TCP、UDP和ICMP协议相关的统计数据,一般用于检验本机各端口的网络连接情况
- 关于统计检验中P值的解释
- Excel在统计分析中的应用—第八章—假设检验-方差已知下总体均值之差的检验
- 各种统计假设检验的个人认识之一---卡方检验(Chi-square test)
- 独立性检验