Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计
2012-10-17 15:40
309 查看
平方之和与自由度之和
这部分实际也是通过χ2为基础进行推导的,但是具体的数学证明不讲,可通过直观案例说明。有一个3(m)×3(n)的列阵。
共9个样本,样本均值为4,也是各组均值的均值,即mean of means。对于sum of square有:总体sum of square = 组内 sum of square + 组间 square,或者说总体波动=组内波动+组件波动。我们进行直观验证
SST =(3-4)2+(2-4)2+(1-4)2+(5-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2= 30,9个数,知道均值,从其中8个可以推出另外一个,故自由度为mn-1=3*3-1=8。
SSW= (3-2)2+(2-2)2+(1-2)2+(5-4)2+(3-4)2+(4-4)2+(5-6)2+(6-6)2+(7-6)2= 6,在每组中:知道组的mean,每组自由度为n-1,总共m(n-1),本例3(3-1)=6
SSB= (2-4)2+(2-4)2+(2-4)2+(4-4)2+(4-4)2+(4-4)2+(6-4)2+(6-4)2+(6-4)2= 24,知道总的mean,最有一组的mean可以推到处理,故自由度为m-1=3-1=2
有SST=SSW+SSB,以及总自由度=组内自由度+组间自由度。
[b]例子:F统计[/b]
有3组食用不同的食物,分别有3个测量采样,问不同食物是否存在影响?还是采样值属于正常波动。
H0:Food does not make a difference, →μ1=μ2=μ3;
H1: It does
Assume H0 is true,将使用到F统计,F statistics,服从F distribution,F表示Fisher,生物学家兼统计学家,F statistics实际上是两个χ2分布的比较
如果数值越高,表示组间的波动大于组内的波动,各组之间就很可能存在差异。
在本例中F-statistics=(24/2)/(6/6)=12
对于α=10%,可以http://www.socr.ucla.edu/applets.dir/f_table.html查,(【注】要查不同α的F distribution table,不要去百度,查不出来,查Google就可以了)查F Table for α = 0.10,查df1=2,df2=6,查得critical
F value=3.46,Fc=3.46,而本例的F值远大与此,所有出现这样的采样的概率远远低于10%,可以拒绝H0。
相关链接:我的四方书库
这部分实际也是通过χ2为基础进行推导的,但是具体的数学证明不讲,可通过直观案例说明。有一个3(m)×3(n)的列阵。
共9个样本,样本均值为4,也是各组均值的均值,即mean of means。对于sum of square有:总体sum of square = 组内 sum of square + 组间 square,或者说总体波动=组内波动+组件波动。我们进行直观验证
SST =(3-4)2+(2-4)2+(1-4)2+(5-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2= 30,9个数,知道均值,从其中8个可以推出另外一个,故自由度为mn-1=3*3-1=8。
SSW= (3-2)2+(2-2)2+(1-2)2+(5-4)2+(3-4)2+(4-4)2+(5-6)2+(6-6)2+(7-6)2= 6,在每组中:知道组的mean,每组自由度为n-1,总共m(n-1),本例3(3-1)=6
SSB= (2-4)2+(2-4)2+(2-4)2+(4-4)2+(4-4)2+(4-4)2+(6-4)2+(6-4)2+(6-4)2= 24,知道总的mean,最有一组的mean可以推到处理,故自由度为m-1=3-1=2
有SST=SSW+SSB,以及总自由度=组内自由度+组间自由度。
[b]例子:F统计[/b]
有3组食用不同的食物,分别有3个测量采样,问不同食物是否存在影响?还是采样值属于正常波动。
H0:Food does not make a difference, →μ1=μ2=μ3;
H1: It does
Assume H0 is true,将使用到F统计,F statistics,服从F distribution,F表示Fisher,生物学家兼统计学家,F statistics实际上是两个χ2分布的比较
如果数值越高,表示组间的波动大于组内的波动,各组之间就很可能存在差异。
在本例中F-statistics=(24/2)/(6/6)=12
对于α=10%,可以http://www.socr.ucla.edu/applets.dir/f_table.html查,(【注】要查不同α的F distribution table,不要去百度,查不出来,查Google就可以了)查F Table for α = 0.10,查df1=2,df2=6,查得critical
F value=3.46,Fc=3.46,而本例的F值远大与此,所有出现这样的采样的概率远远低于10%,可以拒绝H0。
相关链接:我的四方书库
相关文章推荐
- Khan公开课 - 统计学学习笔记:(六)中心极限定理
- Khan公开课 - 统计学学习笔记:(二)总本、样本、集中趋势、离中趋势
- Khan公开课 - 统计学学习笔记:(七)伯努利分布、置信区间、t分布、p-value和第一型错误
- Khan公开课 - 统计学学习笔记:(九)线性回归公式,决定系数和协方差
- Khan公开课 - 统计学学习笔记:(一)中间值和统计图表
- Khan公开课 - 统计学学习笔记:(十)Chi-square分布
- Khan公开课 - 统计学学习笔记:(三)随机变量、概率密度、二项分布、期望值
- Khan公开课 - 统计学学习笔记:(八)样本均值之差
- Khan公开课 - 统计学学习笔记:(四)泊松分布、大数定理
- Khan公开课 - 统计学学习笔记:(五)正态分布
- Khan公开课 - 统计学学习笔记:(十二)逻辑
- Khan公开课 - 概率学习笔记(二)无顺序独立事件、数学符号、Bayes's Law、非公平概率计算
- 应用统计学与R语言实现学习笔记(十一)——判别分析
- Khan公开课 - 概率学习笔记(一)独立事件、相依事件和排列组合
- 应用统计学与R语言实现学习笔记(十一)——判别分析
- Coursera公开课笔记: 斯坦福大学机器学习第九课“神经网络的学习(Neural Networks: Learning)”
- 设计模式学习笔记十一:观察者模式
- python_cookBook 学习笔记十一
- Mysql-学习笔记(==》触发器 十一)