Khan公开课 - 统计学学习笔记:(七)伯努利分布、置信区间、t分布、p-value和第一型错误
2012-10-06 16:26
471 查看
伯努利分布(Bernoulli Distribution)
Bernoulli Distribution是最简单的二项式分布,只有两个选择,Y or N,以0表示N,1表示Y。在日常生活中也比较常见,符合非黑即白的二元思维,例如投票预测。假设p表示Y(1)的概率,那么N(0)的概率为1-p。
Mean或者期望值E(X)=μ=p
方差
,这在二项式方差中我们也推倒过。
误差范围和置信区间
在中心极限定理中的举例就是就是误差范围。所为的置信区间,就是有某个几率落在该误差范围内。Find an interval such that reasonably confident that there is an given chance the true μ=p is in the interval.
以Bernoulli Distribution为例,在抽样的100个样本中
,例如某个娱乐节目最后一轮投票,总本很大,有1亿。我们需要从样本中推出,95%的概率,真实的μ=p的误差范围(margin of error)。根据给出数字,计算出
根据central limit theorem,我们知道样本均值是符合正态分布的。而95%(准确应该是95.4%)就是2σ范围。
P(
is within 2
of
, n=100) = 95.4%
我们不知道确切的
,但可以用S来进行估算,
,本例子中 ≈0.05。
P(
is within 2
(±0.1) of
) = 95.4%
P(
is within 2
(±0.1) of
) = 95.4%
P(μ=
=p is within 0.43±0.1) ≈ 95%,换言之p有95%分布在0.33和0.53中,即95%的置信区间为(0.33,0.53),范围还是挺大的,要缩小范围,增加n的值。
小样本容量的置信空间
一般来讲,n<30,不能进行好的估计,针对这种情况,给出t distribution对sample mean分布进行修正。
T分布和正态分布相似,具有fatter tail,因为低估了S。对应的,不再去查z table,而是去查t table。T table的列为自由度degrees of freedom,即n-1。
有些记法在
上面加了个帽子记为
,表示这是由样本标准差估算出来的sample mean的standard devication。
p-value、双侧检查和单侧检查
再举一个实际的用途,例如在普通的情况下,μ=1.2,在特殊情况下,例如药物等作用,在n=100的情况下,药物组的
=1.05,S=0.5。问药物是否起作用。
在此我们假设药物不起作用,一般记为
H0:药物不起作用,μ=1.2。
H1:药物起作用,μ≠1.2。在这个例子,我们只是考虑药物是否有效,而不考虑是正效果和效果,称为双侧检查two tailed test。
H0即null Hypothesis,H1表示备选(也有人记为Ha,如果p-value=P(H0)的概率很低,认为H1成立。
根据中心采样定理,计算出
=0.05,z=3,也就是P(result more extreme)=P(
<1.05
or
>1.35)=0.3%。也就是此例中p-value=0.003,对于p-value≤0.05(通常定义的阈值称为significance level,记作α),可以认为假设不成立。在本例中认为(非绝对)药物起作用。
如果是单侧检查one tailed test。例如上面的例子中药物会改善或者无效。
H0:药物不起作用,μ=1.2。
H1:药物起作用,μ<1.2。
p-value=P(result more extreme)=P(mean lower than 1.05)=0.0015,故H0的概率低,我们选择H1。
第一型错误(Type I error)
所谓的Type I error,即Rejecting H0 even through it is true.我们选择H1,不是100%的正确,概率很大。在上面的单侧检查的例子中,Type I error with probability = 0.15%.
相关链接:我的四方书库
Bernoulli Distribution是最简单的二项式分布,只有两个选择,Y or N,以0表示N,1表示Y。在日常生活中也比较常见,符合非黑即白的二元思维,例如投票预测。假设p表示Y(1)的概率,那么N(0)的概率为1-p。
Mean或者期望值E(X)=μ=p
方差
,这在二项式方差中我们也推倒过。
误差范围和置信区间
在中心极限定理中的举例就是就是误差范围。所为的置信区间,就是有某个几率落在该误差范围内。Find an interval such that reasonably confident that there is an given chance the true μ=p is in the interval.
以Bernoulli Distribution为例,在抽样的100个样本中
,例如某个娱乐节目最后一轮投票,总本很大,有1亿。我们需要从样本中推出,95%的概率,真实的μ=p的误差范围(margin of error)。根据给出数字,计算出
根据central limit theorem,我们知道样本均值是符合正态分布的。而95%(准确应该是95.4%)就是2σ范围。
P(
is within 2
of
, n=100) = 95.4%
我们不知道确切的
,但可以用S来进行估算,
,本例子中 ≈0.05。
P(
is within 2
(±0.1) of
) = 95.4%
P(
is within 2
(±0.1) of
) = 95.4%
P(μ=
=p is within 0.43±0.1) ≈ 95%,换言之p有95%分布在0.33和0.53中,即95%的置信区间为(0.33,0.53),范围还是挺大的,要缩小范围,增加n的值。
小样本容量的置信空间
一般来讲,n<30,不能进行好的估计,针对这种情况,给出t distribution对sample mean分布进行修正。
T分布和正态分布相似,具有fatter tail,因为低估了S。对应的,不再去查z table,而是去查t table。T table的列为自由度degrees of freedom,即n-1。
有些记法在
上面加了个帽子记为
,表示这是由样本标准差估算出来的sample mean的standard devication。
p-value、双侧检查和单侧检查
再举一个实际的用途,例如在普通的情况下,μ=1.2,在特殊情况下,例如药物等作用,在n=100的情况下,药物组的
=1.05,S=0.5。问药物是否起作用。
在此我们假设药物不起作用,一般记为
H0:药物不起作用,μ=1.2。
H1:药物起作用,μ≠1.2。在这个例子,我们只是考虑药物是否有效,而不考虑是正效果和效果,称为双侧检查two tailed test。
H0即null Hypothesis,H1表示备选(也有人记为Ha,如果p-value=P(H0)的概率很低,认为H1成立。
根据中心采样定理,计算出
=0.05,z=3,也就是P(result more extreme)=P(
<1.05
or
>1.35)=0.3%。也就是此例中p-value=0.003,对于p-value≤0.05(通常定义的阈值称为significance level,记作α),可以认为假设不成立。在本例中认为(非绝对)药物起作用。
如果是单侧检查one tailed test。例如上面的例子中药物会改善或者无效。
H0:药物不起作用,μ=1.2。
H1:药物起作用,μ<1.2。
p-value=P(result more extreme)=P(mean lower than 1.05)=0.0015,故H0的概率低,我们选择H1。
第一型错误(Type I error)
所谓的Type I error,即Rejecting H0 even through it is true.我们选择H1,不是100%的正确,概率很大。在上面的单侧检查的例子中,Type I error with probability = 0.15%.
相关链接:我的四方书库
相关文章推荐
- Khan公开课 - 统计学学习笔记:(一)中间值和统计图表
- Khan公开课 - 统计学学习笔记:(十)Chi-square分布
- Khan公开课 - 统计学学习笔记:(三)随机变量、概率密度、二项分布、期望值
- Khan公开课 - 统计学学习笔记:(十二)逻辑
- Khan公开课 - 统计学学习笔记:(八)样本均值之差
- Khan公开课 - 统计学学习笔记:(六)中心极限定理
- Khan公开课 - 统计学学习笔记:(二)总本、样本、集中趋势、离中趋势
- Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计
- Khan公开课 - 统计学学习笔记:(四)泊松分布、大数定理
- Khan公开课 - 统计学学习笔记:(五)正态分布
- Khan公开课 - 统计学学习笔记:(九)线性回归公式,决定系数和协方差
- Khan公开课 - 概率学习笔记(一)独立事件、相依事件和排列组合
- Khan公开课 - 概率学习笔记(二)无顺序独立事件、数学符号、Bayes's Law、非公平概率计算
- python学习笔记:字典嵌套,将字典作为VALUE加入字典中
- OpenCV学习笔记(3)用VS2008编译OpenCV2.0源代码(编译错误已解决)
- Tomcat学习笔记 - 错误日志 - NetBeans配置tomcat出错情况总结 -- 部署错误: 启动 Tomcat 失败。-- '127.0.0.1' 不是内部或外部命令,也不是可运行的程序
- springboot学习笔记3(全局错误页面)
- spring+mybatis轻量级企业框架的学习之路之错误笔记day04
- XSL学习笔记3 XSLT的模板规则<xsl:value-of>和<xsl:for-each>
- Web Mining and Big Data 公开课学习笔记 ---lecture1