您的位置:首页 > 其它

Udacity机器学习入门项目1:检验心理学现象

2018-01-08 10:24 357 查看
统计学:决策的科学项目说明

背景信息

在一个 Stroop(斯特鲁普)任务中,参与者得到了一列文字,每个文字都用一种油墨颜色展示。参与者的任务是将文字的打印颜色大声说出来。这项任务有两个条件:一致文字条件,和不一致文字条件。在一致文字条件中,显示的文字是与它们的打印颜色匹配的颜色词,如“红色”、“蓝色”。在不一致文字条件中,显示的文字是与它们的打印颜色不匹配的颜色词,如“紫色”、“橙色”。在每个情况中,我们将计量说出同等大小的列表中的墨色名称的时间。每位参与者必须全部完成并记录每种条件下使用的时间。

调查问题

作为一般说明,请确保记录你在创建项目时使用或参考的任何资源。作为项目提交的一部分,你将需要报告信息来源。

1.    我们的自变量是什么?因变量是什么?

自变量:文字条件(一致,不一致)

因变量:说出同等大小的列表中的墨色名称的时间

 

2.    此任务的适当假设集是什么?你需要以文字和数学符号方式对假设集中的零假设和对立假设加以说明,并对数学符号进行定义。你想执行什么类型的统计检验?为你的选择提供正当理由(比如,为何该实验满足你所选统计检验的前置条件)。

背景:

此效应展示了人们对事物的认知过程已是一个自动化的历程。当有一个新的刺激出现时,如果它的特征和原先的刺激相似或符合一致,便会加速人们的认知;反之,若新的刺激特征与原先的刺激不相同,则会干扰人们的认知,使人们的所需的反应时间变长。

µ-Incongruent 代表文字条件不一致的情况下,识别时间的总体均值

µ-Congruent 代表文字条件一致的情况下,识别时间的总体均值

H0: µ-Incongruent = µ-Congruent

Ha: µ-Incongruent != µ-Congruent

判断结论

 

Reject H0

Retain H0

H0 true

I型错误

保持零假设

H0 false

拒绝零假设

II型错误

H0零假设: 在文字条件一致和不一致的两种情况下, 它们识别时间的总体均值相同.

既µ-Incongruent- µ-Congruent =0;

Ha对立假设: 在文字条件一致和不一致的两种情况下, 它们识别时间的总体均值不同.

既µ-Incongruent- µ-Congruent !=0;

类型: 纵向实验,相依样本 t 检验

理由:

当我们知道总体参数时,我们选择使用 z 检验。

不知道总体参数时,我们选择使用 t 检验。

此实验中并不确定总体参数.

 

单样本:

检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一个班级的平均成绩分数是否合格。

 

双样本

独立样本:

其零假设为两个正态分布的总体的均值之差为某实数,例如检验两个班级的平均成绩分数是否相等. 对独立样本检验的要求,需要两组数据之间独立;两个班级是两个样本,他们之间相互独立,两个班级之中的每一个人也是独立的.

相依样本:

独立样本不同的地方在于,例如检验一个班级在进行了某种特殊政策的前后, 平均成绩分数是否相等.对相依样本检验的要求,仅需参与者之间互相独立。也就是说班级依然还可以同一个班级, 两个样本表示这一个班级总体在政策先后的分数,班级中的每一个人都是相互独立的.

 

针对此概念,我认为这次项目应该选用双样本-相依样本,两种样本代表同一伙人在文字条件一致和不一致的两种情况下分别的识别时间, 同一伙中的每个人之间相互独立.

 

假设

H0:样本与样本间的差异是由抽样误差引起的;

Ha:样本与样本间存在本质差异;

预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05。

α:

显著性检验,显著性检验(significancetest)就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(备择假设)是否合理,即判断总体的真实情况与原假设是否有显著性差异。 显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。

 

现在轮到你自行尝试 Stroop任务了。前往此链接,其中包含一个基于 Java 的小程序,专门用于执行 Stroop任务。记录你收到的任务时间(你无需将时间提交到网站)。现在下载此数据集,其中包含一些任务参与者的结果。数据集的每行包含一名参与者的表现,第一个数字代表他们的一致任务结果,第二个数字代表不一致任务结果。

 

3.    报告关于此数据集的一些描述性统计。包含至少一个集中趋势测量和至少一个变异测量。

 

集中趋势测量:

Congruent:

均值: 14.05

中位数: 14.36

 

Incongruent:

均值: 22.02

中位数: 21.02

 

变异测量:

Congruent:

样本标准偏差: 3.56

 

Incongruent:

样本标准偏差: 4.80

 

4.    提供显示样本数据分布的一个或两个可视化。用一两句话说明你从图中观察到的结果。

可以看出不一致的文字会使样本中的所有人反应时间延长.



 

5.    现在,执行统计测试并报告你的结果。你的置信水平和关键统计值是多少?你是否成功拒绝零假设?对试验任务得出一个结论。结果是否与你的期望一致?

置信区间95%,双侧检验,每侧0.025,自由度n=23

得到的t临界值为:正负2.069

差异均值: 7.9648

差异标准偏差为: 4.8648

标准误差: 0.993

t-statistic: 8.0209

8.0209 >2.069

 

成功拒绝零假设,结论是文字条件不一致会使人们反映时间变长,与期望结果一致.

 

 P值

查询t-table得到p值是<0.0005的

在α=0.05的情况下

很明显是p < α

 

6.    可选:你觉得导致所观察到的效应的原因是什么?你是否能想到会取得类似效应的替代或类似任务?进行一些调查研究将有助于你思考这两个问题!

可能是思维的反应速度,要快过眼睛的感知速度.

类似的可能还有羊群效应之类的心理学现象

项目文件:
http://download.csdn.net/download/zhe1110/10193809
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: