数据分析应注意的几个问题
2010-12-25 23:55
369 查看
1.要注意每种统计分析方法的适用范围。许多分析方法对数据的要求很高,如果样本的分布不符合要求,样本量数量不足,或者存在大量的伪样本,都会造成最后结果的偏差甚至是完全错误。比如,我们经常要使用的因子分析、聚类分析,如果样本量不足,虽然也能够通过SPSS获得分析结果,但实际上这样的分析结果没有意义;
2.在选择一种分析方法的同时,要按照方法的要求整理数据库。错误的数据库格式对于研究有时是灾难性的。我们在使用任何研究模型之前,都要考虑数据的适用性。同样,数据的合理转换也很重要。比如,我们经常会提问被访者的出生年份而不是周岁年龄,这样将会较少回答的偏差。我们把收集到的数据进行简单的转换,得到被访者的年龄。出于计算的需要,我们还经常把几个变量合并(或整理)成一个或者另外几个变量;
3.如果必要,可以使用不同的研究方法对同一问题进行解释,来互相验证结论的真伪。如果出现互相矛盾,一定要找到矛盾的原因,去伪存真。任何的分析模型和方法都有其使用的局限性,在一定场合会失效。片面的相信任何高级分析方法,哪怕是世界上最先进的分析模型,研究失误都是必然的;
4.数据分析结果要使用通俗易懂的语言或图表进行描述,繁琐高深的公式和过程不应该经常成为最终研究报告的一部分;
5.数据分析需要耐心和细致,不能出现任何疏漏。哪怕是一点点的失误,都可能产生“蝴蝶效应”,让研究报告变的一钱不值;
6.统计分析方法高级不一定是最好的,简单有效能够解决问题才是最好的。
2.在选择一种分析方法的同时,要按照方法的要求整理数据库。错误的数据库格式对于研究有时是灾难性的。我们在使用任何研究模型之前,都要考虑数据的适用性。同样,数据的合理转换也很重要。比如,我们经常会提问被访者的出生年份而不是周岁年龄,这样将会较少回答的偏差。我们把收集到的数据进行简单的转换,得到被访者的年龄。出于计算的需要,我们还经常把几个变量合并(或整理)成一个或者另外几个变量;
3.如果必要,可以使用不同的研究方法对同一问题进行解释,来互相验证结论的真伪。如果出现互相矛盾,一定要找到矛盾的原因,去伪存真。任何的分析模型和方法都有其使用的局限性,在一定场合会失效。片面的相信任何高级分析方法,哪怕是世界上最先进的分析模型,研究失误都是必然的;
4.数据分析结果要使用通俗易懂的语言或图表进行描述,繁琐高深的公式和过程不应该经常成为最终研究报告的一部分;
5.数据分析需要耐心和细致,不能出现任何疏漏。哪怕是一点点的失误,都可能产生“蝴蝶效应”,让研究报告变的一钱不值;
6.统计分析方法高级不一定是最好的,简单有效能够解决问题才是最好的。
相关文章推荐
- 数据分析的几个问题
- Logistic回归分析时几个需要注意的问题
- 用SPSS做数据分析时遇到的几个小问题——解决方法!
- 运用数据挖掘技术研究方剂配伍规律应注意的几个问题
- 485布线工程中应注意的几个问题
- oracle数据库之性能问题分析,相关数据字典
- 非阻塞Connect对于select时应注意问题, 很精致的分析
- mongo 对数据很严格 在使用组装条件的时候需要注意 字段的类型, 分享几个转换的函数
- 初学Java,粗浅看待数据类型与运算符中需要注意的问题
- Linux Apache+Proftpd构建虚拟主机时要注意的几个安全问题
- Asp.net中在GridView数据绑定事件中改变显示内容要注意的问题
- 动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题
- jQuery checkbox选中问题之prop与attr注意点分析
- 使用btrace需要注意的几个问题
- Spring Boot中@OneToMany与@ManyToOne几个需要注意的问题
- 在使用JSON格式处理数据时应该注意的问题
- 【总结】大规模数据(300万条)测试时,需要注意的问题。
- Java跨平台编码需要注意的几个问题
- 关于招行信用卡还款日期的几个注意问题
- cuda8.0部署在ubuntu14.04+GTX1080上需要注意的几个问题