数据分析入门
2016-03-19 10:20
253 查看
1、数据问题的处理流程:
一般的数据分析都是先从公司的具体业务问题出发,提出解决什么样的具体的业务问题,然而对于一般的业务问题提出来时都是比较抽象的,如“如何提高xx产品的销售量?”。对于抽象的业务问题,我们首先要做的就是把问题分解成具体的小问题,然后针对各个小问题分别取获取相应的数据来做具体分析。这些具体的数据来源一般包括从上级的邮件、公司的各项业务数据、运营数据、基础设施数据等。针对具体的问题建好模型后,需要对各模型进行评估,而评估的方式有很多种,可以组织观察研究法来分析模型结果是否合理,也可以用控制组实验法来验证。对于可行的数据模型,可以用来预测一定的业务数据从而帮助上级决策。
2、数据处理流程:
针对具体的探索性数据问题,对数据的处理一般按照如下图的流程。对于一开始就只存在一堆数据而无任何探索性方向的情况是很少的,几乎没有。就算是做数据挖掘,也一定有一个探索的方向和问题,也就是带有一定的目的(比如说你想看看这些变量之间的关系),但在这个过程中,可能发现一些令人诧异的模式,如“啤酒喝尿布模式”,而这些模式可能是你预先没有想到的。
最重要的备份原始数据---避免原始数据丢失;
最麻烦的是数据的准备---清洗、转化、整理;
最终的目的是得到一个合理的模型----最好可以在更新数据时能自动学习,自主构建模型,使模型可以重复使用。
3、数据分析中最重要的一点就是----数据的对比,可以说是数据分析的核心,有对比才能看出模式。在这个数据泛滥的时代,我们很难把所有数据都拿来对比,但程序可以,也许这就是算法为什么这么重要的原因。
4、数据分析另一个重要的是要学会反向思考----从假设检验我们就可以知道,你们不能用99%的证据证明它是对的,但你可以用99%的证据来拒绝它,这种思考方式是很值得学习的。
5、给出一个合理的模型时要注意:1)给出模型的具体内容;2)给出适应的范围;3)给出模型存在的误差。
6、参考的书籍:《菜鸟也会数据分析》、《深入浅出数据分析》
一般的数据分析都是先从公司的具体业务问题出发,提出解决什么样的具体的业务问题,然而对于一般的业务问题提出来时都是比较抽象的,如“如何提高xx产品的销售量?”。对于抽象的业务问题,我们首先要做的就是把问题分解成具体的小问题,然后针对各个小问题分别取获取相应的数据来做具体分析。这些具体的数据来源一般包括从上级的邮件、公司的各项业务数据、运营数据、基础设施数据等。针对具体的问题建好模型后,需要对各模型进行评估,而评估的方式有很多种,可以组织观察研究法来分析模型结果是否合理,也可以用控制组实验法来验证。对于可行的数据模型,可以用来预测一定的业务数据从而帮助上级决策。
2、数据处理流程:
针对具体的探索性数据问题,对数据的处理一般按照如下图的流程。对于一开始就只存在一堆数据而无任何探索性方向的情况是很少的,几乎没有。就算是做数据挖掘,也一定有一个探索的方向和问题,也就是带有一定的目的(比如说你想看看这些变量之间的关系),但在这个过程中,可能发现一些令人诧异的模式,如“啤酒喝尿布模式”,而这些模式可能是你预先没有想到的。
最重要的备份原始数据---避免原始数据丢失;
最麻烦的是数据的准备---清洗、转化、整理;
最终的目的是得到一个合理的模型----最好可以在更新数据时能自动学习,自主构建模型,使模型可以重复使用。
3、数据分析中最重要的一点就是----数据的对比,可以说是数据分析的核心,有对比才能看出模式。在这个数据泛滥的时代,我们很难把所有数据都拿来对比,但程序可以,也许这就是算法为什么这么重要的原因。
4、数据分析另一个重要的是要学会反向思考----从假设检验我们就可以知道,你们不能用99%的证据证明它是对的,但你可以用99%的证据来拒绝它,这种思考方式是很值得学习的。
5、给出一个合理的模型时要注意:1)给出模型的具体内容;2)给出适应的范围;3)给出模型存在的误差。
6、参考的书籍:《菜鸟也会数据分析》、《深入浅出数据分析》
相关文章推荐
- iOS学习笔记—ViewController/生命周期
- WIN7右下角的声音图标不见了
- 关于VC中 error C2871: 'std' : does not exist or is not a namespace
- nyoj21 三个水杯 (BFS)
- 怎么给电脑统一设置查看文件为列表形式?
- Android开发之WebService介绍
- cocos2dx和quick的区别
- 关闭win7窗口自动排列功能的方法
- CAShapeLayer
- 2016年:如何测试您的网站响应时间
- 结对开发-四则运算3
- 结对开发——四则运算(三)
- dfs回溯的注意事项
- mt7688 音频方案分析
- 动态规划入门之国王的金矿
- Java中构造函数重构+数组小练习
- 索尼PS VR游戏体验汇总 399美元起高端VR究竟值不值得买?
- java程序中比较常见的四种判断是否为空的性能优化比较
- 21.文件下载
- 【摘录+总结】Android动画之Tween动画 (渐变、缩放、位移、旋转)