数据科学工具箱week1笔记
2014-06-01 19:05
302 查看
最近同时在上cousera的另一门课程,希望三年后能成为一名出色的数据分析师,曾想过往大数据挖掘那方面试下的,不过慢慢地想法改变了下,只抱着单纯的学习数据处理技能来学习,或许也不错吧
第一节。series motivation
第一节嘛,主要还是讲下学习的理由,以及什么叫做data scientist。确实看过之后让我的观念有所改变,并不是只有像anderew NG 这样的牛人才能搞数据分析,也不是隔壁的华工机器学习那帮人才能搞,高端有高端玩法,只要把跟自己工作相关的数据处理好,依靠数据作决策,就应该有碗饭吃了吧
不说闲话,先放一个维恩图,不错的框架,努力的方向呀(编程能力,数学及统计学知识,实务能力),有意思的是只有编程和实务能力,看来是成不了数据分析师的哦
![](https://img-blog.csdn.net/20140519194123421?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
第二节 数据科学家的工具箱
R,Github.当然我觉得有价值的应该是下面这张图吧,感觉全程像是做菜
![](https://img-blog.csdn.net/20140519195930500?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.3 getting help
首先是一些r的帮助
![](https://img-blog.csdn.net/20140519201215093?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.4 finding answer
以下是各方面牛人的关键特征,也可以说是长处,要学会啊(有点感觉week1是在进行德育训练,不像是技能训练呢)
参照第一图
不得不说外国人还是敬业,这都总结,呵呵
![](https://img-blog.csdn.net/20140519202859234?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519202910296?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519202919296?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.5 r语言总览(五笔为jtyq)之所以第三笔是y,是要加一点
1.6 getting and cleaning data overview
这是我觉得很重要的一环
![](https://img-blog.csdn.net/20140519204756734?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519204825406?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519204851437?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519204908968?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.7exploratory analysis overview
探索式分析内容,这些都是基本步吧
分析图的原则
探索式绘图
plotting systems in R -base -lattice(晶格式) -ggplot2(另一种绘图包)
hierarchical分层 聚类 k-means聚类
维降约
![](https://img-blog.csdn.net/20140519205813062?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519205821671?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
![](https://img-blog.csdn.net/20140519205830687?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.8 reproducible research overview(重复性研究概论)
重复性研究内容:
一个数据分析的结构
组织一个数据分析
markdown
LaTeX
R Markdown
基于证据的数据分析
RPubs
数据分析的步骤见1.2最后一张图
![](https://img-blog.csdn.net/20140601184230703?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.9统计推断概述statistical inference overview
![](https://img-blog.csdn.net/20140601185125265?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.10回归模型概述regression models overview
![](https://img-blog.csdn.net/20140601185527843?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.11实用机器学习概述
主要是marchine learning in R
![](https://img-blog.csdn.net/20140601190136453?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
1.12 数据产品创建概述
R包是一个很好的展示自己的机会,若有实力,可以做一个,于是找工作什么的应该就不难了吧
![](https://img-blog.csdn.net/20140601190409828?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvdTAxNDU5NjkzNg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center)
注意R allows object oriented programming这句话是错的,要记住
第一节。series motivation
第一节嘛,主要还是讲下学习的理由,以及什么叫做data scientist。确实看过之后让我的观念有所改变,并不是只有像anderew NG 这样的牛人才能搞数据分析,也不是隔壁的华工机器学习那帮人才能搞,高端有高端玩法,只要把跟自己工作相关的数据处理好,依靠数据作决策,就应该有碗饭吃了吧
不说闲话,先放一个维恩图,不错的框架,努力的方向呀(编程能力,数学及统计学知识,实务能力),有意思的是只有编程和实务能力,看来是成不了数据分析师的哦
第二节 数据科学家的工具箱
R,Github.当然我觉得有价值的应该是下面这张图吧,感觉全程像是做菜
1.3 getting help
首先是一些r的帮助
1.4 finding answer
以下是各方面牛人的关键特征,也可以说是长处,要学会啊(有点感觉week1是在进行德育训练,不像是技能训练呢)
参照第一图
不得不说外国人还是敬业,这都总结,呵呵
1.5 r语言总览(五笔为jtyq)之所以第三笔是y,是要加一点
1.6 getting and cleaning data overview
这是我觉得很重要的一环
1.7exploratory analysis overview
探索式分析内容,这些都是基本步吧
分析图的原则
探索式绘图
plotting systems in R -base -lattice(晶格式) -ggplot2(另一种绘图包)
hierarchical分层 聚类 k-means聚类
维降约
1.8 reproducible research overview(重复性研究概论)
重复性研究内容:
一个数据分析的结构
组织一个数据分析
markdown
LaTeX
R Markdown
基于证据的数据分析
RPubs
数据分析的步骤见1.2最后一张图
1.9统计推断概述statistical inference overview
1.10回归模型概述regression models overview
1.11实用机器学习概述
主要是marchine learning in R
1.12 数据产品创建概述
R包是一个很好的展示自己的机会,若有实力,可以做一个,于是找工作什么的应该就不难了吧
注意R allows object oriented programming这句话是错的,要记住
相关文章推荐
- 数据科学工具箱week2笔记
- 【Coursera课程笔记】Web智能和大数据Week3_MapReduce
- 数据科学工具箱week3笔记
- Python3数据科学笔记--5个常用的Python库之numpy
- MIT开发课程-计算机科学及编程导论-课程简介及数据类型-笔记
- R语言笔记之数据科学算法总结
- 600X笔记(week-1 计算机科学简介及编程基础)
- 数据科学学习笔记(use R)(1)
- 深入对比数据科学工具箱:Python和R之争
- 深入对比数据科学工具箱:Python和R 非结构化数据的结构化
- 命令行中的数据科学-环境配置(学习笔记1)
- 数据科学课程笔记4 --- 数据工程与技术
- 超越“大数据”:运用商业分析和数据科学为企业实现商业价值 (培训笔记)
- 数据科学课程笔记1 --- 导论
- 数据科学学习笔记6 --- 数据可视化案例与工具
- Data Mining: Theory and Algorithms 笔记 第一章:走进数据科学:博大精深,美不胜收
- 命令行中的数据科学_笔记1
- 数据科学课程笔记2 --- 发展现状
- 数据拟合工具箱笔记
- 数据科学学习笔记(use R)(3)