您的位置：首页 > 大数据 > 人工智能

机器学习（吴恩达授课）课堂笔记（1）- Intro

2015-08-02 12:40 281 查看

Intro

机器学习在日常生活中很常见，例如社交网络可以自动圈出你的好友，邮箱可以自动过滤垃圾邮件。

机器学习源于AI（人工智能）。它赋予计算机一种新的能力：自我学习，而非依靠程序。更多的例子：

数据挖掘

例如网页点击数据，医疗数据

不能靠人工编写代码的应用

例如识别手写，大部分的NLP(自然语言处理Natural Language Processing), 计算机视觉识别

<
4000
li>个性化自定义的程序

例如像亚马逊还有很多电商的产品自动推荐

理解人如何进行学习

涉及到人脑的模拟，真正的人工智能

Definition of Machine Learning

“A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.”- Tom Mitchell (1998)

如果计算机程序执行某项任务(Task T)的绩效(Performance P)随着经验(Experience E)增长而提高，则该计算机程序是通过学习经验来完成任务的。

根据这个定义，我们可以对应比较邮件处理系统通过机器学习来过滤垃圾邮件

任务(T)

邮件分类为垃圾邮件和非垃圾邮件

经验(E)

观察你如何标记垃圾邮件或非垃圾邮件

绩效(P)

正确被归类到垃圾邮件/非垃圾邮件的数量（或比例）

邮件系统通过观察学习，能更好地过滤垃圾邮件

Machine Learning Algorithms

1 监督学习(Supervised Learning)

数据集(DataSet)里的每个样本（可以理解为输入数据）都有相应的“正确答案”(可以理解为实际的输出数据），再根据这些样本做预测。

(1) 回归预测(Regression)

预测连续的结果值 Predict continuous valued output

例子：房屋售价预测　


面积（样本）	价格（“正确答案”）
500	$100
1000	$300
2000	$300
…	…

上表中的数据集用红色叉叉表示；根据这些样本，建立数据模型，最好地拟合这些数据，图中朱红色那条线就是一个简单的线性回归模型，那么如果有一套面积为750的房子，预测其售价大约在150左右

(2) 分类预测(Classification)

预测离散的结果值Predict discret valued output(0 or 1)

例子：乳腺癌预测　


肿瘤大小	良性	恶性
size1	0
size2	0
size3		1
…

(良性结果用0表示，恶性用1表示，是离散的结果；当然结果不是只能有两种，可以有无数种；样本特征值也不是只能有“肿瘤大小”这一种，可以有无限多种，例如，年龄，肿块厚度等）

*在讲分类预测时，提到了一种算法叫做支持向量机（Support Vector Machine) 不明白是什么，等后续课程再了解。

2 无监督学习(Unsupervised Learning)

是一种自动聚类算法(Cluster Algorithm)

给出一堆数据（并不像监督学习里的数据集，每个样本已经有自己的“正确答案”），无监督学习算法需要自动找到数据的结构，然后自动聚类。常见的例子：

google News

自动进行新闻分类

Organize Computing Cluster

哪些计算机可以协同工作

Social Network Analysis

自动给出朋友的分组

Market Segmentation

给出客户信息，自动归类到细分市场

练习题

参考目录

Intro
Definition of Machine Learning

Machine Learning Algorithms
监督学习Supervised Learning
1 回归预测Regression

2 分类预测Classification

无监督学习Unsupervised Learning

练习题

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 机器学习人工智能

相关文章推荐

新的分享

章节导航