您的位置:首页 > 其它

Coursera Machine Learning 学习笔记(二)

2015-02-28 01:23 330 查看
- Supervised Learning

       对于监督学习我们先看一个例子,下图中表示的是一个房价预测的例子。图中横坐标表示房屋占地面积,纵坐标表示房屋交易价格。图中的每个叉则表示一个房屋实例。

      


       现在,我们希望能够预测一个房屋占地面积为750平方英尺的房屋的交易价格是多少。简单的方法是根据这些数据点的分布,画出一条合适的直线,然后根据这条直线来预测。当然,在此房价预测例子中,一个二次函数更加适合已有数据的分布。因此,我们可能会更加希望使用这个二次函数的曲线来进行房价预测。

      


       因此,我们称上述这样的学习叫做监督学习,因为我们预先给了算法正确的结果,即所有我们所观察到的变量。

       上述的问题又称为回归问题,我们所预测的值为连续值。

       下面,我们再看一个监督学习的例子:

       假设我们想要根据病人肿瘤的尺寸来预测病人的肿瘤是否为恶性:

      


       当然,有时候我们所用到的变量不止一个,如病人的年龄、肿瘤的大小以及形状等等。

      


       图中,圆圈代表良性而叉代表恶性,我们要学习的问题就变成了划分良性肿瘤和恶性肿瘤。

       这样的问题又叫做分类问题,所分类用到的是离散值。我们希望通过这样的算法来将数据分类到不同的种类。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: