您的位置：首页 > 其它

暑假博客——ML第一天

2017-07-11 11:45 218 查看

ML的入门总结

ML的入门总结
1什么是ML
ML的两种定义

2两种基本的ML类型
Supervised learning监督学习
Regression Learning回归

Classification Learning分类

Unsupervised Learning非监督学习

3Cost Function代价函数这个翻译的不形象

1－什么是ML：

ML的两种定义：

“在没有精确编程的情况下，让机器自动学习。”

the field of study that gives computers the ability to learn without being explicitly programmed.——–Arthur Samuel

更加现代的定义：“以E为学习经验，以T为目标任务，以P为学习效果的检验方式。在以T为任务下，经由P的测试下，在E的促进下进步”(翻译很困难)

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. ——Tom Mitchell

2－两种基本的ML类型：

Supervised learning–监督学习

重点是，监督学习中，给定了学习数据的答案，要求学习后能给出按照要求的答案类型（有多少，是否是…）。通过数据和答案学习。在Andrew Ng 的例子中，主要是从点阵中，得出自变量和因变量的（函数）关系。

监督学习分两类：

Regression Learning–回归：

求量：通过数据得出相关变量的连续的关系，相关变量的图像是一条连续的线。通常，通过将给定的已知数据预测出“有多少”，“多大”，“多长”等明确数据的结果。

Classification Learning–分类：

判断：通过数据得出相关变量的非连续的关系，从给定的数据判断出想要的结果。通常将通过给定的已知数据判断出结果“是否是”，“是哪类”。

E.G.:

已知部分房子的面积及房价。预测出给定的已知其面积的房子的房价。－回归

已知部分肿瘤的大小及其性状（良性、恶性）。预测出新的已给定大小的肿瘤的性状（是否是恶性肿瘤）。－分类

Unsupervised Learning–非监督学习。

非监督学习并未给出数据的相关答案。它重点是让机器自动分类。

从商场获得的顾客数据将顾客分类。

分析DNA芯片的数据，将基因分类。

学习各大网页，将新闻分类。

3－Cost Function–代价函数（这个翻译的不形象）

在最简单的Supervised Learning中，我们有一个变量，要得出一个结果。建立的函数是一元一次的。

hθ(x(i))=θ0+θ1x

简写为：

h(x(i))=θ0+θ1x

我们不知道在 θ0和 θ1取何值时，函数最接近给定的数据。于是用代价函数：

J(θ0,θ1)=12m∑i=1m(h(x(i)）−y(i))2

来确定函数是否是最佳的猜测函数（hypothesis function）。在 θ0,θ1取某一值时，这个方差最小（我不明白为什么要除2，说是便于梯度计算什么的）。那么这时，所求的函数就是

minθ1,θ212m∑i=1m(h(x(i)）−y(i))2

Cost Function 是用于确定某函数的最好的参数的。这有利于ML的学习过程。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航