您的位置:首页 > 其它

暑假博客——ML第一天

2017-07-11 11:45 218 查看

ML的入门总结

ML的入门总结
1什么是ML
ML的两种定义

2两种基本的ML类型
Supervised learning监督学习
Regression Learning回归

Classification Learning分类

Unsupervised Learning非监督学习

3Cost Function代价函数这个翻译的不形象

1-什么是ML:

ML的两种定义:

“在没有精确编程的情况下,让机器自动学习。”

the field of study that gives computers the ability to learn without being explicitly programmed.——–Arthur Samuel

更加现代的定义:“以E为学习经验,以T为目标任务,以P为学习效果的检验方式。在以T为任务下,经由P的测试下,在E的促进下进步”(翻译很困难)

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. ——Tom Mitchell

2-两种基本的ML类型:

Supervised learning–监督学习

重点是,监督学习中,给定了学习数据的答案,要求学习后能给出按照要求的答案类型(有多少,是否是…)。通过数据和答案学习。在Andrew Ng 的例子中,主要是从点阵中,得出自变量和因变量的(函数)关系。

监督学习分两类:

Regression Learning–回归:

求量:通过数据得出相关变量的连续的关系,相关变量的图像是一条连续的线。通常,通过将给定的已知数据预测出“有多少”,“多大”,“多长”等明确数据的结果。

Classification Learning–分类:

判断:通过数据得出相关变量的非连续的关系,从给定的数据判断出想要的结果。通常将通过给定的已知数据判断出结果“是否是”,“是哪类”。

E.G.:

已知部分房子的面积及房价。预测出给定的已知其面积的房子的房价。-回归

已知部分肿瘤的大小及其性状(良性、恶性)。预测出新的已给定大小的肿瘤的性状(是否是恶性肿瘤)。-分类

Unsupervised Learning–非监督学习。

非监督学习并未给出数据的相关答案。它重点是让机器自动分类。

从商场获得的顾客数据将顾客分类。

分析DNA芯片的数据,将基因分类 。

学习各大网页,将新闻分类。

3-Cost Function–代价函数(这个翻译的不形象)

在最简单的Supervised Learning中,我们有一个变量,要得出一个结果。建立的函数是一元一次的。

hθ(x(i))=θ0+θ1x

简写为:

h(x(i))=θ0+θ1x

我们不知道在 θ0和 θ1取何值时,函数最接近给定的数据。于是用代价函数:

J(θ0,θ1)=12m∑i=1m(h(x(i))−y(i))2

来确定函数是否是最佳的猜测函数(hypothesis function)。在 θ0,θ1取某一值时,这个方差最小(我不明白为什么要除2,说是便于梯度计算什么的)。那么这时,所求的函数就是

minθ1,θ212m∑i=1m(h(x(i))−y(i))2

Cost Function 是用于确定某函数的最好的参数的。这有利于ML的学习过程。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: