暑假博客——ML第一天
2017-07-11 11:45
218 查看
ML的入门总结
ML的入门总结1什么是ML
ML的两种定义
2两种基本的ML类型
Supervised learning监督学习
Regression Learning回归
Classification Learning分类
Unsupervised Learning非监督学习
3Cost Function代价函数这个翻译的不形象
1-什么是ML:
ML的两种定义:
“在没有精确编程的情况下,让机器自动学习。”the field of study that gives computers the ability to learn without being explicitly programmed.——–Arthur Samuel
更加现代的定义:“以E为学习经验,以T为目标任务,以P为学习效果的检验方式。在以T为任务下,经由P的测试下,在E的促进下进步”(翻译很困难)
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. ——Tom Mitchell
2-两种基本的ML类型:
Supervised learning–监督学习
重点是,监督学习中,给定了学习数据的答案,要求学习后能给出按照要求的答案类型(有多少,是否是…)。通过数据和答案学习。在Andrew Ng 的例子中,主要是从点阵中,得出自变量和因变量的(函数)关系。监督学习分两类:
Regression Learning–回归:
求量:通过数据得出相关变量的连续的关系,相关变量的图像是一条连续的线。通常,通过将给定的已知数据预测出“有多少”,“多大”,“多长”等明确数据的结果。Classification Learning–分类:
判断:通过数据得出相关变量的非连续的关系,从给定的数据判断出想要的结果。通常将通过给定的已知数据判断出结果“是否是”,“是哪类”。E.G.:
已知部分房子的面积及房价。预测出给定的已知其面积的房子的房价。-回归
已知部分肿瘤的大小及其性状(良性、恶性)。预测出新的已给定大小的肿瘤的性状(是否是恶性肿瘤)。-分类
Unsupervised Learning–非监督学习。
非监督学习并未给出数据的相关答案。它重点是让机器自动分类。从商场获得的顾客数据将顾客分类。
分析DNA芯片的数据,将基因分类 。
学习各大网页,将新闻分类。
3-Cost Function–代价函数(这个翻译的不形象)
在最简单的Supervised Learning中,我们有一个变量,要得出一个结果。建立的函数是一元一次的。hθ(x(i))=θ0+θ1x
简写为:
h(x(i))=θ0+θ1x
我们不知道在 θ0和 θ1取何值时,函数最接近给定的数据。于是用代价函数:
J(θ0,θ1)=12m∑i=1m(h(x(i))−y(i))2
来确定函数是否是最佳的猜测函数(hypothesis function)。在 θ0,θ1取某一值时,这个方差最小(我不明白为什么要除2,说是便于梯度计算什么的)。那么这时,所求的函数就是
minθ1,θ212m∑i=1m(h(x(i))−y(i))2
Cost Function 是用于确定某函数的最好的参数的。这有利于ML的学习过程。