您的位置:首页 > 其它

机器学习入门科普篇--系列二

2017-10-18 00:00 288 查看
机器学习入门科普篇--系列二

前言python程序语言与机器学习实践可以称得上是”珠联璧合“。因为使用python编程技巧,接触甚至掌握机器学习的经典学习算法至少有以下四个优势。







 接着上一篇继续讲啦 
上一篇我们说了机器学习的特点、定义,其中讲了经验、任务和性能。任务上篇已经讲过了,现在我们来聊聊经验和性能。
经验



监督学习
对于监督学习问题,我们所拥有的经验包括特征和标签(Label/Target)两个部分。通常用特征向量(Feature Vector)描述一个数据样本。标记/目标的表现形式则取决于监督学习的种类。

无监督学习
无监督学习问题没有标记/目标,因此也无法从事预测任务,却更加适合对数据结构的分析。正是这个区别,我们可以获得大量的无监督学习数据;而监督数据的标注因为经常耗费大量的时间、金钱和人力,所以数据量相对量较少。

性能



注意
需要保证,出现在测试集中的数据样本一定不能被用于模型训练。即,训练集和测试集之间是彼此互斥的
预测类问题

对于预测类问题,更加关注预测的精度。具体来讲:分类问题,需要根据预测正确类别的百分比来评价其性能,这个指标通常称为准确性(Accuracy);回归问题则无法使用类似的指标,通常会衡量预测值与实际值之间的偏差大小。

好了,机器学习的任务、经验和性能已经介绍完了,下面用一个示例描述一下;

例子

手写识别学习问题:
            任务T:识别和分类图像中的手写文字
            性能标准P:分类的正确率
           训练经验E:已知分类的手写文字数据库(知识库)

                       
今日赠言
离你越近的地方,路途越远;最简单的音调,需要最艰苦的练习。
——致还在路上的你

推荐阅读:
python
数据清洗篇

Python正则表达式指南

Python
禅道

python学习笔记


用Python来分析股票|发现炒股软件里惊人内幕

诺贝尔奖得主教你如何分配炒股仓位
| python量化系列

(视频讲解!!!)python量化
| 10年翻400倍的炒股策略
Python初探之一
Python常用的一些技巧

写给Python初学者的设计模式入门
Python在金融,数据分析,和人工智能中的应用
Python的编码命名规则

python
数组的del ,remove,pop区别

[笔记]使用Python一步一步地来进行数据分析

提升
Python 编程效率的十点建议

Python的zip函数

如何优雅的使用Python

Python初学者的17个技巧
Python 环境搭建
文本编辑器你容易忽视的细节

Python生态系统
Python 使用断言的最佳时机

Python在金融,数据分析,和人工智能中的应用

爬虫-漫画喵的100行逆袭
长按二维码即可关注哦--->


参考文献:

Python机器学习及实践

机器学习

Mitchell,T.M 《Machine Learning》
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐