机器学习2:通过交叉检验(cross validation)来解决方差过大的问题
2017-07-12 18:00
288 查看
机器学习总结2(7月12日)
本文章是我在学习了台湾大学教授李宏毅的机器学习课程后,针对其中的要点做的学习笔记。文笔不够优雅,水平不够高深。感兴趣的博友们请移步李宏毅老师的youtube专栏:https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ或者在bilibili上观看网友搬运的视频:http://www.bilibili.com/video/av9770302/
我们通过机器学习得到的最优的模型,与真实的函数总是有一定的差别,即存在偏差(bias)与方差(variance)
假设x的平均值是µ,x的方差是σ2
通过做实验,我们可以了解到,简单的model,它的方差较小,偏差较大。
复杂的model,它的方差较大,偏差较小。
我们发现,方差和偏差的关系好像是互相排斥的,必须找到一个最好的中间值来得到最好的结果。
我们可以通过 交叉检验来解决这个方法(Cross Validation)
具体的做法是:将训练集分为两部分,一部分用来测试,一部分用来检验。然后将训练出来的模型在检验集中检验,寻找产生错误指数最小的那个模型
但是为了减少划分测试集合和检验集合时,可能会存在特殊性的可能,我们也可以是使用更复杂的交叉检验:
相关文章推荐
- 通过一个kaggle实例学习解决机器学习问题
- 【机器学习】通过正则化解决过拟合问题
- 通过一个kaggle实例学习解决机器学习问题
- 【机器学习】【基本理论】偏差、方差、这规则化、交叉检验
- Cocos2dx交叉编译后在eclipse编译不通过的问题解决
- WCF 通过web.config配置文件解决传输内容过大问题
- 关于在FC6中安装m68k-elf-tools交叉编译碰到的问题及解决方法
- 软件开发是人类通过逻辑解决问题的过程
- .Net中通过DataSet直接更新数据库相关问题和解决方法
- 如何解决 JMeter 通过 JDBC 访问 Oracle 和 MySQL 的问题 (留言中有 Test Plan 实例下载)
- 解决不能通过mysql.sock连接MySQL问题的办法
- 用NAT解决地址交叉问题 推荐
- 解决通过identity字段关联的多个数据表插入问题
- 一个编译不能通过的问题的解决
- 解决Asp.net 上传文件过大限制问题
- Ajax按需读取数据生成下级菜单(调试通过,乱码问题没解决)
- SQL Server2000通过链接服务器更新数据时的问题及解决办法
- 解决 Mysql 占用系统资源过大的问题
- 如何解决 JMeter 通过 JDBC 访问 Oracle 和 MySQL 的问题 (留言中有 Test Plan 实例下载)
- 解决JBOSS服务器无法通过IP访问的问题