您的位置：首页 > 其它

机器学习2:通过交叉检验（cross validation）来解决方差过大的问题

2017-07-12 18:00 288 查看

机器学习总结2（7月12日）

本文章是我在学习了台湾大学教授李宏毅的机器学习课程后，针对其中的要点做的学习笔记。文笔不够优雅，水平不够高深。感兴趣的博友们请移步李宏毅老师的youtube专栏：https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ

或者在bilibili上观看网友搬运的视频：http://www.bilibili.com/video/av9770302/

我们通过机器学习得到的最优的模型，与真实的函数总是有一定的差别，即存在偏差（bias）与方差(variance)

假设x的平均值是µ，x的方差是σ2

通过做实验，我们可以了解到，简单的model，它的方差较小，偏差较大。
复杂的model，它的方差较大，偏差较小。

我们发现，方差和偏差的关系好像是互相排斥的，必须找到一个最好的中间值来得到最好的结果。
我们可以通过交叉检验来解决这个方法（Cross Validation）
具体的做法是：将训练集分为两部分，一部分用来测试，一部分用来检验。然后将训练出来的模型在检验集中检验，寻找产生错误指数最小的那个模型

但是为了减少划分测试集合和检验集合时，可能会存在特殊性的可能，我们也可以是使用更复杂的交叉检验：

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航