十折交叉验证
2016-01-20 12:01
211 查看
英文名叫做10-fold cross-validation,用来测试算法准确性。是常用的测试方法。将数据集分成十分,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。
之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以证明这一点。但这并非最终诊断,争议仍然存在。而且似乎5折或者20折与10折所得出的结果也相差无几。
之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以证明这一点。但这并非最终诊断,争议仍然存在。而且似乎5折或者20折与10折所得出的结果也相差无几。
相关文章推荐
- 伪类和伪元素
- C#调用C++dll文件 运行提示找不到函数的入口点
- 献给初学iOS的小盆友们——微博app项目开发之四设置导航功能
- poj1004 Financial Management
- JS实现移动端图片延迟加载
- EM算法
- CALayer的position和anchorPoint
- Android中Intent传递对象的两种方法Serializable,Parcelable
- c# VS2008中如何修改winfrom控件的可访问性
- mysql settings
- 360广告联盟对比百度广告联盟
- 打开应用时出现“你的手机上未安装应用程序”--实际上该应用已经安装的解决方案
- VS2010 无法命中断点
- python--pack
- python--socket
- 修改MYSQL的端口方法
- 引用自鸟哥的私房菜 几条比较好的学习方针
- 强大的nc命令(英文说明)!
- LintCode 二叉树的层次遍历 II
- PLSQL的注释技巧