Andrew NG 《machine learning》week 6,class2—Bias vs. Variance
2016-07-10 16:35
281 查看
Andrew NG 《machine learning》week 6,class2—Bias vs. Variance
当你运行一个机器学习算法的时候,大多数运行不理想的情况要么是偏差比较大,要么是方差比较大。即出现的情况要么是过拟合,要么是欠拟合,那么这两者和方差以及偏差是一一对应呢还是两者都有关系呢?能判断这个算法是偏差还是方差的问题,那么就可以有针对性的解决问题了。2.1 Diagnosing Bias vs. Variance
对于欠拟合和过拟合分别对应着高方差还是高偏差。下图给出了很好的解释。如上图所示,分别画出了不同的假设函数对应的训练数据集的误差以及交叉验证数据集所对应的误差曲线。从图中可以看出在欠拟合和过拟合情况下,训练数据集的误差和交叉验证数据集的误差之间的关系。
2.1 Regularization and Bias/Variance
之前说过,对于解决算法的过拟合或者欠拟合,可以采用正则化的方法。本小节将会讨论正则化与偏差和方差的关系。如图所示,当正则化参数lambda很大的时候,参数 thera基本都为零,这个时候就是欠拟合状态,就会出现高偏差的情况,当lambda很小的时候,就会出现过拟合情况,就是高方差的情况。
1.3 Learning Curves
本小节将会讨论绘制学习曲线的问题。学习曲线可以用来检测算法是否运行正常或者改进的算法是否已经匹配。经常会用学习曲线判断一个算法是否处于偏差、方差或者两者之间的情况。下图表示一般情况下训练误差和验证误差的曲线:
下图表示的是高偏差(欠拟合)情况下的误差曲线:
下图表示的是高方差(过拟合)情况下的误差曲线:
2.4 Deciding What to Do Next Revisited
回到最初的问题,对于改进算法的方法的选择,现在可以有一个明确的划分了。如下图:关于神经网络算法的实例如下图:
相关文章推荐
- 用Python从零实现贝叶斯分类器的机器学习的教程
- My Machine Learning
- 机器学习---学习首页 3ff0
- Spark机器学习(一) -- Machine Learning Library (MLlib)
- 反向传播(Backpropagation)算法的数学原理
- 关于SVM的那点破事
- 也谈 机器学习到底有没有用 ?
- TensorFlow人工智能引擎入门教程之九 RNN/LSTM循环神经网络长短期记忆网络使用
- TensorFlow人工智能引擎入门教程之十 最强网络 RSNN深度残差网络 平均准确率96-99%
- TensorFlow人工智能引擎入门教程所有目录
- 如何用70行代码实现深度神经网络算法
- 量子计算机编程原理简介 和 机器学习
- 近200篇机器学习&深度学习资料分享(含各种文档,视频,源码等)
- 已经证实提高机器学习模型准确率的八大方法
- 初识机器学习算法有哪些?
- 机器学习相关的库和工具
- 10个关于人工智能和机器学习的有趣开源项目
- 机器学习实践中应避免的7种常见错误
- 机器学习常见的算法面试题总结
- 不平衡数据处理技术——RUSBoost