您的位置：首页 > 其它

统计模型中的一些概念

2014-11-12 15:46 183 查看

过拟合(overfitting)以及欠拟合

对于一个监督学习模型来说， 过小的特征集合使得模型过于简单，过大的特征集合使得模型过于复杂 。

对于特征集过小的情况，称之为欠拟合（
underfitting ），对于特征集过大的情况，模型的设定会越来越复杂，最后造成该模型只适用于当前的样本集，称之为过拟合（
overfitting ）。

泛化能力

泛化能力（generalization ability）是指机器学习算法对新鲜样本的适应能力。通常期望经训练样本训练的网络具有较强的泛化能力，也就是对新输入给出合理响应的能力。应当指出并非训练的次数越多越能得到正确的输入输出映射关系。

归一化(normalization)

归一化也称为正规化或标准化，它的目的是为了让数据更便于我们的计算或获得更加泛化的结果，但并不改变问题的本质。

对于一个样本集X每行代表一个样本，每列是维数。对其L1 normalization如下：对每行样本的值求和sum(X,2),是得到一个列向量，然后x1 = bsxfun(@times, X,1./sum(X,2)),最后得到的x1就是L1 normalization。归一化是针对样本的。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航