统计模型中的一些概念
2014-11-12 15:46
183 查看
过拟合(overfitting)以及欠拟合
对于一个监督学习模型来说, 过小的特征集合使得模型过于简单,过大的特征集合使得模型过于复杂 。
对于特征集过小的情况,称之为 欠拟合(
underfitting ),对于特征集过大的情况,模型的设定会越来越复杂,最后造成该模型只适用于当前的样本集,称之为过拟合(
overfitting )。
泛化能力
泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。通常期望经训练样本训练的网络具有较强的泛化能力,也就是对新输入给出合理响应的能力。应当指出并非训练的次数越多越能得到正确的输入输出映射关系。
归一化(normalization)
归一化也称为正规化或标准化,它的目的是为了让数据更便于我们的计算或获得更加泛化的结果,但并不改变问题的本质。
对于一个样本集X每行代表一个样本,每列是维数。对其L1 normalization如下:对每行样本的值求和sum(X,2),是得到一个列向量,然后x1 = bsxfun(@times, X,1./sum(X,2)),最后得到的x1就是L1 normalization。归一化是针对样本的。
对于一个监督学习模型来说, 过小的特征集合使得模型过于简单,过大的特征集合使得模型过于复杂 。
对于特征集过小的情况,称之为 欠拟合(
underfitting ),对于特征集过大的情况,模型的设定会越来越复杂,最后造成该模型只适用于当前的样本集,称之为过拟合(
overfitting )。
泛化能力
泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。通常期望经训练样本训练的网络具有较强的泛化能力,也就是对新输入给出合理响应的能力。应当指出并非训练的次数越多越能得到正确的输入输出映射关系。
归一化(normalization)
归一化也称为正规化或标准化,它的目的是为了让数据更便于我们的计算或获得更加泛化的结果,但并不改变问题的本质。
对于一个样本集X每行代表一个样本,每列是维数。对其L1 normalization如下:对每行样本的值求和sum(X,2),是得到一个列向量,然后x1 = bsxfun(@times, X,1./sum(X,2)),最后得到的x1就是L1 normalization。归一化是针对样本的。
相关文章推荐
- 网站统计的一些基本概念总结
- 领域模型的一些基本概念
- SQL Server 2005架构中的一些基本概念模型
- 有关基于模型的设计(MBD)一些概念和理解(zz)
- HBase数据模型的一些概念
- HBase数据模型的一些概念
- 医学模型中的统计概念——笔记少许
- 统计多径信道模型 基本概念
- 有关“数据统计”的一些概念 -- PV UV VV IP跳出率等
- 8_14 日学到的新知识(简单的工厂模式的实现, MVC 模式的基本概念,软件工程中的四种开发模型, 以及软件工程中的一些小知识点)
- 数据库中的一些概念:模型、结构
- 概率统计中一些概念解释
- SQL Server 2005架构中的一些基本概念模型
- 机器学习的一些概念:监督性学习/无监督性学习/判别式模型/产生式模型
- 关于网络模型的一些概念
- DataTable,DataView和DataGrid中一些容易混淆的概念 (转)
- 概念:DataTable,DataView和DataGrid中一些容易混淆的概念
- java的一些基本概念
- 面向对象的设计与实现的一些基础但重要的概念
- 工作流的一些基本概念