您的位置:首页 > 其它

样本不平衡--SMOTE算法-学习笔记

2017-04-17 17:11 239 查看

1 SMOTE算法的简单理解

一个数集中的数据是分布在特征空间中的,假设数据是2维的,那么数据的就是一个平面上的点。对于类别不平衡数据来说,假设负样本数据是少量的,那么这个数据只占据了空间的一小部分。SMOTE 算法就是对这些小样本数据占据的空间中进行插值。 而不影响到正样本的空间。

2 如何插值

SMOTE算法采取了一种策略,选择两个距离接近的点进行插值。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  数据挖掘