七月机器学习之特征工程6
2017-03-28 18:27
357 查看
随机取样:可能无法表征所有的情况
分层采样:对不同的年龄段(举例)进行采样
大多数算法对正负样本都是很敏感的
下采样:比如正样本很多,我们在正样本中抽取数据,使得正负样本一样多
如果正样本比负样本大很多,建议你取采集更多的数据
selectKBest选择与y相关度最高的k个数据
l1正则化是截断,也就是说不相关的就截断,权重为0,selectfrommodel可以选出大于权重0的特征
相关文章推荐
- 七月算法机器学习笔记5 -- 特征工程
- Python数据挖掘与机器学习_通信信用风险评估实战(3)——特征工程
- 机器学习特征工程
- 机器学习之特征工程
- 机器学习中,有哪些特征选择的工程方法?
- 机器学习之特征工程
- 机器学习的特征工程
- 机器学习的特征工程
- 【特征工程】2 机器学习中的数据清洗与特征处理综述
- 七月机器学习之回归分析与工程应用5
- 机器学习之特征工程(二)
- 机器学习之特征工程
- 机器学习之特征工程
- 机器学习:Scikit-learn与特征工程
- 一张图了解机器学习特征工程的概念
- 机器学习——特征工程之子集搜索与评价
- 机器学习中的特征建模(特征工程)和算法选型建模 - 以暴力破解识别为例
- 机器学习之特征工程
- 机器学习 特征工程之特征选择
- 机器学习——特征工程之概述