scikit-learn preprocessing模块
2015-10-16 21:24
190 查看
version:sklearn0.16.1
sklearn.preprocessing模块包括scaling, centering, normalization 和imputation方法。
包括
data.py 处理数据(均值,方差等)
label.py 二值化
_weight.py
imputation.py 缺失值处理
1.
计算均值和标准差,标准差为0的话则置为1
2.
公式为:(X-mean)/std 计算时对每个属性/每列分别进行。
将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。
scale函数不能用来处理稀疏矩阵
sklearn.preprocessing模块包括scaling, centering, normalization 和imputation方法。
包括
data.py 处理数据(均值,方差等)
label.py 二值化
_weight.py
imputation.py 缺失值处理
1.data.py
1._mean_and_std(X, axis=0, with_mean=True, with_std=True):
计算均值和标准差,标准差为0的话则置为12.scale(X, axis=0, with_mean=True, with_std=True, copy=True)
公式为:(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。
scale函数不能用来处理稀疏矩阵
3.class MinMaxScaler()
使特征标准化相关文章推荐
- servlet
- gtest入门简介
- ios申请真机调试( xcode 5)详细解析
- 参考了《简单的3步设置,让你的博客园更漂亮!》,让博客清爽、美观,心情美美哒(>_<)
- sharepreference使用方法
- [POJ2456]Aggressive cows
- 一、门级结构描述
- findViewById
- 日经春秋 20151016
- 判断物体是否在镜头内
- 第一次向pypi添加一个新的库
- JSON文件处理
- BSD socket编程学习
- 网络摄像机画面卡顿的主要原因有哪些?
- android学习资源
- coderforce 588B Duff in Love
- 一些计算机视觉企业方面的网站
- 字母统计
- Android性能优化之GPU过度绘制与图形渲染优化
- C语言:实现一个函数,打印乘法口诀表,如:输入9,输出9*9口诀表