Scikit-Learn使用总结
2017-02-27 21:26
260 查看
scikit-learn提供了一系列转换库,他们可以清洗,降维,提取特征等。
在数据转换中有三个很重要的方法,fit,fit_transform,transform
ss=StandardScaler() X_train = ss.fit_transform(X_train) X_test = ss.transform(X_test)
初学时候好奇为何,训练样本用fit_transform,而测试样本用transform?
仔细阅读官方文档发现,fit方法是用于从一个训练集中学习模型参数,其中就包括了归一化时用到的均值,标准偏差。transform方法就是用于将模型用于位置数据,fit_transform就很高效的将模型训练和转化合并到一起,训练样本先做fit,得到mean,standard deviation,然后将这些参数用于transform(归一化训练数据),使得到的训练数据是归一化的,而测试数据只需要在原先得到的mean,std上来做归一化就行了,所以用transform就行了。
StandardScaler对矩阵作归一化处理,变换后的矩阵各特征均值为0,方差为1
相关文章推荐
- scikit-learn使用总结
- Scikit-learn使用总结
- Scikit-learn使用总结
- Scikit-learn使用总结
- Scikit-learn使用总结
- Scikit-learn使用总结
- scikit-learn逻辑回归类库使用总结
- Scikit-learn使用总结
- Scikit-learn使用总结
- scikit-learn:matplotlib.pyplot经常使用绘图功能总结(1)
- Scikit-learn使用总结
- Scikit-learn方法使用总结
- 机器学习实战之使用 scikit-learn 库实现决策树
- scikit-learn的主要模块和基本使用
- 使用Python scikit-learn 库实现神经网络算法
- scikit-learn主要模块和基本使用方法
- scikit-learn使用笔记与sign prediction简单小结
- scikit-learn使用joblib持久化模型过程中的问题详解
- 使用scikit-learn解释随机森林算法
- 使用scikit-learn实现逻辑回归对牵牛花类别的预测