您的位置:首页 > 编程语言 > Python开发

Scikit-Learn使用总结

2017-02-27 21:26 260 查看

scikit-learn提供了一系列转换库,他们可以清洗,降维,提取特征等。

在数据转换中有三个很重要的方法,fit,fit_transform,transform

ss=StandardScaler()
X_train = ss.fit_transform(X_train)
X_test = ss.transform(X_test)


初学时候好奇为何,训练样本用fit_transform,而测试样本用transform?

仔细阅读官方文档发现,fit方法是用于从一个训练集中学习模型参数,其中就包括了归一化时用到的均值,标准偏差。transform方法就是用于将模型用于位置数据,fit_transform就很高效的将模型训练和转化合并到一起,训练样本先做fit,得到mean,standard deviation,然后将这些参数用于transform(归一化训练数据),使得到的训练数据是归一化的,而测试数据只需要在原先得到的mean,std上来做归一化就行了,所以用transform就行了。

StandardScaler对矩阵作归一化处理,变换后的矩阵各特征均值为0,方差为1

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  sklearn python