您的位置:首页 > 编程语言 > Python开发

python基础知识——数组拼接(以iris数据为例……)

2017-08-30 20:17 375 查看
未辞职前,就在看决策树的一些知识,只不过没有完全地过一遍。现在辞职了有大把的时间,就以决策树知识开始记录吧。背景:我在看《集体智慧编程》第七章. 决策树建模 ,想到用iris数据集去试下书里的 treepredict.py。因为treepredict.py里,my_data是列表形式,包含了目标属性列;而sklearn里的iris.data 只包含了4列特征数据,目标属性列的数据存放在iris.target里。现在,是想把iris数据集也加上目标属性列。具体python代码如下:#导入数据集irisfrom sklearn.datasets import load_iris#载入鸢尾花数据集iris=load_iris()Xdata = iris.data  # 待划分的样本特征(4列)Ydata = iris.target  # 待划分的样本的目标属性(最后那列)#……现在,想将Xdata随机划分出训练集和测试集(测试集占比25%)from sklearn.cross_validation import train_test_split#如果一行太长不够写,可以在后面 加个反斜杠,然后enter换行继续写。#下面这个函数train_test_split(),有4个参数,意思分别是:待划分的样本特征、待划分的样本的目标属性、测试集占比、随机数种子。X_train,X_test,Y_train,Y_test = train_test_split \(Xdata,Ydata,test_size=0.25,random_state=30)
                                            
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: