您的位置：首页 > 编程语言 > Python开发

python基础知识——数组拼接（以iris数据为例……）

2017-08-30 20:17 375 查看

未辞职前，就在看决策树的一些知识，只不过没有完全地过一遍。现在辞职了有大把的时间，就以决策树知识开始记录吧。背景：我在看《集体智慧编程》第七章. 决策树建模，想到用iris数据集去试下书里的 treepredict.py。因为treepredict.py里，my_data是列表形式，包含了目标属性列；而sklearn里的iris.data 只包含了4列特征数据，目标属性列的数据存放在iris.target里。现在，是想把iris数据集也加上目标属性列。具体python代码如下：#导入数据集irisfrom sklearn.datasets import load_iris#载入鸢尾花数据集iris=load_iris()Xdata = iris.data # 待划分的样本特征（4列）Ydata = iris.target # 待划分的样本的目标属性（最后那列）#……现在，想将Xdata随机划分出训练集和测试集（测试集占比25%）from sklearn.cross_validation import train_test_split#如果一行太长不够写，可以在后面加个反斜杠，然后enter换行继续写。#下面这个函数train_test_split（），有4个参数，意思分别是：待划分的样本特征、待划分的样本的目标属性、测试集占比、随机数种子。X_train,X_test,Y_train,Y_test = train_test_split \(Xdata,Ydata,test_size=0.25,random_state=30)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航