机器学习之决策树算法ID3--参考麦子学院彭亮机器学习基础3.2决策树应用
2018-01-27 20:56
423 查看
#决策树算法 #首先需要导入输入输出数据,并将输入输出数据转换为标准形式 #然后使用sklearn的决策树tree进行处理 #最后输出.dot文件结果,并用Graphviz输出决策树的图形 #对已有的决策树对象,进行测试数据集predict测试 from sklearn.feature_extraction import DictVectorizer import csv from sklearn import tree from sklearn import preprocessing from sklearn.externals.six import StringIO # Read in the csv file and put features into list of dict and list of class label #allElectronicsData = open(r'E:\\AllElectronics.csv', 'rb') allElectronicsData = open(r'E:\\AllElectronics.csv', 'rt') reader = csv.reader(allElectronicsData) #headers = reader.next() headers = next(reader) print(headers) featureList = [] labelList = [] for row in reader: labelList.append(row[len(row)-1]) rowDict = {} for i in range(1, len(row)-1): rowDict[headers[i]] = row[i]#headers[i]是键,row[i]是值 featureList.append(rowDict) print(featureList) # Vetorize features vec = DictVectorizer() dummyX = vec.fit_transform(featureList) .toarray()#变成数组 #dummyX=vec.fit_transform(featureList)记录有1的位置 print("dummyX: " + str(dummyX)) #print("dummyX: ",dummyX) print(vec.get_feature_names()) print("labelList: " + str(labelList)) # vectorize class labels lb = preprocessing.LabelBinarizer() dummyY = lb.fit_transform(labelList) print("dummyY: " + str(dummyY)) # Using decision tree for classification # clf = tree.DecisionTreeClassifier() clf = tree.DecisionTreeClassifier(criterion='entropy') clf = clf.fit(dummyX, dummyY) print("clf: " + str(clf)) # Visualize model with open("allElectronicInformationGainOri.dot", 'w') as f: f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(), out_file=f) oneRowX = dummyX[0, :] print("oneRowX: " + str(oneRowX)) #将第一组数据中年龄young改为middle_age newRowX = oneRowX newRowX[0] = 1 newRowX[2] = 0 print("newRowX: " + str(newRowX)) # predictedY = clf.predict(newRowX.reshape(1,-1))#需要使用reshape(1,-1) print("predictedY: " + str(predictedY))
相关文章推荐
- 深度学习基础-决策树应用(python实现)
- 数据科学之机器学习8: 决策树之ID3
- 《麦子学院深度学习应用之基础》笔记
- 机器学习实战-决策树ID3-python代码
- 《Spring 3.x 企业应用开发实战》学习笔记 第三章 IoC容器概述 3.2 相关Java基础知识 类装载器 反射机制
- 机器学习入门学习笔记:(3.2)ID3决策树程序实现
- 《Spring 3.x 企业应用开发实战》学习笔记 第三章 IoC容器概述 3.2 相关Java基础知识 类装载器 反射机制
- 补:机器学习实战_初识决策树(ID3)算法的绘制树形图的代码
- 最近邻分类算法KNN实现--参考麦子学院彭亮机器学习基础4.2
- 机器学习应用之基础2
- 机器学习系统设计与应用机器学习的建议 机器学习基础(5)
- 人脸识别SVM算法实现--参考麦子学院彭亮机器学习基础5.2
- 机器学习基础:集成学习方法应用实验(RF、GBDT)
- DLL技术应用04 - 零基础入门学习Delphi47
- ROS学习笔记(一)ROS基础入门 — 参考创客制造
- 机器学习实战学习笔记2——决策树算法
- 详细教程:如何快速在阿里云上构建机器学习应用?
- Python机器学习应用 | 监督学习
- 深度学习的基础:机器学习入门和数学基础(一)
- Spring AOP基础(Spring 3.x企业应用开发实战第六章)学习总结