您的位置:首页 > 其它

机器学习(周志华)西瓜数据集3.0

2016-08-26 19:14 585 查看
说明:来自周志华《机器学习》p84表4.3的书中习题常用数据集,点击这里进行下载。数据如下:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否


有时中文处理麻烦,我将数据替换成了英文,点击这里进行下载。要是不想处理string类型的数据,也可以将前6个离散属性替换成数字,label替换成1和0。我已经替换好了,在这里:

No. color   root    knock   pattern umbilicus   touch   density suger   label
1   1   1   1   1   1   1   0.697   0.46    1
2   2   1   2   1   1   1   0.774   0.376   1
3   2   1   1   1   1   1   0.634   0.264   1
4   1   1   2   1   1   1   0.608   0.318   1
5   3   1   1   1   1   1   0.556   0.215   1
6   1   2   1   1   2   2   0.403   0.237   1
7   2   2   1   2   2   2   0.481   0.149   1
8   2   2   1   1   2   1   0.437   0.211   1
9   2   2   2   2   2   1   0.666   0.091   0
10  1   3   3   1   3   2   0.243   0.267   0
11  3   3   3   3   3   1   0.245   0.057   0
12  3   1   1   3   3   2   0.343   0.099   0
13  1   2   1   2   1   1   0.639   0.161   0
14  3   2   2   2   1   1   0.657   0.198   0
15  2   2   1   1   2   2   0.36    0.37    0
16  3   1   1   3   3   1   0.593   0.042   0
17  1   1   2   2   2   1   0.719   0.103   0


其中数字含义如下:

属性色泽根蒂敲声纹理脐部触感
1青绿蜷缩浊响清晰凹陷硬滑
2乌黑稍蜷沉闷稍糊稍凹软粘
3浅白硬挺清脆模糊平坦/
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
相关文章推荐