特征工程(如何合理地把非数值特征转换成数值特征)
2017-08-10 17:15
316 查看
现在我理解的特征工程的意义是:如何把非数值特征转换成数值特征?
1、假如有一个属性是职业,有这三种职业,教师、公务员、工程师,现在要用一个基于线性回归的算法,来训练模型,假如f(x,y)=ax+by,a,b代表权重,x代表职业这个属性值,那么如何给这个x赋值?
解决方案:
1、人工无脑的赋值,比如教师=1,公务员=2,工程师=3,但是这样科学吗?假设教师和工程师的特征比较相似,这样显然不合适。但是,这种方法依然在用,解决这种不合理的办法是,世界上有许多计算词汇相似度的方法,他能判别各种词汇的相似度,我们根据词汇相似度然后再给他们赋值。
2、离散赋值,比如把职业这个属性再分为三类
1、假如有一个属性是职业,有这三种职业,教师、公务员、工程师,现在要用一个基于线性回归的算法,来训练模型,假如f(x,y)=ax+by,a,b代表权重,x代表职业这个属性值,那么如何给这个x赋值?
解决方案:
1、人工无脑的赋值,比如教师=1,公务员=2,工程师=3,但是这样科学吗?假设教师和工程师的特征比较相似,这样显然不合适。但是,这种方法依然在用,解决这种不合理的办法是,世界上有许多计算词汇相似度的方法,他能判别各种词汇的相似度,我们根据词汇相似度然后再给他们赋值。
2、离散赋值,比如把职业这个属性再分为三类
相关文章推荐
- Spark Mllib里如何将trainDara训练数据的分类特征字段转换为数值字段(图文详解)
- 如何:在十六进制字符串与数值类型之间转换
- MODBUS RTU协议中浮点数是如何存储,读到浮点数寄存器的数值如何转换成所需的浮点数
- 如何将数值类型转换为数字?
- 如何把字符转换为对应的数值
- 16进制数值转换成16进制字符串,用于显示或对OllyDbg中的特征码进行整理
- 如何将Java工程转换成Java web工程
- MySQL如何有效的存储IP地址及字符串IP和数值之间如何转换
- 如何:在十六进制字符串与数值类型之间转换(C# 编程指南)
- 如何将一个java工程转换为一个web工程
- 如何将一个C++代码工程转换为matlab的mex文件直接调用呢
- 如何转换字符串为数值- -
- 什么是特征工程?如何进行特征工程?
- androidstudio中如何将单独的model形式的library转换成一个单独的工程!
- 如何将double型数值转换为16进制的形式
- 如何转换字符串为数值- -
- 如何:在十六进制字符串与数值类型之间转换(C# 编程指南MSDN)
- 如何搭建一个合理的数值框架?
- 如何将十六进制字符串转换为数字(数值)
- 如何将VS2015工程转换成VS2012工程