《BI那点儿事》Microsoft 决策树算法
2014-12-02 09:14
309 查看
原文:《BI那点儿事》Microsoft 决策树算法Microsoft 决策树算法是由 Microsoft SQL Server Analysis Services 提供的分类和回归算法,用于对离散和连续属性进行预测性建模。
对于离散属性,该算法根据数据集中输入列之间的关系进行预测。它使用这些列的值(也称之为状态)预测指定为可预测的列的状态。具体地说,该算法标识与可预测列相关的输入列。例如,在预测哪些客户可能购买自行车的方案中,假如在十名年轻客户中有九名购买了自行车,但在十名年龄较大的客户中只有两名购买了自行车,则该算法从中推断出年龄是自行车购买情况的最佳预测因子。决策树根据朝向特定结果发展的趋势进行预测。
对于连续属性,该算法使用线性回归确定决策树的拆分位置。
如果将多个列设置为可预测列,或输入数据中包含设置为可预测的嵌套表,则该算法将为每个可预测列生成一个单独的决策树。
示例
Adventure Works Cycles 公司的市场部希望标识以前的客户的某些特征,这些特征可能指示这些客户将来是否有可能购买其产品。AdventureWorks2008R2 数据库存储描述其以前客户的人口统计信息。通过使用 Microsoft 决策树算法分析这些信息,市场部可以生成一个模型,该模型根据有关特定客户的已知列的状态(如人口统计或以前的购买模式)预测该客户是否会购买产品。
下面我们进入主题,通过简单的过程配置我们来实现整个数据挖掘的过程,依次步骤如下:
对于离散属性,该算法根据数据集中输入列之间的关系进行预测。它使用这些列的值(也称之为状态)预测指定为可预测的列的状态。具体地说,该算法标识与可预测列相关的输入列。例如,在预测哪些客户可能购买自行车的方案中,假如在十名年轻客户中有九名购买了自行车,但在十名年龄较大的客户中只有两名购买了自行车,则该算法从中推断出年龄是自行车购买情况的最佳预测因子。决策树根据朝向特定结果发展的趋势进行预测。
对于连续属性,该算法使用线性回归确定决策树的拆分位置。
如果将多个列设置为可预测列,或输入数据中包含设置为可预测的嵌套表,则该算法将为每个可预测列生成一个单独的决策树。
示例
Adventure Works Cycles 公司的市场部希望标识以前的客户的某些特征,这些特征可能指示这些客户将来是否有可能购买其产品。AdventureWorks2008R2 数据库存储描述其以前客户的人口统计信息。通过使用 Microsoft 决策树算法分析这些信息,市场部可以生成一个模型,该模型根据有关特定客户的已知列的状态(如人口统计或以前的购买模式)预测该客户是否会购买产品。
下面我们进入主题,通过简单的过程配置我们来实现整个数据挖掘的过程,依次步骤如下:
相关文章推荐
- 《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们
- 《BI那点儿事》Microsoft 决策树算法——找出三国武将特性分布,献给广大的三国爱好者们
- 《BI那点儿事》Microsoft 决策树算法
- 《BI那点儿事》Microsoft 时序算法——验证神奇的斐波那契数列
- 《BI那点儿事》Microsoft 神经网络算法
- 《BI那点儿事》Microsoft 顺序分析和聚类分析算法
- 《BI那点儿事》Microsoft 线性回归算法
- 《BI那点儿事》Microsoft 顺序分析和聚类分析算法
- 《BI那点儿事》Microsoft 逻辑回归算法——预测股票的涨跌
- 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
- 《BI那点儿事》Microsoft 线性回归算法
- 《BI那点儿事》Microsoft 线性回归算法
- 《BI那点儿事》Microsoft 逻辑回归算法——预测股票的涨跌
- 《BI那点儿事》Microsoft 聚类分析算法——三国人物身份划分
- 《BI那点儿事》Microsoft 时序算法——验证神奇的斐波那契数列
- 《BI那点儿事》Microsoft 神经网络算法
- 解决ASP.NET1.1 access is denied: 'Microsoft.Data.Odbc' 的问题
- http://msdn.microsoft.com/zh-cn/dd408813
- 利用Microsoft.VisualBasic中TextFieldParser解析器把CSV格式倒入数据库
- MSMQ(MicroSoft Message Queue,微软消息队列)