统计挖掘那些事那些情(2)-回归分析spss
2016-10-14 16:18
399 查看
前文:统计挖掘的一些事一些情(一)
实际上,无论是日常的统计学习还是挖掘学习中,回归分析都可以算是大家最早接触,也是整个体系当中相当重要的一个内容了,所以咱们这期就从回归分析说起吧。
一般来说,借助回归分析,我们希望可以量化描述预测变量与响应变量的关系,同时帮助我们进行预测。其他的例子还有:广告的投入与市场销售的关系,受教育程度与收入的关系等。而在整个回归体系当中,最基础的莫过于普通最小二乘回归(Ordinary Least Square,简称OLS)
实际上,对于回归分析来说,我们需要有两件事情需要确认:(1)参数估计;(2)假设检验。
1:参数估计
实际上,上述的回归分析损失函数是一个凸函数;在机器学习中,我们一般会构造关于所求变量的凸函数,这更容易帮助我们取得最优解。
从上面的式子中,我们可以得知,在其他因素固定的情况下,身高每增加1cm,体重就平均增加2.085kg
2:假设检验
(1)t检验
(2)相关系数r
实际上,以我们考试为例。参数估计,有点像我们回答问题的过程;而假设检验,则是像检验我们刚刚回答是否达到标准的过程;
接下来,我们简单谈谈利用SPSS Modeler的实现过程
直接回复公众号“回归分析”,将给你提供本次回归分析所使用的数据和建模文件的网盘链接
从上述分析结果中,我们可以看到系数检验表(Coefficients),无论是常数项还是身高的系数项对应的P值都是小于0.05,认为系数显著,可以写出回归方程:体重=2.085 ∗ 身高 − 290.4。另外我们通过ModelSummary可以看到,该回归方程的相关系数r=0.997,说明体重与身高有非常强的线性相关。至于中间的ANOVA表格,则是F检验的结果,我们留待下节介绍。
相关文章推荐
- 统计挖掘那些事那些情(2)-回归分析spss
- SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类
- SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类
- 统计分析与数据挖掘所涉及的应用领域探讨
- SPSS—回归—多元线性回归结果分析(二)
- 分析报告、统计分析与数据挖掘的区别(转)
- 数据分析软件SPSS及数据挖掘软件WEKA使用
- 统计分析与数据挖掘所涉及的应用领域探讨
- 数据挖掘之回归分析
- 数据仓库、OLAP和 数据挖掘、统计分析的关系和区别分析
- 机器学习、大数据、深度学习、数据挖掘、统计、决策和风险分析、概率和模糊逻辑的常见问题解答
- 机器学习、统计分析、数据挖掘、神经网络、人工智能、模式识别,
- 联机分析挖掘(OLAM)在政府统计工作中的应用研究(一)
- SPSS—回归—二元Logistic回归案例分析
- SPSS-相关性和回归分析(一元线性方程)案例解析
- 数据仓库、OLAP和 数据挖掘、统计分析的关系和区别分析 .
- 统计分析与数据挖掘所涉及的应用领域探讨
- 统计分析与数据挖掘所涉及的应用领域探讨
- 分析报告、统计分析和数据挖掘的区别
- 从“分析”的角度谈OLAP、数据挖掘、统计分析三者之间的区别和联系