您的位置:首页 > 其它

数学建模实训之统计方法作业

2014-04-28 15:46 363 查看

2014年数学建模实训作业

1 数据简介

记录了31个省份的指标, 包括省市名称(shmc), 综合指数(zhzs), 社会结构(shjg), 经济与技术发展(jjfz), 人口素质(rksz), 生活质量(shzl), 法制与治安六项指标(fzza),

2 回归分析

以 综合指数(zhzs) 为响应变量, 以其余变量为解释变量,进行回归分析
观察综合指数和其他变量之间的关系
采用逐步回归法,剔除无关的解释变量,其中有两个变量包括常数项都可以 剔除

3 完成如下回归分析的结果

逐步回归方法得经验方程为 zhzs=                      −−−−−−−−−−
对模型的有效性进行分析
F统计量的值        −−−
p值为        −−−
误差方差的估计        −−−
模型是否有效 (通过p值进行判定)

4 主成分分析作业

对除"省市名称" 和 "综合指数" 外的全部变量进行主成分分析,(基于相关系数矩阵)
挑选第一主成分并按照第一主成分的大小, 对31个省市进行排序,给出排 序结果

5 聚类分析作业

采用 “省市名称” 和 “综合指数”之外的其余变量,对31个省份进行聚类分析, 分为3–5类,并 绘制聚类谱系图
聚类之前对变量进行标准化处理,距离采用平方欧式距离
聚类方法(类间距离定义方法)可以采用:
单连接(最短距离法)
全连接(最长距离法)
重心法
wald方法等

6 思考题–选做

可以采用主成分分析得出前两个主成分,直接进行聚类分析,不再进行标 准化变换
可以对几个变量进行聚类分析,考察哪些变量关系密切

7 作业的相关要求

要求对软件输出结果进行分析,

找出需要的估计量,如系数估计,t统计量的值,p-值,是否显著等结论, 对直接复制软件输出结果,不给出任何分析的作业酌情扣分

要求制作word文档(挑出作业要求的结果),office 版本不限

作业上交到邮箱 mailto:yzlv@hdu.edu.cn

附件文档命名方法 学号姓名.doc,

例如: 1007310张三.doc
Word文档中签注学号和姓名
doc文档直接作为邮件附件发送(请不要压缩,也不要上传到网盘发链接给 我)

8 数据

"省份""综合指数""社会结构""经济技术发展""人口素质""生活质量""法制与治安"
"北京"93.210094.7108.497.455.5
"上海"92.395.192.711295.457.5
"天津"87.993.488.7989062.7
"浙江"80.989.485.178.586.658
"广东"79.290.486.965.986.559.4
"江苏"77.882.174.881.275.974.6
"辽宁"76.385.865.793.168.169.6
"福建"72.483.471.767.77660.4
"山东"71.770.86775.770.277.2
"黑龙江"70.178.155.782.167.671
"吉林"67.981.151.885.856.868.1
"湖北"65.973.548.779.95679
"陕西"65.971.548.281.951.785.8
"河北"6560.152.475.666.476.6
"山西"64.173.2417357.387.8
"海南"64.171.646.261.854.5100
"重庆"6469.741.976.263.277.9
"内蒙古"63.273.542.278.250.281.4
"湖南"60.960.540.373.956.484.4
"青海"59.973.843.763.94780.1
"四川"59.360.743.571.950.678.5
"宁夏"58.273.545.967.146.761.6
"新疆"64.771.257.275.157.364.6
"安徽"56.761.341.263.552.572.6
"云南"56.759.449.859.848.172.3
"甘肃"56.66636.666.245.879.4
"广西"56.163.837.164.456.166.6
"江西"54.766.433.361.645.677.5
"河南"54.551.642.163.35566.9
"贵州"51.161.931.5564175.6
"西藏"50.959.750.156.729.962.4
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  作业