您的位置:首页 > 其它

第二次结对作业

2017-10-15 11:31 204 查看

整体概况

结对信息

github链接

设计说明

关键代码解释

性能分析

所遇到的困难及对队友的评价

PSP、学习进度条更新

1、结对信息

311 旭

437 辉

2、github链接

github爆炸。。。就先看看coding的链接吧,后面更新 点击这里

队友的链接

3、设计说明

类图



API接口设计

public MyC allocate
{
public  void Myjson();//读入与处理json数据
public  void FDmatching();//实现第一次分配
public  void SDmatching();//实现第二次分配
public  void TDmatching();//实现第三次分配
public void  Prin();//输出
}


匹配算法的设计

1. 流程图









***

2.匹配思想

Step1:为了不让后生成的学生的优先级过低导致不能进入部门,首先以高考成绩换算成的评分(随机生成)排名,从高到低排名,给每个人一个rank排名。

Step2:在第一步的前提下,以第一志愿优先原则:从rank为1的学生开始,遍历其第一志愿,当第一志愿对应的部门的人数没有满的情况下,进行匹配判断,匹配判断分为以下两步:

Step 2.1 进行时间判断,将学生的空闲时间段与部门的基础活动时间段进行匹配,当两个时间段中有1个时间段互相匹配(同一时间段或者学生的空闲时间段大于部门的活动时间段),进行下一步判断。

Step 2.2 时间判断满足的情况下,进行标签匹配。将学生的兴趣标签与部门的标签进行一一对比,只要其中有两个两两匹配,即满足判断,更新学生信息与部门信息(学生:加入部门信息、加入部门数 部门:成员信息、部门人数、部门人数上限等)

Step3 对所有的学生,依旧按照成绩排名,从rank为1的学生开始,遍历其所有志愿,当其志愿对应的部门的人数没有满的情况下,进行匹配判断,匹配判断分为以下两步:同上

Step 3.1 进行时间判断,将学生的空闲时间段与部门的基础活动时间段进行匹配,当两个时间段中有1个时间段互相匹配(同一时间段或者学生的空闲时间段大于部门的活动时间段),进行下一步判断。

Step 3.2 时间判断满足的情况下,进行标签匹配。将学生的兴趣标签与部门的标签进行一一对比,只要其中有两个两两匹配,即满足判断,更新学生信息与部门信息(学生:加入部门信息、加入部门数 部门:成员信息、部门人数、部门人数上限等)

Step 4 最后一轮匹配,对所有的学生,依旧按照成绩排名,从rank为1的学生开始,遍历其所有志愿,当其志愿对应的部门的人数,且学生的已加入部门信息没有该部门没有满的情况下录取。

测试数据如何生成(由队友完成)

部门部分

部门名(department_name):部门名由事先设定好的字符串,通过随机数的组合进行随机生成,由于在下面学生的意向部门中需要用到部门名,因此先用一个字符串数组先存起来。

人数上限(member_limit):单个,数值,在[0,15]内,这是题目要求,但是考虑到部门的实际情况,一个部门不可能纳新人数0人,而且数字比较小,也比较奇怪,因此我们加上底数限制,范围在[10,15]中,实现方法也比较简单,只要通过一个简单的随机程序,在这个区间内随意生成一个数字即可。

部门特点标签(tags):首先我们预设9个标签,但是当我们数据测试的时候其实有考虑标签的匹配,如果总标签数少,这一层的匹配率相对来说太高,也就是标签匹配没有发挥作用,因此我们将其扩充到17个,经过测试,效果上有所改善,匹配率下降了2个百分点左右,表明标签匹配发挥了作用。我们的实现方法也比较简单,预取3个目标标签,但是要考虑重复部分,因此在0-16随机生成三个数,经过简单的if去重,得到三个不重复的随机数,作为数组标志,抓取标志。

部门常规活动(schedule_time):最初的想法就是星期输与时间数的随机匹配,时间是控制在10点到23点。这是符合实际情况的,部门工作有一块很重要的内容就是值班,因此需要安排每个时间段都需要人值班,因此部门活动时间是一个跨度比较大的范围。实现方法也是,星期数是预存数组的随机,时间则是在10-21点随机一个数字,后一个是加上2,表示成字符串。

学生部分

学生姓名(student_name):原先采取和部门名一样的生成方法,生成一个乱码的字母组合来表示,后来可能觉得蛋疼,太蠢了!于是觉得做一点合乎常理的事,名字嘛,就该有正常的姓和名。于是做了三个姓和名的数组,全是将我们班级的人的姓,慢慢打入,还有所有名字拆成两个字,考虑到最终有5000个,因此每个数组分别20、35、38个,总数20 * 35 * 38 > 5000,即直接投入使用。当然会考虑到重复的问题,在下面的模块会简单阐述。

学号(student_number):作为一个并没有很大影响的标识(因为在名字设立板块采取去重,即无重复名字,因此名字可作为唯一标识),学号这块就主要是0315+8位的随机数组成学号,0315表示数计学院15级学生,也是有良好的寓意的。

兴趣标签(Interests):本块内容与部门部分的标签相似,不做累赘说明。

绩点(gap):绩点这块实现难度上就不说了,比较简单,谈谈实际情况。由于福州大学今年绩点改革,因此我们决定跟上潮流,才取阶梯制加上十分制,比如87分、80分和85分的绩点都算作9,65分和60分绩点都算作6.0,也就是不再是一分一绩点,而是一段一绩点的形式。

意向部门(intention_dep):这一块内容也比较简单,将部门生成名字时存入的数组进行调用,随机产生三个不同的该范围内的随机场,进行调取部门。

可用时间(available_time):最初的想法和部门常规活动时间一样,最终改变的原因主要有两个,一个是匹配的问题,因为时间以段为单位,在时间生成上产生了11*7=77种可能性,再加上部门和学生的可用时间需要三个标签最终进行匹配,导致匹配率极低;第二个是实际情况,如工作日的10点-17点,很明显是属于学生的学习时间,不太可能将部门活动时间定在这个时间段,正常的可用活动时间段应该控制在工作日的晚上19点-23点,以及周末的一整天,实现方法是在部门的简单随机上,加了两个if的判断,即可实现。

如何评价自己的算法

咳咳,算法方面一定要自我检讨一下了,因为匹配算法是自己写的。算法只考虑了匹配过程的可执行性,在复杂度方面没有做过多的考虑,甚至出现了三层嵌套for循环的情况,结果就是导致在最大的5000students、100departments时,要30几秒才能完成运行,每次都等得自己要疯,队友要打人。

对不起队友,对不起老师,对不起国家。。。。。。。

4、关键代码解释

尴尬了,这种代码真的是来个freestyle就是:这个代码又臭又长,这个人他又笨又。。。。算了不骂自己了

int rank = 1;
for (i = 0;;i++)
{
if (stu[i].rank == 0)
break;
else if (stu[i].rank == rank)             //找到当前排名的学生
{
j = 0;
while (dep[j].departments_name != "NULL")
{
if (dep[j].departments_name == stu[i].intention_dep[0] && dep[j].member_limit!=0)
{
//判断时间是否冲突
bool flag = false;
int e = 0;
while (dep[j].available_time[e] != "NULL")
{
int q = 0;
while (stu[i].available_time[q] != "NULL")
{
if (mtime(dep[j].available_time[e], stu[i].available_time[q]))  //如果有一个时间段符合就被录取
flag = true;
q++;
}
e++;
}
if (flag == true)
{
//判断便签是否有一个符合
bool tflag = false;
int a = 0;
while (dep[j].tags[a] != "NULL")
{
int b = 0;
while (stu[i].interest[b] != "NULL")
{
if (dep[j].tags[a] == stu[i].interest[b])  //有一个标签符合就返回正确
tflag = true;
b++;
}
a++;
}
if (tflag == true)
{
//更新学生信息
stu[i].match[stu[i].matching] = dep[j].departments_name;
stu[i].matching++;
//部门信息更新
dep[j].member_limit--;
dep[j].member[dep[j].matching] = stu[i].student_name;
dep[j].matching++;
break;
}

}
}
j++;
}
rank++;         //排名到下一位
i = -1;         //让程序回到第一个学生重新开始遍历
}
else continue;
}

自行感受。。已第一次匹配为例。我一定要把它改掉。用某神的话,要优雅。。。。。

5、性能分析

接下来已s5000-d100为例,先上图





还是我自身的问题,跑程序花费的时间过长,不够优雅。

输入输出

s200-d20

link





s500-d30

link





s1000-d50

link





s5000-d100

link





6、所遇到的困难以及对队友的评价

遇到的困难

刚开始对这次的例如json、匹配等两个人都不是很懂,也不找到该怎样入手,后来慢慢的摸索后总算走上了正轨。

我自己在写算法时,再随着慢慢的数据的变大,里面一些内容的更新,也是不断的出现错误,到后来是自己一遍一遍一行一行的跑完,才完成了算法,虽然很不优雅,但是算是完成了吧。

对队友的评价

就祝你保重,越来越重。

7、PSP、学习进度条

PSP2.1Personal Software Process Stages预估耗时(分钟)实际耗时(分钟)
Planning计划105
· Estimate· 估计这个任务需要多少时间12060
Development开发6030
· Analysis· 需求分析 (包括学习新技术)5020
· Design Spec· 生成设计文档2020
· Design Review· 设计复审 (和同事审核设计文档)2010
· Coding Standard· 代码规范 (为目前的开发制定合适的规范)1020
· Design· 具体设计2030
· Coding· 具体编码120240
· Code Review· 代码复审60120
· Test· 测试(自我测试,修改代码,提交修改)100100
Reporting报告6030
· Test Report· 测试报告3030
· Size Measurement· 计算工作量2030
· Postmortem & Process Improvement Plan· 事后总结, 并提出过程改进计划3030
合计730715
第N周新增代码(行)累计代码(行)本周学习耗时(小时)累计学习耗时(小时)重要成长
11201203.53.5了解了软工的艰难,坚定了信息
27208403033.5国庆屁颠屁颠得跑到学校打代码,很开心(心里mmp)
340012402154.5开始学习Python
---更新
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: