文章标题
2015-03-03 17:19
302 查看
刚看完http://beader.me/2014/05/03/logistic-regression/这篇关于logistic回归的博客,还没有完全消化。
17:06看完data snooping这一视频。现在来回忆一下这十几分钟讲述的主要内容。
1.预测的时候数据是分为训练集和测试集的。
2.虽然在做机器学习的时候snooping不好,但是,想要做到不snooping是很难的。
3.如果希望预测效果较好,那么就需要小心地snooping并且做好validation的工作。
在教师讲课的过程中,他也多次提到过可能需要尝试多个模型然后看效果。想到之前跟师兄讨论机器学习大作业的做法时,师兄认为一旦给你一个问题,你就应该知道需要用什么数据预处理方法以及使用相应方法的原因,后来在组会的时候我甚至把它扩大为对于模型的选择也可以一眼看出来需要用哪一个,如果专业素养以及经验都足够的话。但是,看了这个视频之后,我开始觉得可能会有一些判断,但是没有那么夸张。
所以呢,接触到的信息渠道不同,信息量不同,你看待事情的视角,你的观点也会有所影响。因此,不要觉得输入已经足够了,更多的是需要输出,可以这样说,机器学习的门你目前都还没有找到!So, come on!
17:06看完data snooping这一视频。现在来回忆一下这十几分钟讲述的主要内容。
1.预测的时候数据是分为训练集和测试集的。
2.虽然在做机器学习的时候snooping不好,但是,想要做到不snooping是很难的。
3.如果希望预测效果较好,那么就需要小心地snooping并且做好validation的工作。
在教师讲课的过程中,他也多次提到过可能需要尝试多个模型然后看效果。想到之前跟师兄讨论机器学习大作业的做法时,师兄认为一旦给你一个问题,你就应该知道需要用什么数据预处理方法以及使用相应方法的原因,后来在组会的时候我甚至把它扩大为对于模型的选择也可以一眼看出来需要用哪一个,如果专业素养以及经验都足够的话。但是,看了这个视频之后,我开始觉得可能会有一些判断,但是没有那么夸张。
所以呢,接触到的信息渠道不同,信息量不同,你看待事情的视角,你的观点也会有所影响。因此,不要觉得输入已经足够了,更多的是需要输出,可以这样说,机器学习的门你目前都还没有找到!So, come on!