大数据比赛-综述
2016-04-22 13:07
260 查看
虽然只参与了几个小型的数据比赛,成绩也十分惨淡,但还是有一些小小收获记录下来以便查阅。
1、比赛流程:
问题分析-》样本处理-》特征抽取-》模型选择/实现-》调参测试-》提交
当然,与软件工程相同,比赛的过程也是迭代进行的,每次提交之后可能就要重新走一遍流程以发现改进点。
以目前浅薄的经验来看,最重要的步骤是特征抽取、模型选择与调参,之后会进行详细介绍
2、注意事项:
1》戒骄戒躁:一两次提交、甚至一两次比赛的结果都不要看的太重,关键是从中学会解决该类问题的基本方法,发现自己的弱点和不足。
2》沟通交流:最好能有固定的队伍、广泛的交流圈子,很多时候困扰你的问题别人一两句话就能让你走出误区。
3》确定目标:如果你志在奖金或者排名那就不要拘泥于模型的实现,要综合考虑问题的各个方面,针对具体问题需要考虑不同的解决方案,如果你是抱着学习的目的来的,那就要多尝试、多实践,多整理,充分的体会各种不同模型的区别,理解机器学习解决问题的基本方法。
1、比赛流程:
问题分析-》样本处理-》特征抽取-》模型选择/实现-》调参测试-》提交
当然,与软件工程相同,比赛的过程也是迭代进行的,每次提交之后可能就要重新走一遍流程以发现改进点。
以目前浅薄的经验来看,最重要的步骤是特征抽取、模型选择与调参,之后会进行详细介绍
2、注意事项:
1》戒骄戒躁:一两次提交、甚至一两次比赛的结果都不要看的太重,关键是从中学会解决该类问题的基本方法,发现自己的弱点和不足。
2》沟通交流:最好能有固定的队伍、广泛的交流圈子,很多时候困扰你的问题别人一两句话就能让你走出误区。
3》确定目标:如果你志在奖金或者排名那就不要拘泥于模型的实现,要综合考虑问题的各个方面,针对具体问题需要考虑不同的解决方案,如果你是抱着学习的目的来的,那就要多尝试、多实践,多整理,充分的体会各种不同模型的区别,理解机器学习解决问题的基本方法。
相关文章推荐
- Send Report from Same Email Address
- 大数据量时Mysql的优化要点
- http://blog.csdn.net/a942980741/article/details/39990699
- could not find ParserDetails.ini
- 大数据时代下的NoSql
- HEVC的Availability计算过程
- HDFS配置Kerberos认证
- HDU 1021 Fibonacci Again
- vSphere-01 Joining your ESXi host to a Windows Domain
- HoloLens开发手记-硬件细节 Hardware Detail
- 人工智能60年:全球人工智能技术大会今日召开,谁在外面“流口水“(即”流哈喇子“)?
- POJ 1995 Raising Modulo Numbers(快速幂取模)
- 001潜入大数据Hadoop框架的世界
- Rain
- wemall微信商城云平台 快速创建您的微信商城
- <a> Email
- AIDL
- 在MainActivity 中,获取控件的宽 高
- HDU1848 Fibonacci again and again(SG函数的应用)
- waitKey()