您的位置:首页 > 编程语言 > Python开发

【kaggle】数据分析kaggle + 如何系统地自学 Python?

2018-02-03 15:42 651 查看

https://www.zhihu.com/question/29138020/answer/207547531


如何系统地自学 Python?

http://www.pythontutor.com/visualize.html#mode=edit




如何在 Kaggle 首战中进入前 10%

https://dnc1994.com/2016/04/rank-10-percent-in-first-kaggle-competition/


Kaggle如何入门?

数据结构可视化
http://www.pythontutor.com/visualize.html#mode=edit https://www.zhihu.com/question/23987009


Kaggle入门,看这一篇就够了

https://zhuanlan.zhihu.com/p/25686876?group_id=825076321293058048


教程 | Kaggle初学者五步入门指南,七大诀窍助你享受竞赛

https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650729193&idx=3&sn=5f251a5861eb891df377d9bc41b4d468&chksm=871b2e97b06ca7816f32fcfd915d7727adbbbe04958e37fb83b2919d968601a76f6a232178d7&mpshare=1&scene=1&srcid=0725ukFZcMPxmShvASI7pO85&key=238113c46368d35b4cb36628d833700b78b0b433f41770288605952e5d27089f0196d712ffa19a4be533c674f885f8e13ebc626d63cdfe5eec63674231821e316a65ebb378aedc57da0310ca7e24c040&ascene=0&uin=NTU2ODc3MDk1&devicetype=iMac+MacBookPro12%2C1+OSX+OSX+10.10.5+build(14F2411)&version=12020110&nettype=WIFI&fontScale=100&pass_ticket=eTbnrK692ajIv6Or%2BfDxGsLYF%2B0aAxT4Yo1aLYu5M7%2F3Iy%2FkQ6osDRTfEOXy13V7

作者:a2Mia姐

链接:https://www.zhihu.com/question/23987009/answer/151721198

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

前几天刚好写了一篇专栏“Kaggle入门,看这一篇就够了 - 知乎专栏”,看到这个问题忍不住来回答一下。

不知道题主本身是什么水平,现在就假设一个具有数学/CS/统计背景的同学,对Python和R非常熟悉,想要通过Kaggle比赛来提升自己的实战能力,最好从以下几个步骤进行:

1. 了解比赛:独立完成练习赛。练习赛中的题目数据量小,难度低,同时有标准的官方解释和大量的民间资源,非常适合上手找感觉。专栏中“0基础如何上手Kaggle”这一部分中非常贴心的给出了三个经典练习的参考资源供大家练习。

2. 学习比赛:善用平台资源,认真阅读以往Kaggle项目的Kernels,学习以往的比赛中顶级选手处理这些案例的方法,有问题可以在社区(如Forum)向其他人请教,像这样水平很高还对新人无比友好的社区大家一定要珍惜。

3. 参加比赛:找几个队友,选择合适的项目,正式开启Kaggle之旅!这一部分可以参考专栏中的“对于新人,如何在Kaggle中提升排位?”

4. 进阶比赛:对于基础好、目标高的同学,专栏中还给大家提供了一篇“如何在Kaggle首战中进入前10%”的文章作为参考,也是干货满满~

我想关注这个问题的大部分人来讲,可能并不具备以上背景和能力。那么,对这样的同学,我建议从学习一到两门编程语言开始(Python和R),之后再按照以上步骤来走。

最后,祝你打怪愉快!

其他答案说的很详尽,但是感觉篇幅很长,作用很小。

我觉得入门分几步:

(1) 了解基本机器学习概念和算法(可以上一下任何机器学习的公开课);

(2) 在(1)的基础上进一步了解各个算法适合什么样的问题 (可以看看傻瓜版再深入了解,Machine Learning For Dummies Cheat
Sheet),了解bias-variance tradeoff,了解出现一些症状的时候如何解决(可以看看andrew ng以前的presentation或者coursera上的新课);

(3) 了解kaggle比赛规则,试着参加一个比赛;

(4) 推荐看一看kaggle winner solution,以及最后推荐一个coursera上的kaggle课程,课程叫做How to Win a Data Science Competition: Learn from Top
Kagglers。

(5)多实践,实践中渐渐熟悉使用sklearn,pandas等等。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: