您的位置:首页 > 其它

机器学习/深度学习入门资源整理v1.0

2017-07-03 11:20 856 查看
见过很多同道为入门而苦恼,很多人只是看了一眼风景,最后因为各种原因而黯然放弃。作为一个相关领域的萌新,也是一点点自学过来的,深知其中滋味。网上相关的资源整理、收集帖子不可胜数,内容是够多了,但多数并不适合用来入门。

所以特地整理挑选了一下我认为还不错的资源,希望能对相关者有所帮助。

资源类型主要有公开课、公众号、网站和书籍。

公开课

CS231n

由斯坦福视觉实验室开课,最知名也是最好的深度学习网络公开课资源之一。讲授由浅入深、形象生动,内容清晰干净,是入门深度学习和计算机视觉的最佳课程之一。

Andrej将2016winter版的课程录像公开在了Youtube上。

之前大数据文摘与北邮模式识别实验室合作翻译了2016版,放到了猪场公开课平台。翻译质量不算高,据说是因为组织失序+赶工期。不过对于英语不好的人,确实比看全英文的要省力很多。知乎也有人发布了所有笔记的中译版,质量还不错。

学习该课程,请观看所有视频、细读所有笔记并认真完成assignments。

CS229

吴恩达在斯坦福教授的机器学习课程。因为是正式课程,比Coursera上的内容更为全面,难度也高了不少。同样,课程笔记比视频更有价值。机器学习最佳课程之一。

CS224d

another Stanford……自然语言处理与深度学习课程,之前还有CS224n,近年统一更新为224d。

Machine Learning by Andrew Ng.

Coursera的招牌课程。讲解入门级别的机器学习概念、算法与应用。非常浅显易懂,有些内容值得一段时间之后再深入琢磨。作业源码值得学习。

Neural Networks for Machine Learning by Hinton

Geff. Hinton是DNN复兴的领军人物之一,正是他2006在Science Reports上发表的文章揭开了神经网络第三次浪潮的序幕。这门课自从2012年之后在内容方面未作更新,所以也有人(在Quora上)表示其内容已经过时,但实际上,该课程对于机器学习领域的神经网络做了相当清晰的解剖,许多知识和观点的价值远不是短短五年时间所能淘汰掉的。

不过这门课在中期涉及到RNN、RBM(DBN)之后难度明显增加,比Andrew Ng.的课程难度大很多。对这门课的评价可参考:

http://www.leiphone.com/news/201704/uXQQZbBR1urHIGmZ.html

还有一件有趣的事情值得一提。

CS231n某一节,Andrej讲到神经网络优化算法时会提到RMSprop。有人可能会觉得,这种方法应该是近年发表的某篇论文。许多人在论文中也使用了这种方法。不过在写引用文献时,他们标注的来源,是Hinton这门课Lecture 6中的一页PPT:

Tieleman T, Hinton G. Lecture 6.5-rmsprop: Divide the gradient by a running average of its recent magnitude[J]. COURSERA: Neural networks for machine learning, 2012, 4(2).

这门课雷锋网做完了全16周的翻译,可作参考。

利益相关:负责Coursera该课程的中文翻译、雷锋字幕组版本Lecture14的译者

Machine Learning specialization by UW

Coursera的专题课程,原来有六门课,前段时间丢了后两门。几大MOOC都在转型,Coursera的模式是颁发证书。很多课程去年更新之后,未购买证书的学生无法使用quiz和assignment评测模块。

第一门课是纯粹的入门部分,难度比Andrew Ng.的还要低,适合对机器学习一窍不通的人走马观花看一遍。后续三门课会分开详解几类重要的算法。

这个专题的缺点在于,授课人使用了AWS和Graphlab Create。前者国内网络受限不方便使用,后者是Python的商业第三方库,傻瓜化的机器学习模块构建工具。虽然可以申请Coursera和教育专版免费使用,但因为太过黑箱,并不适合自主学习。

机器学习基石&机器学习技法

机器学习最好的中文公开课之一,由台大林轩田授课。台大在机器学习/数据挖掘方面有比较强的实力,多次在KDD Cup这类竞赛中拿到第一第二的好成绩。最近比较著名的《一天学完深度学习》和2017年公开课的作者李宏毅,也是台大的博士后。

林将台大的原课程按Coursera的授课节奏改编为这两门课,按照知识点分了章节,非常适合碎片化的学习。但2016年Coursera平台整体升级,这门课由于无人维护,已经在Coursera上失踪了。视频资料随处可见,但附带的quiz和assignment随之一并遗失,非常可惜。

另外。都知道这两年ML/DL凭借“AI”的皮,火得一塌糊涂。很多学术界的大佬纷纷出走企业。毕竟给钱多啊。而林轩田老师的个人主页显示,他也已经离开台大,到一个叫Appier的公司去做首席科学家了……

机器学习导论&统计机器学习

原上交教授张志华在ACM班的授课录像。课程顾名思义,一讲机器学习,一讲背后的统计学理论。这门课难度也不低,适合不愿看英文资料和想要进一步深入学习的朋友。

也说句题外话。张开始是浙大的兼职教授,后来是上交的教授,去年又从上交离开,去了……北大数学学院(数学好的人是不是都这么厉害……)。

Deep Learning Book的中文版本据说就是他的学生组织翻译的。

Udacity 机器学习/深度学习入门课程

前面提到各大MOOC转型。Udacity是转型比较彻底的,所有重要的课程基本都收费了。不过他们的课程设计很不错,网站的视频、作业评测,微信学习督促群,“班主任”在线指导……是真的在做“网络课堂”。不过价格并不便宜。

但他们的机器学习课程目前还是免费的。内容比较浅显。

公众号

博主本人并不喜欢看公众号,因为手机阅读体验不好而且不支持内容搜索,不适合有计划的学习。但公众号已经成气候了,又是不得不接受现实。

这就是工具裹挟需求的案例之一吧。

仅列出,不作详细介绍。

AI100

大数据文摘

新智元

机器之心

机器学习算法与Python学习

AI研习社

机器学习研究会

深度学习大讲堂

博客

国内的CSDN、博客园,国外的medium.com资料很多。博文的优点是有针对性且经常附有代码,按需搜索即可。

网站

雷锋网,52ML,52CS,52NLP,51jobbler有很多资源。

一些官方网站,如Tensorflow,它的官方教程当然是最好的入门资料。

所以不要总是百度乱搜了!

书籍

《机器学习》by周志华

国内最好的机器学习教材。难得的是周志华教授的中文水平也非常厉害,文字功底与学术水平都令人叹为观止。这是真正的中文教科书。要说有什么缺憾的话,就是基本没有涉及深度学习。

《统计机器学习》by李航

作者也是NLP领域的老专家了,现为菊厂机器学习的舵手。该书出版稍早,但也是中文的必读教材。

Deep Learning Book by Ian Goodfellow and Yoshua Bengio and Aaron Courville

4000

第三位不太清楚,看到前两位的时候瞬间跪了……前面提到的中文正式版已经完成,即将出版。

预售链接:http://www.epubit.com.cn/book/details/4278

Neural Networks and Deep Learning

同样是资深业内人士写作的书籍。中文版是一位浙大的研究生在做。这本书没细看,但读起来非常亲切,作者的很多个人看法非常有参考价值。

Machine Learning Yearning by Andrew Ng.

吴恩达的新作。完全忘了看,写这篇博文的时候才想起来。还是一本入门书籍,但内容和组织形式很新颖,针对具体问题做了引导式的讲解。

小结

读到这里,有人可能会奇怪资源为什么这么少。那么请看标题。

入门姿势千千万,贵在坚持和有效选择。资源在精不在多。想要多还不容易,出门左拐遍地都是。

本文视情况可能会有所增删。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息