Skip to content

Latest commit

 

History

History
156 lines (122 loc) · 20.7 KB

学习资料.md

File metadata and controls

156 lines (122 loc) · 20.7 KB

资源合集

老师见谅,最近加班比较多。简单把学习过程中觉得不错的资料和工具草草的罗列了一下。后续继续更新吧。

可以先上网搜一下这个很经典的图。一个数据科学家的技能路线图,算是一个总览吧。

推荐的学习方式:
基础课程 + 笔记总结 + 小习题代码练手 + 通过比赛增加实操经验和团队合作经验

关于学R还是py:
先丢一篇最近的推文:
为何Python攀上数据科学巅峰?KDnuggets2017调查Python超越R
总体来说技多不压身、其次工具确实是次要的。推荐学习python,上手相对容易些。

微信公众号推荐

公众号 Topic Remarks
机器之心 深度学习、机器智能 网站同样精彩
机器之心
AI 商用搜索
新智元 深度学习、人工智能 高质量推送
AI科技评论 深度学习、人工智能学会 高质量推送
数据派THU 清华大数据、知识普及、线下讲座、社团活动 推可以尝试加一下他们的算法研究部门

网站推荐

网址 Topic Remark
Coursera - Online Courses From Top Universities. Join for Free 吴恩达的机器学习课和深度学习课 特别合适的入门课程,但由于是英语,并不是那么好上手,机器学习的词汇学习可以参考jiqizhixin/AI-Terminology-page: The English-Chinese paired terminologies in Artificial Intelligence Domain
集智 - 通向智能时代的引擎 深度学习
北航大牛、线上教学、在线操作、线上社团
QQ群风气不错,是个问问题的好地方
BitTiger丨The Lifelong Learning Platform of Silicon Valley 全栈工程师
直播课堂、精品教学、线上社团
直播活动比较多,可以加一下bittiger读书会
实验楼 - 在线做实验,高效学编程 全栈工程师
在线操作
公众号也还行
Safari, the world's most comprehensive tech & business learning platform 大数据全栈工程师
O'REILY的一个在线教育平台,资源比较丰富
可以免费试用
O'Reilly Data - O'Reilly Data 中文站也不错
优达学城 (Udacity) - 传授硅谷的名企官方课程 视频质量很高 可以试用几天
InfoQ - 促进软件开发领域知识与创新的传播 全栈工程师
商业讲座、培训
极客搜索做的也挺好

课程推荐

公众号 Topic Remarks
斯坦福大学公开课 :机器学习课程(吴恩达) 链接:http://pan.baidu.com/s/1o8o9LvO 密码:3hh3 可以在bilibili上看,搜索:fly51fly 关注爱可可爱生活 北邮的一个老师,这个账号挺出名的 上面有很多视频可以看 李宏毅的课也挺好,这个老师微博、豆瓣、简书、头条、微信公众号、bilibili均有账号,每天早上6点,更新各种机器学习的资料
看视频的时候建议写写笔记

工具推荐

工具 Topic Remark
github 代码仓库、开源代码共享、搭建博客、解答问题 资源特别丰富
学习下git和markdown,非常有用
github有桌面版,省去了代码操作
ATOM、sublime、VScode 三选一、多语言环境代码编辑器 熟悉一个代码编辑器(插件和快捷键),对于提高效率很有用
Stack Overflow 解决问题的网站 比知乎、segmentfault、quora都好用
docker 各种环境镜像 不会配置环境直接克隆别人的镜像
evernote、endnote+dropbox 前者可以做知识收集、后者可以做资料仓库 特别推荐 endnote

比赛社区

名称 Topic Remark
Kaggle: Your Home for Data Science google 上面有一些比较经典的赛题,一些获奖者会开源他们的方法和代码
天池大数据竞赛_竞赛平台_海量数据_算法 阿里
DF,CCF指定专业大数据竞赛平台 京东
首页-DataCastle大数据竞赛平台 电子科大周涛
biendata 微软 最近有一些不错的比赛

其它推荐

名称 Topic Remark
H2O.ai 一个挺容易上手的机器学习平台 支持R py scala
TensorFlow and deep learning, without a PhD 比较容易理解
My-Coursera-Presentation/AI00 机器之心评的全球AI100强,可以了解一下 机器智能知识方法,领域背景也很重要

数据挖掘方面推荐的教材和专著

[1]J.-W. Han著,《数据挖掘》,机械工业出版社,2006。[专业]

[2]M. Milton著,李芳 译,《深入浅出数据分析》,电子工业出版社,2009。[非专业]

[3]P.-N. Tan等人著,《数据挖掘导论》,范明泽等人译,人民邮电出版社,2010。[专业]

[4]吴军,《数学之美》,人民邮电出版社,2012。[半专业]

机器学习方面推荐的教材和专著

[1]E. Alpaydin, Introduction to Machine Learning, MIT Press, 2004. [专业]

[2]C. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006. [专业]

[3]李航,《统计学习方法》,清华大学出版社,2012。[较难]

[4]周志华,《机器学习》,清华大学出版社,2016。[专业]

统计学方面推荐的教材和专著

[1]D. Freeman等人著,魏宗舒等人译,《统计学》,中国统计出版社,1997。[专业]

[2](美)达莱尔 著,廖颖林 译,《统计陷阱》,上海财经大学出版社,2002。[半专业+有趣]

[3](美)戴维.穆尔 著,郑维厚译,《统计学的世界》,中信出版社,2003。[半专业+有趣]

[4](美)纳特.西尔弗 著,胡晓娇等译,《信号与噪音》,中信出版社,2013。[非专业]

很多同学和同事都经常问起我“怎么进入复杂网络或者网络科学这个领域”?从我自己的经验来说,读优秀的综述论文是进入一个方向最便捷的途径!五年前,我曾经在科学网博客上写过一篇论文,叫做《复杂网络入门读物》,实际上是以前中英文综述的一个综述。这个文章在科学网这个小众化的社区里面都有40000+阅读,很多人认识我恐怕是因为看了这个博客。 《复杂网络入门读物》链接 http://blog.sciencenet.cn/blog-3075-549946.html 现在,复杂网络又往前走了五年,我想从五个方面为大家梳理一下最重要的参考资料——这实际上也是服务我和荣智海下半年的一门《网络科学导论》科,以及我们实验室的研究生和本科生。分别是全球重要的综述,中文快速入门的综述,英文和中文的书籍,以及领域突破性的论文。有一些要花的时间非常长,而且可能超过了我的能力,我只能尽力而为了。 什么是重要的英文综述呢?在做选择的时候,我只能秉承两个简单的原则:(1)发表在大家公认的顶尖杂志上,例如物理学的三大综述期刊(Rev. Mod. Phys., Phys. Rep. 和 Adv. Phys.),以及Nature、NaturePhysics、Science和Nature Reviews系列上的综述论文;(2)发表后引用超过1000次的论文(本文的引用数据来自Google Scholar,截止到解放军建军90周年)。有些综述论文我个人特别喜欢,例如最近在J. Complex Networks和我过Nat. Sci. Rev.上的一些工作。但是为了避免带入太多个人色彩,我都没有选入。如果这些论文足够好,我相信很快就会引用超过1000次。

(1) 综合性综述(往往包含结构特征、演化建模和动力学) [Albert2002] Albert, R., &Barabási, A. L. (2002). Statistical mechanics of complex networks. Reviewsof Modern Physics, 74(1), 47. [Cited 18689 times] [Dorogovtsev2002] Dorogovtsev, S.N., & Mendes, J. F. (2002). Evolution of networks. Advances in Physics, 51(4),1079-1187. [Cited 3234 times] [Newman2003] Newman, M. E. J.(2003). The structure and function of complex networks. SIAMReview, 45(2), 167-256. [Cited 16020 times] [Boccaletti2006] Boccaletti, S.,Latora, V., Moreno, Y., Chavez, M., & Hwang, D. U. (2006). Complexnetworks: Structure and dynamics. Physics Reports, 424(4), 175-308.[Cited 7457times] [Dorogovtsev2008] Dorogovtsev, S.N., Goltsev, A. V., & Mendes, J. F. (2008). Critical phenomena in complexnetworks. Reviews of Modern Physics, 80(4), 1275. [Cited 1426 times] (2) 网络结构特征 [Strogatz2001] Strogatz, S. H.(2001). Exploring complex networks. Nature, 410(6825), 268. [Cited 7038 times] [Wang2003] Wang, X. F., & Chen,G. (2003). Complex networks: small-world, scale-free and beyond. IEEECircuits and Systems Magazine, 3(1), 6-20. [Cited 1213 times] [Alon2007] Alon, U. (2007). Network motifs:theory and experimental approaches. Nature Reviews Genetics, 8(6),450-461. [Cited 2117 times] [Costa2007] Costa, L. D. F., Rodrigues, F. A.,Travieso, G., & Villas Boas, P. R. (2007). Characterization of complexnetworks: A survey of measurements. Advances in Physics, 56(1),167-242. [Cited 1664 times] [West2008] West, B. J., Geneston,E. L., & Grigolini, P. (2008). Maximizing information exchange betweencomplex networks. Physics Reports, 468(1), 1-99. [Cited 152 times] [Estrada2012] Estrada, E., Hatano,N., & Benzi, M. (2012). The physics of communicability in complexnetworks. Physics Reports, 514(3), 89-119. [Cited 131 times] [Newman2012] Newman, M. E. J.(2012). Communities, modules and large-scale structure in networks. NaturePhysics, 8(1), 25. [Cited 424 times] [Liu2016] Liu, Y. Y., &Barabási, A. L. (2016). Control principles of complex systems. Reviews ofModern Physics, 88(3), 035006. [Cited 38 times] (3) 网络上的动力学(传播、同步、Ising模型、博弈等等) [Nowak2006] Nowak, M. A. (2006).Five rules for the evolution of cooperation. Science, 314(5805),1560-1563. [Cited 3197 times] [Szabo2007] Szabó, G., & Fath, G. (2007). Evolutionary games ongraphs. Physics Reports, 446(4), 97-216. [Cited 1778 times] [Arenas2008] Arenas, A.,Díaz-Guilera, A., Kurths, J., Moreno, Y., & Zhou, C. (2008).Synchronization in complex networks. Physics Reports, 469(3), 93-153.[Cited 2036times] [Castellano2009] Castellano, C., Fortunato, S.,& Loreto, V. (2009). Statistical physics of social dynamics. Reviewsof Modern Physics, 81(2), 591. [Cited 2378 times] [Perc2010] Perc, M., & Szolnoki, A. (2010).Coevolutionary games—a mini review. BioSystems, 99(2),109-125. [Cited 1004 times] [Mülken2011] Mülken, O., & Blumen, A.(2011). Continuous-time quantum walks: Models for coherent transport on complexnetworks. Physics Reports, 502(2), 37-87. [Cited 157 times] [Goutsias2013] Goutsias, J., &Jenkinson, G. (2013). Markovian dynamics on complex reactionnetworks. Physics Reports, 529(2), 199-264. [Cited 61 times] [Pastor2015] Pastor-Satorras, R., Castellano, C., VanMieghem, P., & Vespignani, A. (2015). Epidemic processes in complexnetworks. Reviews of Modern Physics, 87(3), 925. [Cited 484 times] [Rodrigues2016] Rodrigues, F. A.,Peron, T. K. D., Ji, P., & Kurths, J. (2016). The Kuramoto model in complexnetworks. Physics Reports, 610, 1-98. [Cited 80 times] [Boccaletti2016] Boccaletti, S.,Almendral, J. A., Guan, S., Leyva, I., Liu, Z., Sendiña-Nadal, I., Wang, Z.& Zou, Y. (2016). Explosive transitions in complex networks’ structure anddynamics: Percolation and synchronization. Physics Reports, 660,1-94. [Cited 9times] (4) 具有不同组织方式的特殊网络(空间、时间、多层等等) [Barthélemy2011] Barthélemy, M. (2011). Spatialnetworks. Physics Reports, 499(1), 1-101. [Cited 1062 times] [Holme2012] Holme, P., & Saramäki, J. (2012).Temporal networks. Physics Reports, 519(3), 97-125. [Cited 994 times] [Gao2012] Gao, J., Buldyrev, S. V., Stanley, H.E., & Havlin, S. (2012). Networks formed from interdependent networks. Nature Physics, 8(1), 40. [Cited 616 times] [Malliaros2013] Malliaros, F. D.,& Vazirgiannis, M. (2013). Clustering and community detection in directednetworks: A survey. Physics Reports, 533(4), 95-142. [Cited 198 times] [Boccaletti2014] Boccaletti, S.,Bianconi, G., Criado, R., Del Genio, C. I., Gómez-Gardenes, J., Romance, M., Sendiña-Nadal, I., Wang, Z. & Zanin, M. (2014). Thestructure and dynamics of multilayer networks. PhysicsReports, 544(1), 1-122. [Cited 826 times] (5) 网络应用(包括在各个领域的垂直应用) [Barabasi2004] Barabasi, A. L., & Oltvai,Z. N. (2004). Network biology: understanding the cell's functionalorganization. Nature Reviews Genetics, 5(2), 101. [Cited 6018 times] [Borgatt2009] Borgatti, S. P., Mehra, A.,Brass, D. J., & Labianca, G. (2009). Network analysis in the socialsciences. Science, 323(5916), 892-895 [Cited 2098 times] [Costa2011] Costa, L. D. F., Oliveira Jr, O.N., Travieso, G., Rodrigues, F. A., Villas Boas, P. R., Antiqueira, L., Viana,M. P. & Correa Rocha, L. E. (2011). Analyzing and modeling real-worldphenomena with complex networks: a survey of applications. Advances in Physics, 60(3), 329-412. [Cited 395 times] [Lu2012] Lü, L., Medo, M., Yeung,C. H., Zhang, Y. C., Zhang, Z. K., & Zhou, T. (2012). Recommendersystems. Physics Reports, 519(1), 1-49. [Cited 512 times] (6) 网络信息挖掘(包括结构识别、预测、排序等) [Fortunato2010] Fortunato, S. (2010). Communitydetection in graphs. PhysicsReports, 486(3), 75-174.[Cited 5625times] [Lu2011] Lü, L., & Zhou, T.(2011). Link prediction in complex networks: A survey. Physica A, 390(6),1150-1170. [Cited 1037 times] [Ermann2015] Ermann, L., Frahm, K.M., & Shepelyansky, D. L. (2015). Google matrix analysis of directednetworks. Reviews of Modern Physics, 87(4), 1261. [Cited 38 times] [Zanin2016] Zanin, M., Papo, D., Sousa, P. A.,Menasalvas, E., Nicchi, A., Kubik, E., & Boccaletti, S. (2016). Combiningcomplex networks and data mining: why and how. Physics Reports,635, 1-44. [Cited 17 times] [Lu2016] Lü, L., Chen, D., Ren, X. L., Zhang, Q. M., Zhang, Y. C.,& Zhou, T. (2016). Vital nodes identification in complex networks.Physics Reports,650, 1-63. [Cited 48 times] [Zhang2016] Zhang, Z. K., Liu, C., Zhan, X. X.,Lu, X., Zhang, C. X., & Zhang, Y. C. (2016). Dynamics of informationdiffusion and its applications on complex networks. Physics Reports,651, 1-34. [Cited 10 times] [Fortunato2016] Fortunato, S., & Hric, D. (2016). Community detectionin networks: A user guide. Physics Reports, 659, 1-44. [Cited 67 times] [Liao2017] Liao, H., Mariani, M. S., Medo, M.,Zhang, Y. C., & Zhou, M. Y. (2017). Ranking in evolving complex networks. PhysicsReports, 689, 1-54. [Cited 0 times] [Nguyen2017] Nguyen, H. C., Zecchina, R., &Berg, J. (2017). Inverse statistical problems: from the inverse Ising problemto data science. Advances in Physics (in press).[Cited 5times]

有些分类也不一定没有重叠区,比如说有些网络特征是通过动力学呈现的。又比如社团结构是属于网络结构特征的,但是社团挖掘作为一种特殊的数据挖掘算法,更接近网络信息挖掘。再比如Dorogovtsev在2008年的那篇RMP,绝大部分都是在说动力学临界性,但是又有一些结构的内容,所以放两个类都有道理。有一些关联很强的综述,例如Clauset等人关于Power law的实证研究,因为不是从网络出发,所以没有选入。实际上各个分类之间都有公共区域,分到哪里不分到哪里,也没有不容置疑的边界。权且如此吧!希望对大家有用,谢谢关注。