2013年的几本R语言图书
这是我的年度R图书的第三贴。本来,我已经不太想从事“书托”这份有前途的职业了。不过想到古人云“一生二,二生三,三生everything”,还是决定努力把这篇迟到的总结写出来。
2013年的R图书出版,从数量说是历年来的一个高峰;从涉及的主题范围来说,也是前所未有的广泛。就出版情况而论,R远远超过其它任何一种数据分析工具。这表明了R在日渐兴盛的数据科学中的地位。关于这一点以后继续讨论,现在先来说书。
本年度最佳R图书当属这一本:An Introduction to Statistical Learning
http://book.douban.com/subject/21706191/
这本书可以说是统计学习领域的名著element of statistical learning(ELS)的R语言版导读版。本书深入浅出的阐述了统计学习的主要方法,突出了ELS的主干框架,同时略去了若干ELS中的理论细节和方法扩展,非常适合初学者提纲挈领地掌握统计学习这个数据科学核心理论的基础。同时,这本书印刷精美、代码翔实,就阅读来说也是一种享受。
下面按照我个人涉猎的领域,概略介绍一些我读过的2013年出版的R图书(包括部分2012年的书),排名不分先后。
1.R for Everyone
http://book.douban.com/subject/20525309/
这本书是标准的R入门书,内容面面俱到,包括R的基础知识到编程、数据操作再到常用统计模型和方法。其中关于数据操作的部分很不错,另外有专章介绍可重复研究,这是很有特色的一个部分。
2.learning R
http://book.douban.com/subject/24392865/
动物书出版社O’reailly的又一本R的入门书。和以前的R in a nutshell , R cookbook,这本书不同偏重于介绍R语言编程和数据操作,一些基本概念讲的比较细。可以作为R语言编程艺术那本经典编程书的先导。
3. Data Mining Applications with R
http://book.douban.com/subject/21967225/
本书可以看作是作者Zhao Yanchang在2012年的R and Data Mining的案例集。本书介绍了15个案例,内容涉及还是很广泛的,我比较喜欢关于足球挖掘的那一章:)
4. Applied Predictive Modeling
http://book.douban.com/subject/21706140/
一本中规中矩的统计学习建模的教材,常用的模型工具和建模思想都讲到了,没有涉猎过多的数学内容,适合应用领域的学习者使用。书中多数内容采用R包caret来解决问题,这个包就是本书作者的作品。
今年类似的图书还有Data Mining and Business Analytics with R
http://book.douban.com/subject/20559947/
Modeling Techniques in Predictive Analytics
http://book.douban.com/subject/23554276/
5. Big Data Analytics with R and Hadoop
http://book.douban.com/subject/25799722/
现在是大数据时代,由于大数据所带来的单机性能问题曾经是困扰R user的一个大难题。但是R和Hadoop的结合有效地解决了这个难题。这本书主要介绍了Hadoop, R+Hadoop的3种方案 , 基于RHadoop的数据分析案例和机器学习算法案例,R的数据库访问接口。案例内容丰富,实战性很强。需要提醒的是,书中关于各种工具的安装占了比较多的篇幅,虽然便于读者模仿操作,读起来还是需要点耐心的。
#关于Rhadoop,国内的开发者张丹做的非常好,不爱看英文书的读者可以参考他的博客:粉丝日志
6. Web Application Development with R Using Shiny
http://book.douban.com/subject/25757936/
每次看到Shiny,我都忍不住要跟上一句“闪闪亮”。Shiny就是这么一个熠熠生辉的R包。
Shiny包由Rstudio公司开发,主要作用建立是基于R的交互网页应用。这是R作为应用开发工具的一个很成功的例子。这本书以案例的方式细致入微地介绍了搭建Shiny应用的过程,实用性很强。
7. Seamless R and C++ Integration with Rcpp
http://book.douban.com/subject/21706146/
采用Rcpp包实现R和C++的无缝连接可以很大的提高R的开发能力。这本书值的R语言的开发者认真阅读。本书作者Eddelbuettel Dirk也是Rcpp包的作者之一,也是R语言的一位殿堂级的开发者。
8. Dynamic Documents with R and Knitr
http://book.douban.com/subject/24654324/
国内的R user们对谢益辉应该是很了解的,开创统计之都网站和中国R用户组会议,对R语言的在中国推广做出了非常巨大的贡献。同时,谢益辉也是多个知名R包的作者,致力于R图形和可重复研究领域。在此,表示我个人诚挚的敬意。
本年另一本关于R可重复研究的书:Reproducible Research with R and RStudio
http://book.douban.com/subject/24137241/
9. An Introduction to Analysis of Financial Data with R
金融数据分析一直是R的一个重要的应用领域。蔡瑞胸老师的金融时间序列分析这本书可以说是这个领域的巅峰之作,但是读起来难度还是有一点的。所以蔡老师特意写了一本R语言案例的导读版,用来介绍金融数据分析的实证工作。本书对应金融时间序列分析第3版的前七章。在2013年末,中文译本也已出版。
Financial Risk Modelling and Portfolio Optimization with R
http://book.douban.com/subject/11543982/
本书关于投资组合优化和风险建模这两个金融实践中应用广泛的领域。数学推导和R代码并重,读者自取所需。
还有一些比较好玩的书:
10. Analyzing Baseball Data with R
http://www.amazon.com/Analyzing-Baseball-Data-Chapman-Hall/dp/1466570229/ref=la_B00GH4T51S_1_1?s=books&ie=UTF8&qid=1396625767&sr=1-1
这是真正的点球成金。
11. Guide to Programming and Algorithms Using R
http://book.douban.com/subject/24807385/
这是把R作为一门编程语言(而非统计软件)讲解编程基础知识的教材。想象一下,如果在大学里作为编程基础的语言是R(而非C或者别的什么),是不是还是挺有意思的。
2013年的R图书出版,从数量说是历年来的一个高峰;从涉及的主题范围来说,也是前所未有的广泛。就出版情况而论,R远远超过其它任何一种数据分析工具。这表明了R在日渐兴盛的数据科学中的地位。关于这一点以后继续讨论,现在先来说书。
本年度最佳R图书当属这一本:An Introduction to Statistical Learning
http://book.douban.com/subject/21706191/
这本书可以说是统计学习领域的名著element of statistical learning(ELS)的R语言版导读版。本书深入浅出的阐述了统计学习的主要方法,突出了ELS的主干框架,同时略去了若干ELS中的理论细节和方法扩展,非常适合初学者提纲挈领地掌握统计学习这个数据科学核心理论的基础。同时,这本书印刷精美、代码翔实,就阅读来说也是一种享受。
下面按照我个人涉猎的领域,概略介绍一些我读过的2013年出版的R图书(包括部分2012年的书),排名不分先后。
1.R for Everyone
http://book.douban.com/subject/20525309/
这本书是标准的R入门书,内容面面俱到,包括R的基础知识到编程、数据操作再到常用统计模型和方法。其中关于数据操作的部分很不错,另外有专章介绍可重复研究,这是很有特色的一个部分。
2.learning R
http://book.douban.com/subject/24392865/
动物书出版社O’reailly的又一本R的入门书。和以前的R in a nutshell , R cookbook,这本书不同偏重于介绍R语言编程和数据操作,一些基本概念讲的比较细。可以作为R语言编程艺术那本经典编程书的先导。
3. Data Mining Applications with R
http://book.douban.com/subject/21967225/
本书可以看作是作者Zhao Yanchang在2012年的R and Data Mining的案例集。本书介绍了15个案例,内容涉及还是很广泛的,我比较喜欢关于足球挖掘的那一章:)
4. Applied Predictive Modeling
http://book.douban.com/subject/21706140/
一本中规中矩的统计学习建模的教材,常用的模型工具和建模思想都讲到了,没有涉猎过多的数学内容,适合应用领域的学习者使用。书中多数内容采用R包caret来解决问题,这个包就是本书作者的作品。
今年类似的图书还有Data Mining and Business Analytics with R
http://book.douban.com/subject/20559947/
Modeling Techniques in Predictive Analytics
http://book.douban.com/subject/23554276/
5. Big Data Analytics with R and Hadoop
http://book.douban.com/subject/25799722/
现在是大数据时代,由于大数据所带来的单机性能问题曾经是困扰R user的一个大难题。但是R和Hadoop的结合有效地解决了这个难题。这本书主要介绍了Hadoop, R+Hadoop的3种方案 , 基于RHadoop的数据分析案例和机器学习算法案例,R的数据库访问接口。案例内容丰富,实战性很强。需要提醒的是,书中关于各种工具的安装占了比较多的篇幅,虽然便于读者模仿操作,读起来还是需要点耐心的。
#关于Rhadoop,国内的开发者张丹做的非常好,不爱看英文书的读者可以参考他的博客:粉丝日志
6. Web Application Development with R Using Shiny
http://book.douban.com/subject/25757936/
每次看到Shiny,我都忍不住要跟上一句“闪闪亮”。Shiny就是这么一个熠熠生辉的R包。
Shiny包由Rstudio公司开发,主要作用建立是基于R的交互网页应用。这是R作为应用开发工具的一个很成功的例子。这本书以案例的方式细致入微地介绍了搭建Shiny应用的过程,实用性很强。
7. Seamless R and C++ Integration with Rcpp
http://book.douban.com/subject/21706146/
采用Rcpp包实现R和C++的无缝连接可以很大的提高R的开发能力。这本书值的R语言的开发者认真阅读。本书作者Eddelbuettel Dirk也是Rcpp包的作者之一,也是R语言的一位殿堂级的开发者。
8. Dynamic Documents with R and Knitr
http://book.douban.com/subject/24654324/
国内的R user们对谢益辉应该是很了解的,开创统计之都网站和中国R用户组会议,对R语言的在中国推广做出了非常巨大的贡献。同时,谢益辉也是多个知名R包的作者,致力于R图形和可重复研究领域。在此,表示我个人诚挚的敬意。
本年另一本关于R可重复研究的书:Reproducible Research with R and RStudio
http://book.douban.com/subject/24137241/
9. An Introduction to Analysis of Financial Data with R
金融数据分析一直是R的一个重要的应用领域。蔡瑞胸老师的金融时间序列分析这本书可以说是这个领域的巅峰之作,但是读起来难度还是有一点的。所以蔡老师特意写了一本R语言案例的导读版,用来介绍金融数据分析的实证工作。本书对应金融时间序列分析第3版的前七章。在2013年末,中文译本也已出版。
Financial Risk Modelling and Portfolio Optimization with R
http://book.douban.com/subject/11543982/
本书关于投资组合优化和风险建模这两个金融实践中应用广泛的领域。数学推导和R代码并重,读者自取所需。
还有一些比较好玩的书:
10. Analyzing Baseball Data with R
http://www.amazon.com/Analyzing-Baseball-Data-Chapman-Hall/dp/1466570229/ref=la_B00GH4T51S_1_1?s=books&ie=UTF8&qid=1396625767&sr=1-1
这是真正的点球成金。
11. Guide to Programming and Algorithms Using R
http://book.douban.com/subject/24807385/
这是把R作为一门编程语言(而非统计软件)讲解编程基础知识的教材。想象一下,如果在大学里作为编程基础的语言是R(而非C或者别的什么),是不是还是挺有意思的。
果断买了An Introduction to Statistical Learning 正版书。
推荐和 ISL 配套的在线课程:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/
我很不低调地说一句,我上了三个quarter的现场版,讲的比较乏味,连Friedman本人都说上个quarter教室人都快没了,所以还是多花时间看书看paper吧。Hastie讲课很有趣。
与R渐行渐远。有时候感觉很恍惚
曾经拥有:)
前两天和在国外的同学聊,她们才是走的统计之路啊。Python神马的都搞起了
蔡瑞胸老师新作是不是那本金融数据分析导论啊,他的两本书都买了,确实比较好,但是国内用R的较少,前天去面试人家用的是MATLAB,当然MATLAB也会,但是觉得R更加有前途些,但是就是不够友好,用MATLAB做神经网络也方便些
工具的使用有历史原因,几年后的情况可能有所不同。另外,各种主流的软件工具各有所长,取长补短就好了
谢谢分享,我也想来推荐一下再coursera上的一门data science公开课,霍普金斯开大学生物统计系的金牌课程,可以入门r语言~
李老师,有r的推荐视频吗
ISL断断续续看了半年还没看完。。
> 我来回应