【經驗分享】R語言書籍的學習路線圖

2021-02-23 R語言中文網

請點擊上方藍字關注我們:)

作者簡介

鄧一碩,《R語言書籍學習路線圖》作者、《R金融時間序列分析常見問題集》整理者、《R in a nutshell》、《R Graphics cookbook》等書的譯者;中國R語言會議理事、COS沙龍聯合發起人;「統計之都」理事會成員、版主;擁有6年以上的R語言使用經驗,擅長於數據挖掘、計量經濟學和金融投資分析。

現在對R感興趣的人越來越多,很多人都想快速地掌握R。然而,由於目前大部分高校都沒有開設R課程,這就導致很多人不知道如何著手學習R。

對於初學R,最常見的方式是看看百度上的簡介,遇到不會的地方,就跑到論壇上吼一嗓子,然後欣欣然(得到解答)悲傷(未得到解答)地離去,一直到遇到下一個問題再回來。當然,這不是最好的學習方式,最好的方式是看書。目前,市面上介紹R語言的書籍已經很多,中文英文都有。那麼,眾多書籍中,一個菜鳥應該從哪一本入門呢?入門之後如何才能把自己練就成某個方面的高手呢?相信這是很多人心中的疑問。有這種疑問的人有福了,因為筆者將根據自己的經歷總結一下R書籍的學習路線圖以使大家少走些彎路。

本文分為6個部分,分別介紹初級入門、高級入門、繪圖與可視化、計量經濟學、時間序列分析和金融等。

《An Introduction to R》,這是R官網公布的入門小冊子,其有中文版,由丁國徽翻譯的,譯名是《R導論》。《R4Beginners》,這本小冊子有中文版應該叫《R入門》。除此之外,還可以去讀劉思喆的《153分鐘學會R》,對R有一個感性的認識,這個冊子收集了R初學者提問頻率最高的153個問題。為什麼叫153分鐘呢?因為最初作者寫了153個問題,閱讀一個問題花費1分鐘時間,全局下來也就是153分鐘了。有了這些基礎之後,要去讀一些經典書籍比較全面的入門書籍,比如《統計建模與R軟體》,國外還有《R Cookbook》和《R in action》(中文翻譯為《R實戰》)等。

最後隆重推薦《R in a Nutshell》,直譯是「果殼裡面的R」。當然,這是開玩笑的,」in a Nutshell「是英文俚語,意思是「簡單的說」。很多技術類書籍都有Nutshell版本,這類書籍一般翻譯為」**核心技術手冊「,目前,我們已經譯好這本書的中文版,預計今年會面世。這本書很不錯,深度和廣度都超越同類書籍,大家可以從現在開始期待,並廣而告知一下!

讀了上述書籍之後,你就可以去高級入門階段了。這時候要讀的書有兩本很經典的。《Statistics with R》和《The R book》以及《Modern Statistics with S》。之所以說這三本書高級,是因為這三本書已經不再限於R了,而是結合了數據分析的各種常見方法來寫就的,比較系統的介紹了R在線性回歸、方差分析、多元統計、R繪圖、時間序列分析、數據挖掘等各方面的內容。看完之後你會發現,哇,原來R能做的事情這麼多,而且做起來是那麼簡潔。

讀到這裡已經差不多了,剩下的估計就是你要專門攻讀的某個方面內容了。下面大致說一說。

亞裡斯多德說,「較其他感覺而言,人類更喜歡觀看」。因此,繪圖和可視化得到很多人的關注和重視。那麼,如何學習R畫圖和數據可視化呢?再簡單些,如何畫直方圖?如何往直方圖上添加密度曲線呢?我想讀完下面這幾本書你就大致會明白了。

首先,畫圖入門可以讀《R Graphics》,個人認為這本是比較經典的,全面介紹了R中繪圖系統。該書對應的有一個網站,google之就可以了。更深入的可以讀《Lattice:Multivariate Data Visualization with R》,Lattice是R中針對多元數據可視化而開發的一套繪圖系統。

上面這些都是比較普通的。對應的有比較文藝和優雅的ggplot2系統,看《ggplot2:Elegant Graphics for Data Analysis》,中文版是《ggplot2:數據分析與圖形藝術》。這本書理論性較強,實戰比較弱。與之互補的要推薦《The R Graphics cookbook》,中文對應的是《R圖形可視化手冊》,譯者是鄧一碩、魏太雲和肖楠,這本書詳細列舉了所有常見數據分析圖形的繪製方法,適合做工具書。

再有就是交互式圖形的書了,著名的交互系統是ggobi,這個我已經喜歡多年,關於ggobi的書有《Interactive and Dynamic Graphics for Data Analysis With R and GGobi》,不過,也只是適宜入門,更多更全面的還是去ggobi的主頁吧,上面有各種資料以及包的更新信息。

此外,R還推出了shiny和rChart以及rechart等包,可以將圖形繪製到網頁上,這個可以說是未來的主流,不得不關注。

特別推薦一下,中文版繪圖書籍中謝益輝的《現代統計圖形》和我們翻譯的《R圖形可視化手冊》。

關於計量經濟學,首先推薦一本很薄的小冊子:《Econometrics In R》,做入門用。然後,是《Applied Econometrics with R》,該書對應的R包是AER包,可以安裝之後配合使用,效果甚佳。計量經濟學中很大一部分是關於時間序列分析的,這一塊內容在下面的地方說。

時間序列書籍的書籍分兩類,一種是比較普適的書籍,典型的代表是:《Time Series Analysis and Its Applications :with R examples》。該書介紹了各種時間序列分析的經典方法及實現各種經典方法的R代碼,該書有中文版。如果不想買的話,建議去作者主頁直接下載,英文版讀起來很簡單。時間序列分析中有一大塊兒是關於金融時間序列分析的。這方面比較流行的書有兩本《Analysis of financial time series》,這本書的最初是用的S-plus代碼,不過新版已經以R代碼為主了。這本書適合有時間序列分析基礎和金融基礎的人來看,因為書中關於時間序列分析的理論以及各種金融知識講解的不是特別清楚,將極值理論計算VaR的部分就比較難看懂。

另外一個比較有意思的是Rmetrics推出的《TimeSeries FAQ》,這本書是金融時間序列入門的東西,講的很基礎,但是很難懂。對應的中文版有《金融時間序列分析常見問題集》。經濟領域的時間序列有一種特殊的情況叫協整,很多人很關注這方面的理論,關心這個的可以看《Analysis of Integrated and Cointegrated Time Series with R》。最後,比較高級的一本書是關於小波分析的,看《Wavelet Methods in Statistics with R》。附加一點,關於時間序列聚類的書籍目前比較少見,是一個處女地,有志之士可以開墾。

金融的領域很廣泛,如果是大金融的話,保險也要被納入此間。用R做金融更多地需要掌握的是金融知識,只會數據分析技術意義寥寥。我覺得這些書對於懂金融、不同數據分析技術的人比較有用,只懂數據分析技術而不動金融知識的人看起來肯定如霧裡看花,甚至有人會覺得金融分析比較低級。這方面比較經典的書籍有:《Advanced Topics in Analysis of Economic and Financial Data Using R》以及《Modelling Financial Time Series With S-plus》。金融產品定價之類的常常要用到隨機微分方程,有一本叫《Simulation Inference Stochastic Differential Equations:with R examples》的書是關於這方面的內容的,有實例,內容詳實。此外,風險度量與管理類比較經典的有《Simulation Techniques in Financial Risk Management》、《Modern Actuarial Risk Theory Using R》和《Quantitative Risk Management:Concepts, Techniques and Tools》。投資組合分析類和期權定價類可以分別看《Portfolio Optimization with R》和《Option Pricing and Estimation of Financial Models with R》。

這方面的書有《Data Mining with R:learing with case studies》,《Machine learning for hacks》以及不過《Data Mining with Rattle and R》,書中主要講了基於Rattle包進行數據挖掘的操作方法,這本書是罕有的全流程數據挖掘工具書,書中詳細講解了從導入數據、清洗數據、數據重整、數據可視化、模型構建、變量選擇、模型評價等各個數據挖掘環節,是學習數據挖掘的不二之選。當然,個人比較喜歡Rattle,這本書對應的中文版是《Rattle:R中的數據挖掘GUI》,是由鄧一碩、郝智恆、譚麗等翻譯的。除了Rattle,Rweka做數據挖掘也很棒。R中數據挖掘方面的包已經足夠多了,參考包中的幫助文檔就足夠了。

編者註:

此文由鄧一碩2012年發表於個人博客「格物堂」,為尊重原作者版權,R語言中文網全文轉載,文中部分信息未做更新。

R語言中文網(微信ID:Rchinanet)前不久曾推薦了部分較新的R經典書籍,點擊「閱讀原文」訪問下載~

相關焦點

  • 新手教程:如何學習R語言
    其實相對於常見的程式語言,R語言還是非常容易上手,並不需要很多年的編程經驗。而且可以在數據分析領域大展身手。
  • 我的R語言學習方法
    有朋自遠方來,不亦樂乎,並誠邀入群,以達相互學習和進步之美好心願。通過運營R語言公眾號,認識了各行各業在學習和使用R語言的朋友們。經常會遇到這些問題:我是R新手,要怎樣學習R語言?我要學習R語言,需要學習那些內容?王老師,R語言學習,有什麼書籍或者視頻推薦和分享嗎?等等。
  • 零基礎學習R語言數據分析
    前言我當初學習R的時候在網上搜到一則流傳很廣的R語言學習路線圖(R語言學習由淺入深路線圖),我在微信圈
  • R語言做深度學習
    閱讀本文,你可以獲得:R語言做深度學習工作環境創建R語言快速實現神經網絡模型R語言做深度學習的資料深度學習的應用場景感謝RStudio公司開發的keras包,使得R語言可以利用keras深度學習框架來做深度學習,具有簡潔,易學,好用等特性。什麼是Keras?
  • R語言學習路線和常用數據挖掘包
    對於初學R語言的人,最常見的方式是:遇到不會的地方,就跑到論壇上吼一嗓子,然後欣然or悲傷的離去,一直到遇到下一個問題再回來。那麼,眾多書籍中,一個生手應該從哪一本著手呢?入門之後如何才能把自己練就成某個方面的高手呢?相信這是很多人心中的疑問。有這種疑問的人有福了,因為筆者將根據自己的經歷總結一下R語言書籍的學習路線圖以使Ruser少走些彎路。本文分為6個部分,分別介紹初級入門,高級入門,繪圖與可視化,計量經濟學,時間序列分析,金融等。
  • 2018年最新Python學習路線圖(內含大綱+視頻+工具+書籍+面試)
    本學習路線圖不僅含有清晰的學習路線,職業成長路徑,而且放上Python教研部公布的最新視頻資源(且按照學習流程進行順序排列),更是提供了學習過程中會用到的軟體,手冊,源碼,面試題錦集等多個系列。作為學姐,很驕傲能給廣大自學者提供一個這樣優秀的學習資源。大家覺得有用,拿去就是,不用謝。
  • R語言學習由淺入深路線
    現在對R感興趣的人越來越多,很多人都想快速的掌握R語言,然而,由於目前大部分高校都沒有開設R語言課程,這就導致很多人不知道如何著手學習R語言。 對於初學R語言的人,最常見的方式是:遇到不會的地方,就跑到論壇上吼一嗓子,然後欣然or悲傷的離去,一直到遇到下一個問題再回來。當然,這不是最好的學習方式,最好的方式是——看書。目前,市面上介紹R語言的書籍很多,中文英文都有。 那麼,眾多書籍中,一個生手應該從哪一本著手呢?入門之後如何才能把自己練就成某個方面的高手呢?相信這是很多人心中的疑問。
  • 如何學習好R語言?【全套R語音書籍+視頻下載】
    包括了閱讀經典的教材、代碼、論文、學習公開課。 - 通過牛人來學習。 包括同行的聚會、討論、大牛的博客、微博、twitter、RSS。 - 通過練習來學習。 包括代碼練習題、參加kaggle比賽、解決實際工作中的難題。 - 通過分享來學習。 包括自己寫筆記、寫博客、寫書、翻譯書,和同伴分享交流、培訓新人。# 全套R語音書籍下載。關注公眾號後,回覆:R語言
  • 零基礎入門R語言數據分析指南
    前言我當初學習R的時候在網上搜到一則流傳很廣的R語言學習路線圖(R語言學習由淺入深路線圖),我在微信圈
  • 2020Python+人工智慧學習路線圖,內附完整自學路線+視頻+工具經驗+面試篇
    一、Python學習路線圖—流程篇Python學習路線圖—流程篇:Python 培訓後職業發展路徑—經驗篇強烈推薦Python零基礎的同學看看經驗篇-學前諮詢7個你現在應該學習Python的理由關注「黑馬程式設計師視頻庫」,後臺回復「Python學習路線」免費獲取。
  • 重磅:兒童英語啟蒙路線圖
    你需要一套系統且可操的英語學習啟蒙路線圖。A爸讀過三位在兒童英語啟蒙領域比較有影響力的作者,綜合分析了他們的理論和實踐經驗,總結了他們給出的路線圖,寫下此文分享給大家。兒童階段的英語學習應更注重自然的「習得」,通過大量接觸和使用,潛移默化地學會一種語言。她特別強調聽的重要性。她兒子每天聽1小時英語有聲書(周末4小時),四年循序漸進聽了800本小說,六年聽完1000本。
  • 書籍分享|零基礎學習C語言(附電子書)
    Hello,我是牙兒今天給大家推薦幾本適合小白的C語言書籍一起來看看都有哪些吧~C primer
  • C語言入門學習和書籍推薦
    1、C語言適合當第一門程式語言學習①、C語言語法相對簡單,但又比較完整和嚴謹,包含該有的各種元素。學完C語言語法,要學習其它程式語言就很容易了。②、C語言接近底層,可以了解內存和計算機的基本原理。③、許多基礎課程比如算法與數據結構教材都是以C語言為例子的,特別是中國版的書籍。
  • R書籍|R for Data Analysis in easy steps
    前言我推出【R書籍】這個專欄,給大家分享一系列
  • Linux、C/C++學習路線圖、C語言學習路線
    、學習中,實踐出真知     今天就是本次20篇專欄文章的最後4篇了,小C將繼續為你們介紹IT技術的學習路徑圖~經過5天學習,是否掌握了系統化學習的理論基礎並且在實戰中也有了經驗呢?      對於學習Linux,前人已經鋪好了無數的基石,有無數可以參考學習的資料,而且內核也是開源的,必要的時候可以查看其代碼,甚至已經有非常多幫你分析內核代碼的書籍資料,甚至還有很多中文資料。所以,不論你打算要學習到如何的程度,已經有無數的資料可以參考,也有極為龐大的社區可以依靠。
  • C語言學習推薦書籍
    ,軟體架構則需要閱讀很多優秀的代碼來培養,而常見的錯誤與良好的風格則可以借鑑前人的經驗。以下介紹一些書籍,希望它們可以使用你的代碼更加優美。《系統程式設計師成長計劃》李先靜,CSDN開源專家,有著十年Linux開發經驗、五年手機開發經驗。
  • 2018年新版H5+全棧學習路線圖(內含大綱+視頻+工具+書籍+面試)
    傳智播客黑馬程式設計師作為一個IT學習平臺,歷經12年的成長,免費分享視頻教程長達10萬餘小時,累計下載量超3000萬次,受益人數達千萬。
  • 學習C語言必看的最經典書籍
    、提高、開發、拓展全攻略》  這本比較好的c語言學習書籍從實際應用入手,以實驗過程和實驗現象為主導,循序漸進地講述51單片機c語言編程方法以及51單片機的硬體結構和功能應用。本學習c語言必看的最經典書籍內容豐富,實用性強,書中大部分內容均來自科研工作及教學實踐,許多c語言代碼可以直接應用到工程項目中。本書配套光碟提供13講近30學時的教學視頻和本書實例代碼,可使讀者更快更好地掌握單片機知識和應用技能。這本比較好的c語言學習書籍作者還可提供與本書配套的單片機實驗板。
  • R語言學習筆記之相關性矩陣分析及其可視化
    rcorr(x, type = c(「pearson」,「spearman」))。library(Hmisc)#加載包res2 <- rcorr(as.matrix(mydata))res2#可以用res2$r、res2$P來提取相關係數以及顯著性p-valueres2$r
  • 【R書籍推薦】《愛上統計學》
    朋友們,大家好。小編給大家薦書了,書名是《愛上統計學》。 我為什麼要推薦這本書呢?主要原因有這些。原因一:R語言最初是統計學教授設計和開發出來,R語言適合做統計分析,因而,掌握必要的統計學知識對於學習和實戰R語言是大有必要的,並且很多數據分析方法、數據挖掘方法和機器學習方法等都會涉及到統計學裡面的概念和原理。