前幾天去新疆培訓,製作了R語言的基礎教程,在翻閱資料時,看到了知乎張敬信關於R學習的觀點,很是贊同。
張敬信老師寫了一本書《R語言編程--基於tidyverse》,網址:https://github.com/zhjx19/introR
下面幾段是書中的話:
❝國內的R語言博客、教材大多數都很落後。初學R語言的同學,還是在沿用那些過時的、晦澀的R語法,對R的印象還是停留在5年前:「語法晦澀難懂、速度慢,做統計分析和繪圖還行,機器學習只有單獨算法的包,做不了深度學習、大數據、工業部署……」
❞❝將整個數據科學流程於一身,而且是以「現代的」、「優雅的」方式,以管道式、泛函式編程技術實現。不誇張的說,tidyverse操作數據比pandas更好用、易用!再加上可視化本來就是R所擅長,可以說R在數據科學領域好於Python。這種整潔、優雅的tidy-流,帶動了R語言在很多研究領域湧現了一系列tidy-風格的包。在機器學習領域,曾經的R靠單打獨鬥的包,如今也在從整體技術上迎頭趕上python,出現了tidymodels包,以及真正最新理念、最新技術、最新一代的機器學習mlr3verse包,它比sklearn還先進,開創性的Graph-流模式(圖/網絡流,區別於常用的線性流。)
❞看來下面兩個包需要填坑了:
2. 數據分析的流程tidyverse包提供了全套的解決方案,結合其它常用的包,用起來得心應手。
報表3. 學習資料電子書還是推薦html的格式,方便copy代碼重演結果,如果是英文版的還方便翻譯(網頁翻譯)查看。這裡推薦幾本書,學習R語言,就應該看最好的教程,學最先進的思想,而不是看陳腐的資料,學過時的方法!!!
第一本:《數據科學中的R語言》https://bookdown.org/wangminjie/R4DS/
「書的特點:」
這本書本來就是研究生的教材,作者王敏傑老師,是四川師範大學的老師,書中內容十分豐富,分享了許多技巧。我也在不斷的操作--實踐--理解中。
第二本:《R語言編程--基於tidyverse》:https://github.com/zhjx19/introR/blob/master/pdfs/R%E8%AF%AD%E8%A8%80%E7%BC%96%E7%A8%8B%EF%BC%9A%E5%9F%BA%E4%BA%8Etidyverse_%E8%87%B3%E7%AC%AC3%E7%AB%A0.pdf
「書的特點:」
作者張敬信老師,是哈爾濱商業大學的老師,書中將編程和數學思想進行對比,很有啟發性。本書還沒有完成,現在釋放了一部分章節,但是很值得閱讀。
第三本:《R語言進階筆記》:https://dengfei2013.gitee.io/r-language-advanced/
「書的特點:」
這本書是我的學習筆記,我在學習tidyverse相關函數時,基於自己的理解,用農業中常用的數據結構進行了操作學習,內容比較淺,後面我也會不斷更新,歡迎大家閱讀。
第四本:北京大學李東風老師的《R語言教程》,https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html
好像現在網站掛了。後面能登陸了我再向大家推薦。
第五本:《R for Data Science》:https://r4ds.had.co.nz/
這本書也是Tidyverse,ggplot2,dplyr作者Hadley Wickham所寫的書。建議大家看英文版,裡面的語法都是最新的,更新也是最快的。可以用網頁翻譯作為輔助閱讀,閱讀體驗很好。
4. 學用結合效果最好很多知識都是畢業後出現的,所以工作中學習新知識是一個常態,能把項目和學習結合起來是學習效率最高的。
當然,把新知識迅速利用到工作中,是很有成就感的。
活到老,學到老。
❝歡迎關注我的公眾號:育種數據分析之放飛自我。主要分享R語言,Python,育種數據分析,生物統計,數量遺傳學,混合線性模型,GWAS和GS相關的知識。
❞閱讀原文,可以查看電子書連結,電腦端閱讀體驗更佳!
R語言中如何寫入xlsx的不同sheet表格
誰的青春不迷茫,農學研究生的十字路口
經驗貼 | 我是如何入門數據分析的