R語言學習資源匯總(分學科)

2021-03-02 大科研小分享

作者:葉旭霄

來源:大科研小分享(Ai_Fen_Xiang2020)

R作為一個統計軟體,相較於經典統計學軟體如SAS,SPSS,STATA等等有一定的差別,在犧牲界面操作(滑鼠點點點)的同時結合了一些計算機程式語言的特點,更像是一門專為統計學家量身定製的程式語言,且由於歷史悠久、開源等特點,不少學術界人士會選擇自行開發一個R包作為其學術產出。可以說整個數據科學領域R和Python各佔半壁江山,R精於學術界,而Python活躍於工業界。

作為一個學術小白,學習R不僅僅可以優化自身數據處理功力,大批量、可重複地完成許多EXCEL無法實現的功能,也可以打開新的學術領域,運用前人編寫的包輕鬆重複數據計算操作,甚至是編寫自己的包來方便流程化操作,甚至進行發表和吸引獵頭。

首先我們將R的用戶分為以下三種:

https://mirrors.tuna.tsinghua.edu.cn/CRAN/https://rstudio.com/products/rstudio/download/#download之後首推R的數據處理與作圖工具dplyr和ggplot2,這兩者都在Rstudio首席科學家Hadley Wickham開發數據科學框架tidyverse之中,tidyverse安裝方法為:

options(repos=structure(c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")))
install.packages('tidyverse')

前面一行為更改默認鏡像地址為清華的R鏡像增加下載速度,後面一行為安裝tidyverse包,該軟體包有一個專門電子書教程R for Data Sciencehttps://blog.csdn.net/weixin_38423453?t=1原書第3和5章分別介紹了ggplot2和dplyr兩個軟體包的應用方法,包括如何作圖和對數據進行篩選計算如:

ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, fill = clarity), position = "dodge")

以及dplyr包的filter、arrange、select、mutate、summary,分別用於篩選特定的行、排序、篩選列、變換列、計算統計量。建議初學者先從這兩章開始學習。第二個常用資源也就是百度,比如我想要構思畫一個三維曲面圖,直接百度會提供我們現成的代碼,對於各個函數有什麼不懂的可以直接?+函數名例如:rstudio右下角會直接出現該函數的文檔和案例,學習過其他程式語言的同學應該知道,這真的是方便的不能再方便了。如果百度資源不夠用,可以嘗試Google,StackOverFlow,Github等。
由於大家一般都在學校學過R相關課程和理論,在做項目時首推以上資源和Advanced R電子書很多時候大家需要自行開發軟體包推薦使用R Packages電子書這裡就需要給大家介紹一個專門的R教學分享平臺Bookdown其次還推薦一些老師或者學生的個人博客和名校資源比如新國立教授Alex Cook的個人公開博客http://blog.nus.edu.sg/alexcook/其中他提供了貝葉斯統計、高級生物統計等系列課程的課件。由於他願意將自己的課件公開吸引了不少學生去申請他的PhD,導致他現在學生太多,學校要求他必須畢業一部分否則不準再招新的學生,估計大家有想報他的博士得等到2023年以後了。https://shiny.rstudio.com/用於進行在線互動數據分析,非常非常的酷炫,這裡給大家提供一個COVID-19的全球數據分析平臺樣板https://shiny.rstudio.com/gallery/covid19-tracker.html這種網頁平臺只用學習shiny包的使用,無需HTML、CSS、Javascript等知識即可搭建網頁平臺,可以之間發布在R官方的shinyapp.io或是租一個個人伺服器搭建shinyserver,過程實在簡單,建議學習和嘗試。大家主要就是學習各類算法包的使用,畢竟我們都是站在巨人的肩膀上,例如常見的e1071包支持向量機,randomForest包隨機森林等等。這裡給大家推薦以下rstudio官方的一些接口資料如TensorFlow(https://tensorflow.rstudio.com/)和Spark(https://spark.rstudio.com/)總的來說R不光是一門統計程式語言,更是一個學術分享平臺,很多前人的科研成果可以直接通過調用他們的軟體包進行使用和結果重現,希望有更多的學子能感悟其中的奧妙。

如果我的內容對你有幫助歡迎關注轉發

相關焦點

  • 獨家 | 手把手教你學習R語言(附資源連結)
    本文為帶大家了解R語言以及分段式的步驟教程!人們學習R語言時普遍存在缺乏系統學習方法的問題。學習者不知道從哪開始,如何進行,選擇什麼學習資源。雖然網絡上有許多不錯的免費學習資源,然而它們多過了頭,反而會讓人挑花了眼。為了構建R語言學習方法,我們在Vidhya和DataCamp中選一組綜合資源,幫您從頭學習R語言。
  • 超級乾貨 :手把手教你學習R語言(附資源連結)
    本文為帶大家了解R語言以及分段式的步驟教程!人們學習R語言時普遍存在缺乏系統學習方法的問題。學習者不知道從哪開始,如何進行,選擇什麼學習資源。雖然網絡上有許多不錯的免費學習資源,然而它們多過了頭,反而會讓人挑花了眼。為了構建R語言學習方法,我們在Vidhya和DataCamp中選一組綜合資源,幫您從頭學習R語言。
  • Tidy時代R語言學習的一些ABC
    新年的第一個計劃,寫一個關於R語言數據處理和操作的教程,突出tidyverse出現之後的新方法。下面這篇小文章,給出了一個tidy時代R語言的入門書單和一些網絡資源。不全面,更不權威,就作為這個新教程系列的參考資料吧。
  • R語言做深度學習
    如何用R語言做深度學習?我帶著這個問題,開始了我的學習與實踐。閱讀本文,你可以獲得:R語言做深度學習工作環境創建R語言快速實現神經網絡模型R語言做深度學習的資料深度學習的應用場景感謝RStudio公司開發的keras包,使得R語言可以利用keras深度學習框架來做深度學習,具有簡潔,易學,好用等特性。什麼是Keras?
  • EEG/ERP學習資源匯總
    公眾號初期是為了記錄自己在EEG/ERP學習的過程與點滴,也陸續推出了系列相關推文,如:在後臺留言區也收到許多關注者詢問有沒有進行EEG/ERP學習的相關資源推薦,但由於時間和個人精力等原因,錯過了48小時內回復的時間,在此深表歉意。也曾有公眾號整理並推送過類似的資源,比如(排名不分先後順序):但每個推文的側重點不一樣。
  • R語言ETL系列:匯總(summarise)
    希望與大家分享學習經驗,推廣並加深R語言在業界的應用。郵箱:huang.tian-yuan@qq.com本章講解如何使用summarise函數完成數據的匯總。在開講之前,我們需要理解,什麼叫做匯總。舉個例子,如果我們現在對學校的學生身高進行了測量,我們需要得到學生的平均身高,那麼我們把所有學生的身高加起來,除以學生的數量,得到身高平均值,這就完成了一個匯總計算。
  • 資源| 最流行的機器學習R語言軟體包是哪些?
    此外,隨著 modelr (https://github.com/hadley/modelr) 中添加了更多的功能,我們也許很快能在此列表中看到 tidy tool。包的細節caret 是一個用於創建機器學習工作流的一般包,並且它已經處於這個排名的首位置。
  • 【R語言學習】R語言概述與軟體下載安裝
    但是R軟體的使用需要編程基礎,因此R語言的學習就顯得尤為重要。科研創新服務平臺擬結合R軟體開展一系列R語言學習教程,旨在幫助科研人員儘快了解R語言在生物醫學領域中的應用,敬請期待!R語言是用於統計分析,圖形表示報告的程式語言和軟體環境。
  • R語言包,掌握這10個就夠了!(含資源下載)
    網上也有大量關於它的教程,學習資源很豐富。gridExtraggplot2的一個缺點就是不能像自帶的graphics基礎包那樣,把幾張圖拼成一組圖。而gridExtra就可以解決這個問題,把ggplot2做出來的漂亮的圖組織到一張大圖裡。
  • R學習用R語言做分析(3)——統計分布
    有留言想學習這方面知識,根據網絡文章及資料整理而成。這一篇的內容是數據描述,就從R中內嵌的一些簡單分布開始吧。
  • 2014最值得學習的語言—必須是R
    R的基因R是統計學家發明的語言,天生具有統計的基因。從我開始學習R語言,我就開始了知識的跨界思考。統計基於概率論,概率論又基於數學,用計算機的方式編程,解決某個領域的實際問題。簡單一算,4個學科知識的交集,決定著我們解決問題的能力。統計的基因,讓R語言與眾不同!2).
  • 我的R語言學習方法
    有朋自遠方來,不亦樂乎,並誠邀入群,以達相互學習和進步之美好心願。通過運營R語言公眾號,認識了各行各業在學習和使用R語言的朋友們。經常會遇到這些問題:我是R新手,要怎樣學習R語言?我要學習R語言,需要學習那些內容?王老師,R語言學習,有什麼書籍或者視頻推薦和分享嗎?等等。
  • 網上英語學習資源匯總
    下面就開始介紹網上英語學習資源匯總。
  • R語言學習筆記之相關性矩陣分析及其可視化
    rcorr(x, type = c(「pearson」,「spearman」))。library(Hmisc)#加載包res2 <- rcorr(as.matrix(mydata))res2#可以用res2$r、res2$P來提取相關係數以及顯著性p-valueres2$r
  • 【R函數學習】R語言時間序列函數整理
    【單位根檢驗】#方法1b=ts(read.csv("6_1.csv",header=T)) x=b[,1]y=b[,1]summary(ur.df(x,type="trend",selectlags="AIC"))#方法2:單位根檢驗更好的函數,加了畫圖的功能 library(fUnitRoots)urdfTest(x)#方法
  • 教程|R語言學習與實踐教程
    我創建了R語言微信群,定位:R語言學習與實踐,要進群的朋友,添加我微信:luqin360。本文的外部連結,請點擊閱讀原文進入到數據人網後,就可以訪問和查看了。在這個內核中,我收集了我所寫的所有R語言教程,按級別劃分。初學者:在這個級別,我假設你沒有編程背景或剛剛開始使用R.
  • 北京語言大學舉辦2018語言資源與智能國際學術研討會
    本屆國際會議為期兩天,分為北京語言大學和LDC兩個分論壇,圍繞「語言資源保護」「領域語言資源建設及應用」「『語言與人工智慧』學科建設及人才培養」 「語言數據與技術的臨床應用」四個議題,200多名國內外相關領域專家學者齊聚一堂,共同研討語言資源和語言智能領域的最新成果及發展趨勢,為人類語言生活和現代社會智能高效發展貢獻智慧。
  • C語言學習資源整理
    總結整理了很多學習資源,有小夥伴問說,為啥沒有C語言的,我一想,對啊,居然沒有總結C語言的,C語言可是大多數人的入門語言啊,所以確實應該總結整理一番
  • R語言學習路線和常用數據挖掘包
  • 快速入門 | 學習 R 語言
    與 C 語言和 Python 不同x[3][1] 4提取子集注意:R 語言中的範圍包含最後一個元素,即使用閉區間 [a, b]!operator) <<-,後續會介紹默認函數R 語言也支持默認參數g <- function(x, y=2, z=T) { return(z)}g(12, z=FALSE)[1] FALSET 和 FALSE 都是布爾類型重要數據結構向量,R 語言中的戰鬥機