R語言包,掌握這10個就夠了!(含資源下載)

2021-02-14 解螺旋

一、數據可視化


ggplot2

ggplot2是最常用、最受用戶們喜愛的作圖工具包了,被譽為數據作圖的標杆。它做出的圖不僅漂亮,而且可以涵蓋很多複雜的信息。網上也有大量關於它的教程,學習資源很豐富。

gridExtra

ggplot2的一個缺點就是不能像自帶的graphics基礎包那樣,把幾張圖拼成一組圖。而gridExtra就可以解決這個問題,把ggplot2做出來的漂亮的圖組織到一張大圖裡。

lattice

lattice經常被拿來和ggplot2相提並論,這兩者也是選擇困難戶的糾結點。ggplot2做出來的圖更漂亮,但它入門難啊~lattice則適合入門選手,作圖速度較快,還能進行三維繪圖,這是ggplot2不具備的。

二、統計分析


lme4 (或者nlme)

如果你常做一些複雜的數據,實驗分了好幾個層,有好多亞組,亞組下面還有亞亞組,比如要做好幾種細胞,檢測好幾個指標,每個指標還有不同的觀察時間點……此時lme4包就可以比較輕鬆地把這些數據組織起來。nlme也一樣,選一個就好。

forecast

比較適合分析時間序列數據。

zoo

forecast裡有很多好用的內置函數,但有時候還需要更簡單易用的計算移動平均、移動標準差的函數,這時zoo會是個很好的補充。

spatstat

空間分析神器,比如某種疾病發病率在地理空間上的分布特徵等等。

三、數據整理


dplyr

dplyr可以很好地把數據隨意分解、整合。這個包可能也比較難上手,但熟悉之後,就像老司機開車一樣形成本能。

四、生物信息學


Bioconductor

對於做基因組或晶片分析、陣列、基因流等等的小夥伴,Bioconductor是個好選擇。它還有個很活躍的用戶社區,可獲得及時反饋,每年更新2次,還有豐富的學習資源,比如http://www.bioconductor.org/help/course-materials/這裡的一系列教程。

五、展示


knitr

雖然一開始說到的數據可示化也是展示的一種,但這裡要說的是,通過更豐富的方式來展示其他多種內容。除了數據分析成果,還有分析過程中各種代碼、運行過程、文本說明等,都可以通過knitr生成網頁、PDF、幻燈片等形式展示出來。比較適用於教學、報告等場合。

shiny

shiny包也像knitr一樣可以做出漂高的網頁,此外還可以快速搭建動態的交互網頁App。它一大優勢就是不需要學習其他網頁程式語言(CSS、JS等),純靠R。

stringr

字符串處理神器。可在作圖、網頁編輯、數據清洗等操作中起到很好的輔助作用,對字符串進行拼接、匹配、變換等。

以上都是一些比較出名、經常用到的包,尤其是ggplot2、lattice和dplyr,可以先裝上以備不時之需。但偶爾還會要用到一些函數,不在你安裝過的包裡,而且還不知道在哪個包,怎麼辦?就是在Packages選項卡旁邊的Help裡搜索,返回的結果中看到「一串字母::你搜的函數」,前面那串字母就是包的名字啦,比如這個Kest函數就是在spatstat包裡,下載、安裝、載入就可以用了~


參考資料:

My 10 Favorite R Packages and the Cool Things You Can Do with Them

相關焦點

  • 資源| 最流行的機器學習R語言軟體包是哪些?
    一些頂級的軟體包,比如 rpart 和 tree,部署了相同的算法,這與 Python 的 scikit-learn 的一致性和寬度形成對比。但是,如果你喜歡 R 的數據操作能力(就像在 tidyverse 中),那麼你就可以使用這些軟體包做一些功能強大的模型,而不用切換到 python。
  • 獨家 | 手把手教你學習R語言(附資源連結)
    步驟一:配置計算機環境建立R語言學習環境最簡單方法是通過綜合R語言歸檔網絡(CRAN)下載(https://cran.r-project.org/)到您的本地計算機上。除了上述在線資源,您還可以考慮以下優秀資源:CRAN免費教學R語言(https://cran.r-project.org/doc/manuals/R-intro.pdf)。
  • 超級乾貨 :手把手教你學習R語言(附資源連結)
    步驟一:配置計算機環境建立R語言學習環境最簡單方法是通過綜合R語言歸檔網絡(CRAN)下載(https://cran.r-project.org/)到您的本地計算機上。除了上述在線資源,您還可以考慮以下優秀資源:CRAN免費教學R語言(https://cran.r-project.org/doc/manuals/R-intro.pdf)。
  • 自然拼讀之R元音 Bossy R(含資源)
    自然拼讀法是基於字母(字母組合)與其發音的對應規則而產生的,英語中字母有其固定的發音,有的字母只有一個發音,有的字母有多個發音,通過掌握字母發音的規律,可將多數詞拼讀拼寫出來,這也是自然拼讀法的神奇之處。
  • 掌握R語言for循環一文就夠了(認真臉)
    所以,今天就來教大家怎樣掌握R語言的for循環o(^▽^)o首先,你需要一個R,百度"R"就行,點擊有官網標識的網站,進去下載就行如圖可見1到5000是按列填充的,這就是R語言的一個特性,默認優先進行列運算~我現在想要進行for循環了,首先明確我的目的是想計算每一行之間的
  • 數據科學養成記 之 R語言基礎(2)——關於R包
    R作為一種主力的分析語言有著其獨特的優勢:大量的R包可供大家使用,提供方便快捷的數據分析,挖掘。目前有上千個R包(R package)可供大家使用,可從cran-r 下載。這些包提供了橫跨各種領域、數量驚人的新功能,包括分析地理數據、處理蛋白質質譜,甚至是心理測驗分析的功能。
  • 【R語言學習】R語言概述與軟體下載安裝
    因其R包的多樣性而使其應用越來越廣泛,主要包括經濟學、生物醫學、計算機科學、人工智慧等領域。但是R軟體的使用需要編程基礎,因此R語言的學習就顯得尤為重要。科研創新服務平臺擬結合R軟體開展一系列R語言學習教程,旨在幫助科研人員儘快了解R語言在生物醫學領域中的應用,敬請期待!R語言是用於統計分析,圖形表示報告的程式語言和軟體環境。
  • R語言 | 第一講:下載和安裝
    2.R語言有大量現成的命令和軟體包(可以下載),無需進行複雜的編程也可以進行大量生物學統計和繪圖.3.R語言的由來:R語言是從S語言演變而來的.S語言是二十世紀70年代誕生于貝爾實驗室,由Rick Becker,John Chembers,Allan開發.基於S語言開發的軟體Splus,可以方便的編寫函數,建立模型,具有良好的擴展性,取得了巨大成功.
  • R語言做深度學習
    若是您是Python和R的雙面手,閱讀這本書,對於您利用R語言做深度學習也非常有幫助和啟發。什麼是keras包?它是RStudio公司開發一個R包,是Keras深度學習框架的R語言接口,利用這個包,就可以在R平臺上面編寫代碼,使用這個高級的神經網絡API。
  • 機器學習 · R語言包大全(共99個包)
    有很多R語言包都可以實現機器學習相關的思想和方法。我們將這些R包大致分類整理如下:神經網絡與深度學習,Neural Networks and Deep Learning,8個包遞歸劃分,Recursive Partitioning,14個包隨機森林,Random Forests,12個包正則化和收縮法,Regularized and Shrinkage Methods,25個包推進和梯度下降
  • R語言中plyr包
    plyr包則可看作是apply族函數的擴展,使之更容易運用,功能更為強大。  plyr包的主函數是**ply形式的,其中首字母可以是(d、l、a),第二個字母可以是(d、l、a、_),不同的字母表示不同的數據格式,d表示數據框格式,l表示列表,a表示數組,_則表示沒有輸出。第一個字母表示輸入的待處理的數據格式,第二個字母表示輸出的數據格式。
  • R語言學習路線和常用數據挖掘包
    當然,這不是最好的學習方式,最好的方式是——看書。目前,市面上介紹R語言的書籍很多,中文英文都有。那麼,眾多書籍中,一個生手應該從哪一本著手呢?入門之後如何才能把自己練就成某個方面的高手呢?相信這是很多人心中的疑問。有這種疑問的人有福了,因為筆者將根據自己的經歷總結一下R語言書籍的學習路線圖以使Ruser少走些彎路。
  • r語言有什麼優劣勢及R語言的未來發展趨勢_R語言在現實中的應用
    r語言有什麼優劣勢分析 R語言擁有強大的軟體包生態系統與圖表優勢 R語言的優勢主要體現在其軟體包生態系統上。「在這一領域的任何新型研究成果可能都會馬上以R軟體包的形式體現出來。因此從這個角度看,R語言始終站在技術發展的尖端位置,」他表示。「這種接入軟體包還能夠提供良好的途徑,幫助我們利用相對統一的API在R語言環境下實現機器學習研究。」Peng進一步補充稱,目前已經有眾多主流機器學習算法以R語言作為實現手段。
  • R 語言10分鐘入門
    (6) R語言是徹底面向對象的統計程式語言。 (7) R語言和其它程式語言、資料庫之間有很好的接口。 最近Oracle資料庫開始正式支持R語言。(8) R語言是自由軟體,可以放心大膽地使用,但其功能不會輸給SPAA,SAS,MATLAB等專業軟體。
  • R語言學習資源匯總(分學科)
    ,更像是一門專為統計學家量身定製的程式語言,且由於歷史悠久、開源等特點,不少學術界人士會選擇自行開發一個R包作為其學術產出。之中,tidyverse安裝方法為:options(repos=structure(c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")))install.packages('tidyverse')前面一行為更改默認鏡像地址為清華的R鏡像增加下載速度,後面一行為安裝tidyverse包,該軟體包有一個專門電子書教程R
  • 全棧數據之R語言常用包和函數
    這本書收集了R初學者提問頻率最高的153個問題。為什麼叫153分鐘呢?因為最初作者寫了153個問題,閱讀一個問題花費1分鐘時間,全局下來也就是153分鐘了。讀了上述書籍之後,你就可以去高級入門階段了。這時候要讀的書有兩本很經典的。《Statistics with R》和《The R book》。
  • 「了不起的R語言」第一課:R與Rstudio的安裝
    是時候為你打開新世界的大門,讓你多了解些了不起的R語言吧!那麼R語言哪裡好?免費,免費,大寫的免費!正版!開源!上手快!特好使!工欲善其事必先利其器,我們今天就來給大夥介紹R語言以及Rstudio如何安裝。一、R的安裝R 的安裝可通過網址https://cran.rstudio.com/選擇適合自己平臺的安裝包進行下載.
  • 獨家 | 用於數據清理的頂級R包(附資源)
    Install.packages(「plyr」)Library(plyr)Hist(YOUR_DATASET_NAME)這能夠創建數據的可視化,以快速發現任何異常。箱形圖可視化使用相同的包,但分成四分位數以進行離群檢測。這兩個組合將很快告訴您是否需要限制數據集或僅在任何算法或統計建模中使用它的某些部分。
  • 地理數據科學培訓班第一課之初識R語言
    安裝 R下載頁面:https://mirrors.tuna.tsinghua.edu.cn/CRAN/我安裝的 R 語言是 R version 4.0.2 (2020-06-22),該發行版的名字是 Arbor Day。
  • 精選|你必須懂的R語言最新數據包
    背景簡介 R語言作為優秀的數據科學工具,越來越受到廣大數據科學工作者的歡迎!當前,通過R獲取各種外部數據已經非常便捷。以下為過去兩個月在CRAN上發布的40多個R數據包,希望有助於大家的學習!二.10.copulaData v0.0-1: 包含了用於copula建模的數據集.11. CytobankAPIstats v1.0: 提供了從細胞庫獲取和處理細胞數據的工具.12. data360r v1.0.1: 提供了數據接口,支持獲取世界銀行的TCdata360和Govdata360平臺的數據.13.