R描述性統計

2021-02-08 黑子的科研空間
「 前面進行了數據導入和整理,接著開始統計分析,一般地,首先要對數據有個整體的了解。這裡就是描述性統計分析,下面看看描述性統計分析在R中的實現。」      導入數據,這裡我通過choose.files()命令調出複選框選擇我存在電腦中的mydata.csv文件,colClasses是對數據框列類型進行設置,這裡我設置mydata數據前4列為字符型,後8列為數值型。
# 導入數據mydata <- read.csv(choose.files(),sep = ",",header = T,                   colClasses = c("character","character","character","character",                                  "numeric","numeric","numeric","numeric","numeric",                                  "numeric","numeric","numeric"))

    常見的描述性統計指標有平均值,最大值,最小值,中位數,眾數,標準差,方差等。下面將各指標概念羅列如下,詳細計算可參看《田間試驗與統計分析》第二版,明道緒主編。也可藉助萬能的度娘(百度)搜索查看。最小值(min),最大值(max):顧名思義,數據集中最小的和最大的數值。中位數(median):數據按照順序排列後居於中間位置的數,若觀測值是奇數時,正好是位於中間的數,若為偶數時,則為位於中間的兩個觀測值的平均數。平均值(mean):也就是算術平均值(arithmetic mean),即所有觀測值的總和除以觀測值個數。四分位數(quantile):把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值,通常所說的四分位數是指處在25%位置上的數值(稱為下四分位數)和處在75%位置上的數值(稱為上四分位數)。標準差(sd):又常稱均方差,是離均差平方的算術平均數的平方根。方差(var):每個樣本值與全體樣本值的平均數之差的平方值的平均數。R中可以用summary()函數進行數據框描述性統計結果的查看。      以上描述性統計是針對某一列的數據進行的,然而試驗數據經常會遇到分組的情況,下面看看怎麼分組匯總。      這裡是將mydata數據框中列變量名稱加入到R語言可搜索範圍,至於attach()函數的作用可以參考《R語言實戰》,與之相反的函數是detach()。我個人的理解,用了attach後,R將列變量名稱放置在了內存中,下次再要調用列變量時,可以直接輸入名稱就行,不用再輸入類似mydata$LER了,直接輸入LER。
aggregate(LER,by=list(year,nitrogen,pattern),FUN=mean)

aggregate(cbind(LER,MO,CO)~year+nitrogen+pattern,FUN=mean)

library(dplyr)mydata %>% group_by(year,nitrogen,pattern) %>% summarise(count=n(),LERmean=mean(LER,na.rm=TRUE),LERsd=sd(LER,na.rm=TRUE))

相關焦點

  • R語言 | 描述性統計(上)
    R: The R Project for Statistical Computinghttps://www.r-project.org/RStudio:https://rstudio.com/從本文開始,我們將正式進入使用R進行統計分析的路程,在此期間我們會同時對統計分析方法和R語言實現進行詳細解釋,並加入相應的繪圖方式。
  • R-統計描述與假設檢驗
    ,在本文中,我們將補充一些其他的統計描述代碼,並匯總統計描述的常用可視化方法。一、統計描述1.1 統計描述代碼回顧:mean(x)均值median(x)中位數sd(x)標準差var(x)方差quantile(x, probs)分位數(probs∈[0, 1])range(x)值域sum(x)求和min(x)最小值max(x)最大值scale(x)中心化
  • 描述性統計與分位數回歸
    只要做了都有分,但不按照要求的話,分就相應要低一些充分利用小組合作,相互分享相互學習描述性統計描述性統計,維基百科的定義是:「描述性統計是一種匯總統計,用於定量描述或總結信息集合的特徵」。從這個定義,我們不難看出,描述性統計包含兩個重要的特徵,描述和總結。通常情況下,我們把描述性統計分為兩大類:離散趨勢和集中趨勢,兩種分類常見的統計量如下:
  • R aggregate() 函數分組描述性統計 | CorpusTalk分享
    R aggregate() 函數分組描述性統計 | CorpusTalk分享雷 蕾博士,教授 (華中科技大學)CorpusTalk 講述語言學和語料庫的故事堅持原創 不定期更新歡迎轉載 請留言告知 R 語言的aggregate() 函數非常適合分組描述性統計。
  • R包table1創建網頁格式的描述性統計表Table 1
    >改變表的外觀p-values列表格的轉置介紹在流行病學和其相關領域期刊上的標準做法是,用第一個表格(即Table 1)展示按暴露程度分層的研究人群的基線特徵的描述性統計。例1使用boot包中的melanoma數據集來進行展示,數據集的變量定義和具體描述利用?melanoma進行查看,melanoma數據框有205行,7列。
  • 《中華醫學統計百科全書. 描述性統計分冊》
    描述性統計分冊》 作者 總主編:徐天和   分冊主編:田考聰書號 ISBN 978-7-5037- 6468-4開本 16開裝幀 平裝出版時間 2012年4月定價 38元內容簡介:    《中華醫學統計百科全書》是一部醫學統計參考工具書,讀者對象主要是醫學統計工作者、醫療衛生機構的統計信息工作者和醫學院校的師生
  • SAS統計分析系列:描述性統計分析 (三)-- 描述性統計量
    描述性統計量。本文介紹描述數據分布形態的描述性統計量。在進行統計分析時,通常需要假設樣本服從某種分布。所以在進行分析之前有必要對數據的分布形態進行初步的了解,檢查數據是否大致服從某種分布,然後再運用統計理論去進行假設檢驗。描述數據分布形態有兩種基本方法,一種是計算統計量,一種是作圖。百分位數是一種位置指標。
  • 統計學之描述性統計 | Descriptive Statistics
    「統計學就像比基尼,你所看到的就是真實顯露的,但隱藏起來的才是至關重要的」——無名氏統計是有一些枯燥,但同時也可以很有趣,不是麼?我們知道統計學包括描述性統計和推論統計,而今天的主題是描述性統計的介紹。
  • 不可不知的描述性統計 | Descriptive Statistics
    我們知道統計學包括描述性統計和推論統計,而今天的主題是描述性統計的介紹。什麼是描述性統計呢?中文翻譯:描述性統計是一種匯總統計,用於定量描述或總結信息集合的特徵。這裡把關鍵詞勾劃一下:1、Describe-描述2、Summarize-總結注意:描述性統計的對象既可以是總體,也可以總體的一部分即是樣本。
  • 第七節 描述性統計與分位數回歸
    描述性統計描述性統計,維基百科的定義是:「描述性統計是一種匯總統計,用於定量描述或總結信息集合的特徵」。從這個定義,我們不難看出,描述性統計包含兩個重要的特徵,描述和總結。描述統計之stata實現接下來,我們根據自己的研究需要,選擇具體的變量或者全部的變量進行描述性分析。
  • 帶你一文了解描述性統計分析
    一般做數據分析的時候,對數據的探索性分析是第一步,均值等集中趨勢的指標是最常用的,像大眾點評的評分,不就是由消費者的評分的平均數所得麼~豆瓣評分,人均工資,人均消費,人均GDP等等,都是些簡單的描述性統計;結婚率,離婚率,男女佔比,各類佔比,都是描述性統計中簡單的頻數分析而已。
  • 描述性統計分析指標介紹
    描述性統計分析對調查總體所有變量的有關數據進行統計性描述,主要包括數據的頻數分析、集中趨勢分析、離散程度分析、分布以及一些基本的統計圖形。下面介紹一些常用統計描述指標。一、分類變量的常用描述指標頻數:在一組依大小順序排列的測量值中,當按一定的組距將其分組時出現在各組內的測量值的數目,分類變量的頻數即落在各類別中的數據個數。
  • SPSS | 快速掌握描述性統計分析及統計各類圖形!
    一、SPSS數據分析—描述性統計分析二、spss常見統計圖形SPSS用於描述性統計分析的過程大部分都在分析—描述統計菜單中
  • 白話統計學(五)描述性統計
    如果,群體中個體的差異不大,那麼,平均數就具有真實意義,可以有效地描述群體的水平。如果,群體中個體的差異較大,甚至,群體可以分為幾個明顯的子群體,那麼平均數的意義就不大,需要增加新的數據進行描述。在個體差異較大時,群體的標準差的數值也會較大,當標準差的數值達到平均數絕對值的 10% 時,根據實際經驗,此時,平均數的實際意義就不存在[1]。
  • 分組進行描述性統計的小技巧 --astx命令介紹
    前言在Stata的初學者進行實證研究時,會遇到各種各樣的小問題,而如何對手中的數據進行分組描述性統計應該是大多數初學者都會頭疼的問題。在中文網際網路上,關於這個問題有不少的解決方法,其中最方便的就是使用tabstat命令。但是,tabstat命令不能把結果輸出到外部的文件之中,所以今天我們要介紹一個很好用的命令--astx命令,來幫助實現結果輸出。
  • SPSS必學 | 快速掌握描述性統計分析及統計各類圖形!
    一、SPSS數據分析—描述性統計分析二、spss常見統計圖形SPSS用於描述性統計分析的過程大部分都在分析—描述統計菜單中
  • 機器學習數學基礎:數理統計與描述性統計
    統計量與抽樣分布數理統計的任務是採集和處理帶有隨機影響的數據,或者說收集樣本並對之進行加工,以此對所研究的問題作出一定的結論,這一過程稱為統計推斷。從樣本中提取有用的信息來研究總體的分布及各種特徵數就是構造統計量的過程, 因此,統計量是樣本的某種函數。
  • 圖解統計學:簡單易懂的基礎概率&描述性統計
    今天這篇文章就簡單說一下我近期學習到的統計學中的描述性統計分析以及基礎概率知識。統計性描述分析是作為統計分析的第一步,在日常的數據分析中其實我們經常使用一些特徵值,尤其是我們做周報或者月報的分析時,這些描述性的統計分析特徵值對於我們有一定的幫助,描述性統計分析是進行正確的統計推斷的先決條件。
  • 小白快速上手數據分析模型10 | 描述性統計案例
    ○輸入:單列或者多列定量數據○輸出:對總體的各項統計指標(欄位)進行整體描述分析,包括樣本量、最大值、最小值等統計量描述性統計(又稱敘述統計)用於對調查總體所有變量的有關數據進行統計性描述。部分數據如下:統計描述對計量資料進行描述,常從集中趨勢(平均水平)和離散趨勢(變異水平)兩個方面進行描述。集中趨勢指的是一個計量資料的大多數觀察值所在的中心位置。離散趨勢指的是計量數據的所有觀察值與中心位置的偏離程度。對分類資料進行統計描述,可匯總為頻數表的形式來反映數據的分布(建議採用頻數分析)。
  • 《R語言實戰》自學筆記40-描述性統計分析
    7.1 描述性統計分析7.1.1 方法雲集對於基礎安裝,你可以使用summary()函數來獲取描述性統計量。summary()函數提供了最小值、最大值、四分位數和數值型變量的均值,以及因子向量和邏輯型向量的頻數統計。summary(df[,5:8]) # summary函數計算df數據集5到8列的描述性統計量。