R語言ggplot2折線圖(line plot)添加置信區間(CI)展示學術論文作者數量的變化趨勢

2021-12-23 小明的數據分析筆記本

非常有意思的數據可視化案例 ,原文提出的問題是 學術論文中的作者數量有逐年增加的趨勢 ;於是利用R語言裡的 rplos 包抓取了 Plos 系列的6本期刊的2006年至2013年的每篇論文裡的作者數量 進行可視化展示

原文連結是https://benjaminlmoore.wordpress.com/2014/04/06/author-inflation-in-academic-literature/

完整的代碼連結

https://github.com/blmoore/blogR

原始代碼中抓取數據的部分好像不能用了,我稍微改動了一下,選取了2006年到2020年的數據,獲取數據的代碼這裡就不放了,如果需要本文的示例數據可以知己在文末留言

數據已經存儲到了文件裡 首先是讀取數據
library(readr)
df<-read_tsv("author_number.tsv")
head(df)

image.png期刊分別是
table(df$journal)

image.png作圖代碼
ibrary(ggplot2)
ggplot(df, aes(x=year, y=auth_num, col=journal, fill=journal)) +
  stat_summary(fun.data="mean_cl_boot", geom="ribbon",
               #width=.2, 
               alpha=I(.5)) +
  stat_summary(fun="mean", geom="line") +
  labs(x="Year", y="Mean number of authors per paper") +
  theme_bw() +
  theme(legend.position="top") +
  scale_fill_brewer(type="qual", palette=2, 
                    guide=guide_legend(direction="vertical",
                                       label.position="bottom",
                                       title=NULL, 
                                       ncol=6,
                                       label.hjust=0.5)) +
  scale_color_brewer(type="qual", palette=2, guide="none")+
  facet_wrap(~journal,ncol=23)

image.png

根據上圖確實可以看出學術期刊的作者數量確實是有增加的趨勢的

這裡新學到的知識點是使用stat_summary()函數添加置信區間,之前自己也實現過這個圖,但是需要提前算好置信區間和平均值,比如之前的推文 R語言ggplot2畫帶有置信區間的折線圖和分組求均值遇到的一個問題,如果換成 stat_summary() 這個函數以後就方便很多

好了,今天的內容就到這裡了

大家如果需要推文的示例數據和代碼的話可以直接在公眾號 後臺回復  20210426

歡迎大家關注我的公眾號

小明的數據分析筆記本


小明的數據分析筆記本 公眾號 主要分享:

1、R語言和python做數據分析和數據可視化的簡單小例子;

2、園藝植物相關轉錄組學、基因組學、群體遺傳學文獻閱讀筆記;

3、生物信息學入門學習資料及自己的學習筆記!

相關焦點

  • R語言的ggplot2做平滑的折線圖簡單小例子
    之前的圖文  跟著Nature Genetics學畫圖~ggplot2畫折線圖並在指定區域添加灰色背景 畫折線圖的遇到的一個問題是:ggplot2默認的折線圖畫出來基本都是帶尖的,有沒有辦法將折線圖變得平滑一點呢?
  • R語言實戰(19)——使用ggplot2進行高級繪圖
    後臺回復「R語言實戰」即可獲取二維碼加入R語言實戰學習討論群。19.1 ggplot2包介紹ggplot2包是使用R進行數據可視化的重要工具,提供一個全面的、基於語法的、連貫一致的圖形生成系統,允許用戶創建新穎的、有創新性的數據可視化圖形。ggplot2的語法1. 在ggplot2中,圖是採用串聯起來(+)號函數創建的。每個函數修改屬於自己的部分。
  • 每天學習一點R:40.折線圖和趨勢線擬合
    今天介紹幾個用R繪製折線圖、點線圖或者在散點圖的基礎上添加擬合趨勢線的方法 (PS:基於base
  • 【ggplot2】為條形圖和折線圖添加誤差線
    SE為 standard error of the mean 可以參考: http://blog.csdn.net/tanzuozhev/article/details/50830928# summarySE 計算標準差和標準誤差以及95%的置信區間.
  • 跟著Nature Methods學畫圖:R語言ggplot2散點圖並添加擬合曲線和置信區間
    今天的推文繼續學習A single-cell atlas of the peripheral immune response in patients with severe COVID-19論文中的代碼。
  • 一文讀懂ggplot2數據可視化
    該程序包是紐西蘭統計學家Hadley Wickham在2005年左右開發的,那時候作者還是美國Iowa大學的博士生。 ggplot2的命令是一種用R實現的繪圖語言ggplot2的代碼相對容易理解,設定各種參數較為方便,圖形也十分美觀,能用相對簡單的代碼在圖形中呈現出非常豐富的信息。不過,ggplot2的語法與傳統R函數的調用方式有很大差別,所以不少人反映學起來有些困難。
  • R語言統計與繪圖:ggsurvplot()函數繪製Kaplan-Meier生存曲線
    5.2 增加置信區間ggsurvplot(fit, data = lung,           surv.median.line = "hv",  # 增加中位生存時間           conf.int = TRUE) # 增加置信區間
  • Python/R: 森林圖(Forest Plot)的繪製
    森林圖(可以將觀察到的效果、置信區間以及每個研究對象的權重等信息全部表示出來,是一種簡單直觀地展示單一研究和匯總研究的可視化圖表。下面,小編再附上森林圖各個繪圖元素間關係的解釋圖:Key Elements of the Forest plot註:這裡小編簡單介紹一下,感興趣的同學可以自行查閱資料哈。
  • ggplot2繪圖之四:散點圖、折線圖,點線圖
    第十九節 R語言ggplot2繪圖系列教程之基本認識 bilibili.com/video/BV1UK4y1r7bU第二十節 R語言ggplot2繪圖基本要素之數據、映射與圖層 bilibili.com/video/BV1zp4y1C7wU第二十一節 R語言ggplot2繪圖基本要素之幾何圖形:直方圖、密度圖與(分組)柱狀圖bilibili.com/video/BV1Ei4y187BL
  • Python語言plotnine VS R語言ggplot2
    相對於R中的基礎可視化包,是基於圖形語法的繪圖包,一經提出就迅速受到廣大R語言使用者的喜愛。ggplot2包利用圖層疊加的繪圖方式,往圖像上不斷的添加圖形元素、注釋、統計結果等內容。plotnine庫可以看作是在Python中對ggplot2包的一種實現,方便Python對數據可視化的應用。本文章會分別介紹在R和Python中,如何使用相關的庫進行數據可視化分析。
  • R語言|Survminer包繪製生存曲線
    event:f(y) = 1-y;cumhaz:f(y) =-log(y);pct:生存率百分比color繪製生存曲線的顏色設置,可使用調色板palette使用調色板linetype改變線條類型conf.int邏輯值,如果為TRUE,則繪製置信區間pval邏輯中,如果為TRUE,則繪製p值pval.method是否添加一個文本,其中包含用於計算pvalue的檢驗名稱,該文本對應於生存曲線的比較。
  • 跟著Nature Genetics學畫圖:R語言ggplot2畫折線圖並添加誤差線
    折線圖添加誤差線是非常常用的一種可視化方法,今天的推文介紹一下使用R語言的ggplot2作圖的代碼。
  • ggplot2的回歸模型擬合以及回歸曲線作圖方法雜燴
    95% 置信區間#stat_smooth() 參數 span 可控制曲線平滑度,值越大擬合曲線越平滑,詳情 ?##gam 默認情況下執行一般加性模型的平滑回歸,並展示 95% 置信區間#stat_smooth() 和 geom_smooth() 的用法大致相似#通過 formula = y~s(x) 指定函數關係,s() 中的參數 k 可調整平滑度,詳情 ?
  • R-forestplot包| HR結果繪製森林圖
    is.na(data$Count), paste(data$Count," (",data$Percent,")",sep=""), NA)  tabletext <- cbind(c("Subgroup","\n",data$Variable),                    c("No. of Patients (%)","\n",np),
  • forest plot R語言森林圖
    forest plot R語言森林圖本文借鑑了很多微信公眾號,然而發文前想找一下連結找不到了~如有侵權,請留言。似僧有發,似俗無塵。作夢中夢,見身外身。library(forestplot)data <- read.csv("forestplotdataEXAMPLE.csv")2.原始數據格式> head(data)          Variable Count Percent Point.Estimate Low High
  • 在Python中使用ggplot2風格及語法: plotnine與ggplot|可視化系列05
    Hadley Wickham編寫的ggplot2 在R語言中聲名遠揚,使得統計數據可視化能力成為R語言的一大優勢(這位大神還寫了dplyr、tidyr等影響深遠的R包)。plotnine常用繪圖類型[2]pn.geom_line繪製折線圖,默認的x軸需要是數值型變量,分類變量需要設置group參數,group = 1。
  • 如何做主成分分析加"置信區間"?
    使用R語言為PCA散點圖加置信區間的方法,我知道的有三種,分別是使用ggplot2、ggord和 ggfortify三個R包去繪製。
  • 跟著Nature Methods學畫圖:R語言ggplot2畫小提琴圖
    今天推文的主要內容是介紹如何使用R語言繪製散點圖並且添加擬合曲線和置信區間這篇論文是在簡書 土豆學生信 分享的內容看到的。簡書的連結是 https://www.jianshu.com/p/bbf9cb13b41a論文是image.png論文對應的代碼是公開的 https://github.com/ajwilk/2020_Wilk_COVID
  • 統計知識 | 使用SPSS、R和JASP計算效應量的置信區間
    在心理學研究中,最常用的效應量有兩種:一種是表示相關性的效應量(correlational),常見的指標有r(r^2)和R(R^2),其中η^2也是r「家族」中的一個;另一種是均值差異(mean difference),常見的指標如本文重點介紹的cohen's d等。
  • R科研繪圖01——基礎折線圖
    簡介折線圖通常用來對兩個連續變量之間的相互依存關係進行可視化。x軸可以是連續型變量,也可以是離散型變量。生物學中,通常用來表示不同藥物劑量下實驗對象的變化,或者是基因在不同類型組織或細胞中的表達模式。1.