2.新建6個向量,基於不同的原子類型。(重點是字符串,數值,邏輯值)
3.告訴我在你打開的rstudio裡面 getwd() 代碼運行後返回的是什麼?
當前工作目錄
4.新建一些數據結構,比如矩陣,數組,數據框,列表等(重點是數據框,矩陣)
5.在你新建的數據框進行切片操作,比如首先取第1,3行, 然後取第4,6列
7.下載 https://www.ncbi.nlm.nih.gov/sra?term=SRP133642 裡面的 RunInfo Table 文件讀入到R裡面,了解這個數據框,多少列,每一列都是什麼屬性的元素。(參考B站生信小技巧獲取runinfo table) 這是一個單細胞轉錄組項目的數據,共768個細胞,如果你找不到RunInfo Table 文件,可以點擊下載,然後讀入你的R裡面也可以
9.把前面兩個步驟的兩個表(RunInfo Table 文件,樣本信息sample.csv)關聯起來,使用merge函數。
1.對前面讀取的 RunInfo Table 文件在R裡面探索其MBases列,包括 箱線圖(boxplot)和五分位數(fivenum),還有頻數圖(hist),以及密度圖(density) 。
>boxplot(MBases~MBytes,data=SraRunTable,col="blue")
> plot(density(SraRunTable$MBases))
> hist(SraRunTable$MBases)
2.把前面讀取的樣本信息表格的樣本名字根據下劃線分割看第3列元素的統計情況。第三列代表該樣本所在的plate
3.根據plate把關聯到的 RunInfo Table 信息的MBases列分組檢驗是否有統計學顯著的差異。
t.test(e[,1]~plate)
4.
分組繪製箱線圖(boxplot),頻數圖(hist),以及密度圖(density) 。
使用ggplot2把上面的圖進行重新繪製。
5.使用ggpubr把上面的圖進行重新繪製
library(ggpubr)
p <- ggboxplot(e, x = "plate", y = "MBases",
color = "plate", palette = "jco",
add = "jitter")
# Add p-value
p + stat_compare_means(method = 't.test')
6.隨機取384個MBases信息,跟前面的兩個plate的信息組合成新的數據框,第一列是分組,第二列是MBases,總共是384*3行數據。
indexes <- sample (nrow (e), 384)
data <- e [indexes, ]
data2 <- data[,c(3,1,2)]
dim(data2)