微信公眾號:醫意貫之
如有問題或建議,請公眾號留言;
如果你覺得該文章對你有幫助,歡迎讚賞
https://blog.csdn.net/weixin_42873544/article/details/105600548
https://blog.csdn.net/weixin_43770045/article/details/91976434
筆者今日發現數據處理錯誤,但不知道怎麼對比,學習了一下dplyr函數並加以應用。
數據.xls為原始數據,部分錯誤.xls為有部分修改的數據
對比兩組數據是否完全相同,如果相同顯示為1不相同顯示為0
1#install.packages("dplyr")
2library(dplyr)
3data=read_xls('數據.xls')
4data2=read_xls('數據部分錯誤.xls')
5df1=select(pltdata,OS,osstatus,treatment_R)
6df2=select(pltdata2,OS,osstatus,treatment_R)
7df=add_row(df1,df2)
8df %>%
9 group_by(OS,osstatus,treatment_R) %>%
10 mutate(dup = if (n() ==1) 0 else 1)%>%
11 View()
通過read_xls函數讀取data和data2
通過select函數選擇需要對比的兩列,形成df1和df2
通過add_row函數對df1和df2行相加
通過group_by函數分組
通過mutate增加dup列 1表示存在相同列,0表示無相同列
↑dup=0時為無重複列