【R每日一貼】subset()函數使用??

2021-03-02 R語言

這個貼子,以實際問題介紹subset()函數的應用。

問題描述?

提取四家公司12月31日的營銷數據。

怎麼做

按著以下步驟操作

第一步:數據集

company.id <- rep(c(1,2,3), each=4)
company.date <- rep(c("2007/10/31","2007/11/30", "2007/12/31", "2008/12/31"), time=3)
company.number <- c(100, 150, 200, 110, 145, 198, 112, 160, 201, 111, 165, 240)
company.data <- data.frame(company.id, company.date, company.number)

company.data

第二步:提取四家公司12月31日的營銷數據

subset(company.data, grepl('?/12/31', company.data$company.date))

如何運行?

1 利用data.frame()構建這個數據集,若是對於實際問題可以採用read.table()函數或者read.csv()函數導入數據到R中

2 利用subset()函數提感興趣的數據,條件採用grepl()函數來進行構造和生成邏輯為真的觀測,在grepl()函數裡面使用正則表達式選取符合要求的內容。

請參閱:

關於R語言subset()函數的詳細使用和實例,請運行下面代碼

?subset

example(subset)

相關焦點

  • R語言中使用subset函數對數據進行分類管理操作
    首先我們要把數據進行分割,得到一個倖存的數據表和一個死亡的數據表,然後再分別統計,我們今天利用R語言自帶的subset函數來演示這一功能,這是一個非常重要的功能,為今後我們對數據進一步分析做準備。我們使用SPSS自帶的一個Breast cancer survival腫瘤數據來演示,首先我們把這個數據導入R,並且刪除缺失值library(foreign)library(survival)bc <-read.spss("E:/r/Breast cancer survival agec.sav",
  • R語言data manipulation學習筆記之subset data
    個人博客: https://ytlogos.github.io/公眾號:生信大講堂往期回顧數據分析過程中我們常常需要從數據集中抽取部分數據,本文將介紹如何提取子數據集,主要利用R自帶的函數,以後會專門介紹data manipulation包dplyr。
  • 技術貼 | R語言:繪製基因組基因箭頭圖
    舉例介紹如何用R語言gggenes函數包把基因預測得到的gff或gtf文件(含基因位置信息)中的基因類型、位置可視化到圖中。注意:R version >= 3.6gggenes依賴的ggfittext需要R 3.6以上,導致我用R 3.4.1安裝gggenes失敗。後來改用R 3.6.1成功安裝。
  • R語言奇淫巧技之pdftools包
    我們前面講解過了使用R語言做爬蟲,處理圖片,寫網頁應用等等,都在生信基石之R語言,B站的10個小時教學視頻!
  • R語言-stringr-字符串處理
    單雙引號R語言中字符串輸入時,可以使用單引號,也可以使用雙引號。轉義要在字符串中包含單引號或雙引號,可以使用\ 轉義它,即遇到特殊符號時需要轉義。,不用轉義路徑複製和直接可用charchar <- r"(我是一名'R語言'學習者)"cat(char)常用函數截取字符串,匹配字符串,添加指定字符籌齊長度,去除左右兩邊空格,分割字符串,
  • 【R每日一貼】R對行和列求和?
    在這大數據時代裡,從數據中找出價值,既是機遇又是挑戰。R語言可以幫助我們獲取數據、處理數據、分析數據、展示數據和理解數據,以進行數據化決策!問題描述:R對行和列求和?解決方案:R使用rowSums函數對行求和,使用colSums函數對列求和。
  • 一條函數使用三種方法檢測群落差異(MRPP,anosim,adonis)
    很多人也問,到底使用哪種方法比較好,當然也有一些博文對他們有過簡單的區別,但是目前沒什麼大的不同。這三種方法是可以一起使用的。不僅僅要一起使用,還要再有多個分組的情況下,進行兩兩比較。,但是%in%的問題並沒有解決,不僅是這個函數,還有我曾今推送的maptre中的函數:# 提取otu表格 otu_table = as.data.frame(t(vegan_otu(ps1_rela))) otu_table$mean = rowMeans(otu_table) otu_table$ID =
  • R語言中plyr包
    分劃:split函數  在R當中,split這個步驟是由split( ),subset( )等等函數完成的。  下面主要介紹split這個函數。  函數split()可以按照分組因子,把向量,矩陣和數據框進行適當的分組。它的返回值是一個列表,代表分組變量每個水平的觀測。
  • R 圖形配色——科研工作者的藝術審美
    因此,今天我們來聊一聊統計圖形的配色,主要介紹 R 中常用的一些配色方案。本文中代碼基於 R 3.6.0,開發環境為 RStudio 。R 基本顏色功能  R 中,函數 colors() 列出了 R 識別的所有顏色名稱。
  • R語言中使用boxplot函數繪製箱線圖
    R中繪製箱線圖的函數boxplot(1)基本用法boxplot(x, ...)., subset, na.action = NULL, drop = FALSE, sep = ".boxplot函數用法舉例(1)簡單使用情況統計某中學學生的身高數據如下:144, 166, 163, 143, 152, 169, 130, 159, 160, 175, 161, 170, 146, 159, 150
  • Learn R:如何自定義IRR函數
    關於使用Excel內置公式計算IRR的相關文章已有很多,那麼為何要使用R語言編寫IRR函數呢?原因就在於R語言可以藉助向量化操作方式實現IRR的批量查詢。f(2, 3)2、編寫IRR函數內部收益率(Internal Rate of Return (IRR))是資金流入現值總額與資金流出現值總額相等、淨現值等於零時的折現率。根據資金的時間價值理論,我們將每一期現金流進行折現,求淨現值為0時的折現率,其本質是求解一個一元多次方程的根。
  • 對照著Excel入門R語言表格數據處理
    這裡主要推薦使用dplyr包對數據進行分類匯總,主要用到以下幾個函數:filter():按記錄數值篩選,針對表格的「
  • R 字符串之 stringr
    R 字符串之 stringr前言昨天我們介紹 R 數據處理的時候,對字符串的操作都是用自帶的函數。雖然 R 的字符串並不是它的強項,看起來也不是那麼的優雅,但是字符串在數據處理和清洗過程中還是扮演者較為重要的角色。
  • 技術貼 | R語言:組學關聯分析和pheatmap可視化
    基本方法是用R語言psych包corr.test函數進行兩組數據的相關分析,結果經格式化後用pheatmap可視化得熱圖。一、模擬輸入 1.參數一:other -> KO或其他組學豐度表參數二:metabo -> 代謝物豐度表參數三:route -> 輸出目錄【提前創建】corr.test進行兩組數據相關分析用stringr split將ko-metabolite結果列拆成兩列結果保留r_value p_value顯著相關標記
  • R語言字符串函數詳解
    軟體包:stringr1.
  • 【R函數學習】R語言時間序列函數整理
    #arma模型library(fUnitRoots) #進行單位根檢驗library(FinTS) #調用其中的自回歸檢驗函數library(fGarch) #GARCH模型library(nlme) #調用其中的gls函數library(fArma) #進行擬合和檢驗【基本函數
  • 全棧數據之R語言常用包和函數
    《R語言實戰》,這是高濤、肖楠等翻譯的一本書詳細全面介紹了入門、圖形、統計、回歸、方差、功效分析、廣義線性模型、主成分、因子分析、缺失值處理等。關於計量經濟學,首先推薦一本很薄的小冊子:《Econometrics In R》,做入門用。然後,是《Applied Econometrics with R》,該書對應的R包是AER,可以安裝之後配合使用,效果甚佳。計量經濟學中很大一部分是關於時間序列分析的,這一塊內容在下面的地方說。
  • 【R知識】R語言apply函數族筆記
    在使用R時,要儘量用array的方式思考,避免for循環。不用循環怎麼實現迭代呢?這就需要用到    apply 函數族。它不是一個函數,而是一族功能類似的函數。概述apply系列函數的基本作用是對數組(array,可以是多維)或者列表(list)按照元素或元素構成的子集合進行迭代,並將當前元素或子集合作為參數調用某個指定函數。
  • R包randomForest 隨機森林
    randomForest的manual 地址https://cran.r-project.org/web/packages/randomForest/randomForest.pdf 本文來自與與數據挖掘與R語言實戰和網際網路資料搬運和整理。
  • R語言SQL管理資料庫的方法
    #使用SQL語句操作數據框,需要加載的程序包sqldf,tcltk,使用iris數據集以及演示library(sqldf)library(tcltk)head(iris)#了解數據集由5各變量組成#取出前幾行a1r <- head(iris,10)#一般方法a1s <