R語言高效讀取xls/xlsx格式文件

2021-12-29 長頸鹿數據堂

今天來學習下怎麼將xls/xlsx格式文件中的數據導入到R中。

主要介紹三種方式。

下面讀取的數據文件默認放置於工作目錄中。

在讀取數據前,可以先閱讀這篇文章(猛戳:Excel數據導入R前的注意事項),將Excel中的數據進行預處理,方便讀取以防出錯。

另外spss、sas、stata等軟體的數據格式文件導入請參見這篇文章(猛戳:R語言統計與繪圖:數據的輸入與輸出)。

1. 從剪切板讀取數據

xls/xlsx文件不同於txt、csv文件,需要使用其他的方式讀取。

首先對於小樣本數據,可以打開Excel文件,將需要讀取的數據複製到剪切板,然後使用read.table()函數讀取剪切板中的數據即可。

my_data <- read.table(file = "clipboard",  # 讀取剪切板中的數據
                      sep = "\t",  # 指定分隔符
                      header=TRUE) # 指定第一行是否為列變量名稱

上面是Windows系統的數據讀取方式,水果機的讀取代碼略有區別。

# 水果機使用pipe(pbpaste)函數讀取剪切板的數據
my_data <- read.table(pipe("pbpaste"), 
                      sep="\t", 
                      header = TRUE)

2. 使用readxl包讀取數據

對於大樣本的數據,使用剪切板就比較麻煩,可以使用readxl包來讀取數據。這個包是Hadley Wickham大神開發的。

readxl包中的read_excel()函數可以讀取xls/xlsx文件。

install.packages("readxl") # 安裝R包
library("readxl") # 加載R包

# 讀取xls文件,文件位於工作目錄下
my_data <- read_excel("my_file.xls")
# 讀取xlsx文件
my_data <- read_excel("my_file.xlsx")

同樣也可以跟前面一樣交互式瀏覽本地文件導入,代碼如下:

my_data <- read_excel(file.choose())

也可以指定讀取Excel中的sheet表格,一般默認讀取第一個表格。

# 通過指定sheet表名稱來讀取數據
my_data <- read_excel("my_file.xlsx", sheet = "data")
# 指定讀取名為data的sheet表格
  
# 通過指定sheet表的順序數字來讀取數據
my_data <- read_excel("my_file.xlsx", sheet = 2)
# 指定讀取第二個表格

3. 使用xlsx包讀取數據

除了readxl包外,還可以使用xlsx包來讀取Excel文件。

install.packages("xlsx") # 安裝R包
library("xlsx") # 加載R包

xlsx包中有兩個函數可以用來讀取xls/xlsx文件:read.xlsx()和read.xlsx2(),在讀取大樣本數據時,後者要比前者快。

read.xlsx(file,  # 指定數據文件路徑
          sheetIndex, # 指定讀取的sheet表格,可以用數字表示
          header=TRUE) # 邏輯詞,是否將第一行作為列名
read.xlsx2(file, sheetIndex, header=TRUE) # 同上

示例:

# 讀取xls文件,文件位於工作目錄下
my_data <- read.xlsx("my_file.xls")
# 讀取xlsx文件
my_data <- read.xlsx("my_file.xlsx")

同樣也可以跟前面一樣交互式瀏覽本地文件導入,代碼如下:

# 數字1表示讀取文件中第一個sheet表格
my_data <- read.xlsx(file.choose(), 1)  

參考資料http://www.sthda.com/english/wiki/reading-data-from-excel-files-xls-xlsx-into-r

相關焦點

  • 三種方法高效讀取xls/xlsx格式文件
    今天來學習下怎麼將xls/xlsx格式文件中的數據導入到R中。主要介紹三種方式。下面讀取的數據文件默認放置於工作目錄中。在讀取數據前,可以先閱讀這篇文章(猛戳:Excel數據導入R前的注意事項),將Excel中的數據進行預處理,方便讀取以防出錯。另外spss、sas、stata等軟體的數據格式文件導入請參見這篇文章(猛戳:R語言統計與繪圖:數據的輸入與輸出)。
  • R語言讀取 xlsx 和xls 文件
    讀取xls文件時,竟然報錯了。❞xlsx文件,是2007,2013,2016版本的Excel文件,R語言中可以通過openxlsx包進行讀取。1. 讀取xlsx文件> dd = read.xlsx("..
  • R語言讀取xlsx文件
    關於R語言讀取Excel文件,比較麻煩,我從來都反對直接讀取xlsx文件,因為爬蟲數據時,一般保存的格式都是csv文件,或者直接保存到資料庫裡面
  • 《語料庫與Python應用》(修訂版)----2.2.4 讀取xlsx格式的語料文本
    ###############2.2.4  讀取xlsx格式的語料文本###方法一:以xlrd讀取數據
  • 每天一個R語言知識點| 讀取.xlsx文件
    收錄於話題 #R語言 #沒有安裝xlsx的童鞋,先安裝此包install.packages("xlsx")##安裝完xlsx包的童鞋,略過第一步
  • R語言 | 表格?壓縮?你...過來啊!
    1、既然 fread 函數在前文中已經被證實讀取.csv文件具有較高的效率,為什麼對於.xlsx或.xls文件,推薦使用readxl包中的 read_excel 函數呢?http://www.sthda.com/english/wiki/reading-data-from-excel-files-xls-xlsx-into-r2、如何讀取壓縮的表格文件?
  • 詳細教程:從R中導出各種數據文件格式
    今天來學習下怎麼從R中導出數據,這個是R語言基本功。1. 使用R基礎函數導出數據1.1 導出txt文件導出txt文件可以使用write.table函數。文件,使用`,`作為分隔符;write_csv(mtcars, path = "mtcars.csv")3. xlsx包導出xls或xlsx文件(推薦)可以使用xlsx包來導出xls或xlsx文件。
  • [筆記] 批量讀取Excel表後合併的R命令
    收錄於話題 #r語言 批量讀取文件夾內所有excel表並合併成一個表的R命令:setwd("excel表所在的路徑")temp<-list.files
  • 2.5 xlsx格式的Excel文件讀寫——openpyxl
    xls和xlsx,這兩種格式的Excel文件最大的不同之處在於,xls格式的每個表(Sheet)最多只能有65536行和256列,而xlsx則最多可以有上一篇文章講解了如何讀寫xls格式的Excel文件,這篇文章中,小編將演示如何使用openpyxl包(安裝命令:pip3 install openpyxl),完成 xlsx格式的Excel文件的簡單讀寫任務。
  • R語言 | 更快的表格文件讀取方法!
    使用R語言讀取 Affymetrix Human Exon 1.0 ST Array 晶片平臺探針注釋文件:https://www.affymetrix.com/analysis/downloads/na36/wtexon/HuEx-1_0-st-v2.na36.hg19.probeset.csv.zip解壓後的.csv
  • 用R語言讀取EXCEL文件的方法
    而CSV與TXT格式的文件,雖然容量大,但由於是純文本文件,所以不具有數據處理的功能。        為了解決這一尷尬的問題,下面我就教一下大家怎麼用統計專業的R語言來讀取數據(數據處理之前很重要的一個步驟)        用R讀取excel文件中的數據,需要先搭建一個Java的環境(配置好JDK),然後再用 install.packages("xlsx") 指令導入相關的包(常見的Excel文件格式是xlsx,而處理xlsx文件這個包是使用Java語言來寫的
  • R讀取xls文件的各種嘗試
    定位xlsbadxls <-'/mnt/lab/PTG1/Results/tmps/bad.xls'
  • 在R裡怎麼導入txt/csv和excel文件
    我們使用比較多的數據存儲格式有.txt, .csv,.xlsx,.xls等。今天,本文介紹一下在R裡導入數據前的準備和導入不同文件格式的方法和相關代碼。1. 導入前數據的準備為了避免在導入數據到R裡時出現錯誤,導入之前我們需要對數據文件的格式進行規範一下。
  • 敲黑板,表格後綴xls、xlsx、xlsb、xlsm、csv分別是什麼意思?
    小夥伴們在日常工作中見過各種奇形怪狀的表格,有xls格式的,也有xlsx/xlsm/xlsb格式的,也有csv格式的,同樣是電子表格,它們之間有什麼差異嗎?今天我們就來說說它們之間的異同點。xls——Excel早期表格格式1987微軟開發出第一款適用於windows系統的Excel表格,至今產品迭代更新十幾個版本(目前Excel2019),其中xls格式是Excel2003版本及其以前版本所生成的文件格式。
  • Excel中的xls、xlsx、xlsm混合文件,看我用Python如何統一處理......
    在Python中,有幾個常用的庫專門用來處理Excel文件,分別是xlrd、xlwt和openpyxl,簡單介紹一下:openpyxl可以讀數據和寫數據,但只能處理xlsx;如果待處理的文件,既有xls,又有xlsx時,我覺得還是將它們一併轉換為統一格式
  • WPS教程:et格式的文件怎麼打開以及et轉換xls格式的方法
    第一,et格式和xls格式文件介紹WPS表格默認的文件格式是*.et。這個格式也是WPS表格專用文件格式。EXCEL文件格式*.xls,是微軟的EXCEL電子表格文件默認格式。WPS為了兼容EXCEL,也可直接保存為*.xls、*.xlsx該格式,這也是小編比較推薦的格式。
  • 【每天學點應用軟體】SPSS讀取EXCEL格式文件數據
    目前,多數市場調研公司都使用EpiData軟體作問卷錄入,然後再將錄入結果導入SPSS中,而對於網際網路公司而言,更多的是使用資料庫或.CSV格式文件,SPSS默認讀取的文件類型有11種,本篇先從讀取EXCEL格式文件說起。GUI操作嚮導方式讀取
  • 【數據分析】R語言獲取Excel數據
    問題描述:我們的數據放在Excel裡面,數據格式後綴為.xls或者.xlsx。如何獲取Excel中的數據呢?解決方案:R語言提供xlsx包,可以獲取Excel中的數據。代碼實現:##讀取Excel中的數據#安裝xlsx包if(!
  • 《高效R語言編程》5-高效輸入輸出
    在讀取一行數據之前,應該先考慮下重複數據管理的通用規則,不改寫原始數據。原始文件視為只讀,保留原始文件名字並說明來源,是一個好辦法。軟體配置幾個包:install.packages(c("rio","readr","data.table","feather","WDI"))關於數據I/O的高級技巧R語言自己的文件格式是.Rds,可以使用readRDS()與saveRDS()函數導入與導出,是一種速度與空間存儲都什麼高效的格式
  • 可用於解析 Excel 文件的程序語言
    Excel文件是常見的數據文件,數據分析過程中經常會用到。