用R語言讀取EXCEL文件的方法

2021-02-20 職場工作技能集錦

        在工作中,我們得到的數據源一般是以Excel文件為多,偶有CSV文件或TXT文件等。資深表哥/表姐們都知道,Excel自帶數據統計功能,但卻處理不了大數據集。而CSV與TXT格式的文件,雖然容量大,但由於是純文本文件,所以不具有數據處理的功能。

        為了解決這一尷尬的問題,下面我就教一下大家怎麼用統計專業的R語言來讀取數據(數據處理之前很重要的一個步驟)

        用R讀取excel文件中的數據,需要先搭建一個Java的環境(配置好JDK),然後再用 install.packages("xlsx") 指令導入相關的包(常見的Excel文件格式是xlsx,而處理xlsx文件這個包是使用Java語言來寫的)。但是對於很多小白,可能會出現被配置JDK折騰得勸退的現象。所以,在這裡,我就向大家展示用R語言加載外部文件數據的另外3種更簡單的方法,如下:

        例如:我先在桌面(路徑為:C:\Users\QDM\Desktop)創建一個Excel文件,並手動輸入數據,構造一張9行*4列的數據表,表格內容截圖如下:

方法①:先按 F12功能鍵 將.xlsx另存為.csv格式的文件,然後用read.csv()函數來讀取該CSV文件中的數據,代碼如下:

> x <- read.csv("C:\\Users\\QDM\\Desktop\\銷售業績.csv",header = T)> x      品牌   產地 銷售數量      銷售金額1   布加迪   法國       10  200,000,000 2 蘭博基尼 義大利       20  160,000,000 3   法拉利 義大利       30  150,000,000 4     豐田   日本       40    6,000,000 5     本田   日本       50   10,000,000 6     五菱   中國       60    3,000,000 7     大眾   德國       70   21,000,000 8     寶馬   德國       80   80,000,000

運行結果截圖:

方法②:把.xlsx另存為.txt格式,然後用read.table()函數來讀取該txt文件中的數據,代碼如下:

> y <- read.table("C:\\Users\\QDM\\Desktop\\銷售業績.txt",header = T)> y      品牌   產地 銷售數量      銷售金額1   布加迪   法國       10  200,000,000 2 蘭博基尼 義大利       20  160,000,000 3   法拉利 義大利       30  150,000,000 4     豐田   日本       40    6,000,000 5     本田   日本       50   10,000,000 6     五菱   中國       60    3,000,000 7     大眾   德國       70   21,000,000 8     寶馬   德國       80   80,000,000

運行結果截圖:

方法3:先打開Excel文件,按Ctrl+A快捷鍵全選裡面的內容,接著按Ctrl+C複製(默認複製到剪切板上),如圖:

然後在RStudio中輸入以下代碼:

> z <- read.table("clipboard",header = T,sep = "\t")> z      品牌   產地 銷售數量      銷售金額1   布加迪   法國       10  200,000,000 2 蘭博基尼 義大利       20  160,000,000 3   法拉利 義大利       30  150,000,000 4     豐田   日本       40    6,000,000 5     本田   日本       50   10,000,000 6     五菱   中國       60    3,000,000 7     大眾   德國       70   21,000,000 8     寶馬   德國       80   80,000,000

運行結果截圖:

        結語:作為一名曾經的「統計學」專業的畢業生,在數據分析崗位上,如果被別人知道只會用Excel,而不會用一門本專業相關的專業工具(如:R語言、SAS語言、SPSS等)處理數據,會有一種很尷尬的感覺——可能會很容易被人覺得不學無術。雖然在畢業後,經本人的後天努力自學,掌握了一門更好用的數據分析工具——Python,但為了不愧對自己所學過的專業,為了不愧對那每年¥3500的學費,所以感覺還是挺有必要抽時間來學習一下R語言的!

相關焦點

  • R語言 | 更快的表格文件讀取方法!
    使用R語言讀取 Affymetrix Human Exon 1.0 ST Array 晶片平臺探針注釋文件:https://www.affymetrix.com/analysis/downloads/na36/wtexon/HuEx-1_0-st-v2.na36.hg19.probeset.csv.zip解壓後的.csv
  • C語言操作EXCEL文件(讀寫)
    C語言讀取Excel文件內容的功能,查閱了很多資料,大部分是通過ODBC或者過OLE/COM對Excel表格的讀取操作,這變要求在工程中添加類,如CApplicaton及其頭文件等,這包括Excel接口、導入類、頭文件等。
  • 可用於解析 Excel 文件的程序語言
    Excel文件是常見的數據文件,數據分析過程中經常會用到。
  • 三種方法高效讀取xls/xlsx格式文件
    在讀取數據前,可以先閱讀這篇文章(猛戳:Excel數據導入R前的注意事項),將Excel中的數據進行預處理,方便讀取以防出錯。另外spss、sas、stata等軟體的數據格式文件導入請參見這篇文章(猛戳:R語言統計與繪圖:數據的輸入與輸出)。
  • 用Python讀取Excel文件指南
    原作者丨Erik Marsja本文將重點闡述用Python如何讀取Excel文件(xlsx),重點是演示使用openpyxl模塊讀取xlsx類型的文件。首先,我們要看一些簡單的示例;然後,我們將學習讀取多個Excel文件。
  • 如何用Python讀取Excel中圖片?
    二、Python讀取Excel圖片上面說過,Python讀取Excel圖片有兩種方法。而後讀取裡面存儲圖片的文件,將裡面的圖片取出來。第二種:用提取到粘貼板中的方法將圖片保存到JPG、PNG等格式中」兩種方法各有缺點和優點,第一種方法缺點是代碼量比較長,優點是萬能,Excel的所有格式都可以運用。
  • R語言答疑:txt文件無法被R正確讀入
    今天來解答一個網友的疑惑,或許你也曾遇到過這個問題噢~R語言中,txt無法正確的讀入的可能性有很多種。
  • 手把手教你用R語言讀取CSV文件
    導讀:R語言有許多種方法去獲取數據,最常用的是讀取CSV文件。
  • R語言讀取csv文件
    csv文件一般是用的最多的數據文件格式,這一節主要介紹怎麼讀取csv文件。
  • R語言讀取xlsx文件
    關於R語言讀取Excel文件,比較麻煩,我從來都反對直接讀取xlsx文件,因為爬蟲數據時,一般保存的格式都是csv文件,或者直接保存到資料庫裡面
  • 用PHP讀取excel文件內容、獲取單元格數據
    源 / php中文網      源 / www.php.cn本篇文章主要介紹如何使用PHP讀取excel文件內容即每個單元格數據,希望對大家有所幫助。涉及相關知識點:①PHPExcel 是用來操作Office Excel 文檔的一個PHP類庫,它基於微軟的Openxml標準和PHP語言。可以使用它來讀取、寫入不同格式的電子表格。
  • 利用pandas讀取格式不規範的Excel文件
    ,在那些數據分散在不同Sheet的情況下,就需要自定義讀取數據的方式,這篇文章將討論如何用pandas和openpyxl讀取這類格式的Excel文件,將裡面的數據轉換為DataFrame以便進一步的分析工作。
  • 如何用Python讀取Excel中圖片?又如何用Python往Excel中寫入圖片?
    上面說過,Python讀取Excel圖片有兩種方法。「第一種:將xlsx後綴名改為zip形式,即進行壓縮。而後讀取裡面存儲圖片的文件,將裡面的圖片取出來。第二種:用提取到粘貼板中的方法將圖片保存到JPG、PNG等格式中」兩種方法各有缺點和優點,第一種方法缺點是代碼量比較長,優點是萬能,Excel的所有格式都可以運用。
  • 如何用PHP讀取excel文件內容、獲取單元格數據
    涉及相關知識點:①PHPExcel是用來操作Office Excel 文檔的一個PHP類庫,它基於微軟的Openxml標準和PHP語言。可以使用它來讀取、寫入不同格式的電子表格。②time() 返回當前時間的秒數的函數,用來獲取當前的系統時間③require_once 為了避免重複加載文件即加載文件一次④array()創建數組⑤memory_get_usage
  • Pandas進階Excel(一)——讀取
    總而言之,pandas處理數據第一、數據量要夠大夠多,否則用Excel處理就行了。第二、每天重複的操作,例如打開同樣的表格、刪除同樣的列、查找同樣的數據。再適合不過了。接下來再說說pandas與之前openpyxl庫哪個好?兩個庫其實都差不多,對數據以及圖表都有很好的支持,但從寫入數據與讀取數據的速度來看,pandas更勝一籌。
  • js讀取Excel報表文件
    ,是不行的所以就需要轉換,對於Excel文件的內容分析轉換,已經有了比較成熟的解決方案:js-xlsx 其實現方式也用到了上述新特性,看看具體要怎麼用 1.首先定義一個文件上傳項<input type="file" id="excel-file">2.
  • R語言 | 表格?壓縮?你...過來啊!
    1、既然 fread 函數在前文中已經被證實讀取.csv文件具有較高的效率,為什麼對於.xlsx或.xls文件,推薦使用readxl包中的 read_excel 函數呢?http://www.sthda.com/english/wiki/reading-data-from-excel-files-xls-xlsx-into-r2、如何讀取壓縮的表格文件?
  • [R語言學習系列4]數據的讀取和輸出
    我們使用R語言來進行數據處理,那麼就需要將本地的數據讀取到R中,當在R中進行一定的處理之後,我們也需要將處理之後的數據輸出。因此,本文就給大家介紹一下,R語言中最基本的數據讀取和輸出的方法。工作路徑(work directory)是指當前R的文件夾地址在哪?
  • 數據科學養成記 之 R語言基礎(3)——excel數據導入
    我們常見的excel導入方法為以下3種:1.將Excel轉存為csv格式文件,讀csv文件。a <- read.csv('exercise1.csv', header = T)2.利用RODBDC包讀取excelb <- odbcConnectExcel2007
  • n種方式教你用Python讀寫Excel等數據文件
    下面整理下python有哪些方式可以讀寫數據文件。1. read、readline、readlinesread()  :一次性讀取整個文件內容。推薦使用read(size)方法,size越大運行時間越長readline()  :每次讀取一行內容。