【每天學點應用軟體】SPSS讀取EXCEL格式文件數據

2021-02-23 CPDA數據說

SPSS作為一款數據分析軟體,其實並不適合作數據錄入。目前,多數市場調研公司都使用EpiData軟體作問卷錄入,然後再將錄入結果導入SPSS中,而對於網際網路公司而言,更多的是使用資料庫或.CSV格式文件,SPSS默認讀取的文件類型有11種,本篇先從讀取EXCEL格式文件說起。

GUI操作嚮導方式讀取

SPSS讀取EXCEL格式文件採用嚮導的方式操作非常簡單,文件—打開—數據—EXCEL數據文件格式類型等,嚮導操作唯一值得注意的地方是表格與範圍的選擇以及是否從EXCEL表首行讀取變量名。嚮導讀取EXCEL文件的界面流程參見下圖:

語法方式讀取

利用Syntax語句從EXCEL中讀取數據並沒有太多的技巧,數據讀取過程可以簡單的分為2類,一類是讀取單表數據,另一類則是讀取多表數據(與從資料庫中讀取數據語法類似,只是/CONNECT語句稍有不同)。這裡主要說說怎樣利用syntax語法從單表中讀取數據,例如:從我的文檔中讀取名叫data的EXCEL工作薄中表salary的[A3:H160]的數據,且將讀取數據的第一行作為變量名,其Syntax代碼如下::

get data ①

/type=xls ②

/file="C:/mydocuments/data.xls". ③

/sheet=name 'salary' ④

/cellrange=range 'A3:H160' ⑤

/readnames=on. ⑥

註解:

***①告訴SPSS,你的目的—得到數據(get data)***.

***②讀的數據是什麼類型(.xls or .xlsx or .xlsm)***.

***③告訴SPSS文檔的位置***.

***④告訴SPSS你要讀取那個表(缺失時自動讀取第一個表)***.

***⑤告訴SPSS你要讀取表中那些數據,如果是全部數據則cellrange=fulll***.

***⑥將讀取數據的第一行設置為變量名***.

值得注意的是,上面語句中的④⑤⑥三個子語句都可省略,省略後SPSS將從工作薄中第一個表讀取所有數據,並將第一行默認為變量名,如果第一行為空,變量名則默認為V1,V2……,這一過程和利用菜單向導操作效果一樣。

如何一次讀取多個EXCEL工作表內容?

上面簡單的用語法介紹了如何讀取單張EXCEL表的數據,如果要讀取多張EXCEL表單的數據又該如何操作呢?(註:這裡的多個EXCEL表格必須在同一個工作薄中),其原理其實是將一個EXCEL工作薄當作一個資料庫,然後利用資料庫讀取的方式讀取,關於SPSS如何從資料庫中讀取文件以後再詳細介紹,這裡可以先看看如下範例:

GETDATA

/TYPE=ODBC

/CONNECT=

'DSN=ExcelFiles;DBQ=c:\examples\data\sales.xls;' +

'DriverId=790;MaxBufferSize=2048;PageTimeout=5;'

/SQL =

'SELECTLocation$.[Store Number], State, Region, City,'

' Power,Hand, Accessories,'

' Tires,Batteries, Gizmos, Dohickeys'

' FROM[Location$], [Tools$], [Auto$]'

' WHERE[Tools$].[Store Number]=[Location$].[Store Number]'

' AND[Auto$].[Store Number]=[Location$].[Store Number]'.

上面的代碼和從資料庫中讀取表數據完全一樣,只是在/CONNECT語句上做了些許變化,其他的並無區別,當然重點還是後面的提取數據變量語句/SQL,這裡要說明的是如果提取變量字符中含有空格的話就需要用[ ]給框起來了,正如上面示例代碼所示。

另外,不得不提的是從多表中讀取數據較從單表中讀取數據的一些局限性,比如不能像單表一樣隨意選擇數據讀取範圍;讀取表中的第一行非空字符都將強制讀取為SPSS中的變量;變量類型較單一,只提供了數字和字符兩種數據類型等等。

TIPs:不管採用何種方式讀取EXCEL文件,一定要注意變量格式問題。

相關焦點

  • 三種方法高效讀取xls/xlsx格式文件
    今天來學習下怎麼將xls/xlsx格式文件中的數據導入到R中。主要介紹三種方式。下面讀取的數據文件默認放置於工作目錄中。在讀取數據前,可以先閱讀這篇文章(猛戳:Excel數據導入R前的注意事項),將Excel中的數據進行預處理,方便讀取以防出錯。另外spss、sas、stata等軟體的數據格式文件導入請參見這篇文章(猛戳:R語言統計與繪圖:數據的輸入與輸出)。
  • 利用Python讀取外部數據文件
    作者:劉順祥個人微信公眾號:每天進步一點點2015不論是數據分析,數據可視化,還是數據挖掘,一切的一切全都是以數據作為最基礎的元素
  • 利用pandas讀取格式不規範的Excel文件
    介紹pandas 很容易將Excel文件讀取為DataFrame,但是在現實中,Excel文件裡面的數據格式往往是不規範的
  • 【每天學點應用軟體】SPSS數據分析:語法應用之數據處理(一)
    SPSS素來以其GUI操作的便捷性而聞名,但是在處理重複性問題和摸板型問題上,使用syntax語法操作則有其得天獨厚的優勢,這裡給大家推薦的是SPSS利用syntax語句處理數據的系列文章
  • 用PHP讀取excel文件內容、獲取單元格數據
    每天獲取最新的編程小知識!源 / php中文網      源 / www.php.cn本篇文章主要介紹如何使用PHP讀取excel文件內容即每個單元格數據,希望對大家有所幫助。可以使用它來讀取、寫入不同格式的電子表格。
  • 如何在Visual Studio中創建excel並讀取數據
    在Visual Studio開發工具中,創建python項目,然後安裝xlwt和xlrd第三方庫,使用xlwt創建excel文件並寫入數據,使用xlrd讀取excel文件中的數據。導入xlrd和xlwt,配置文件編碼格式3、編寫xlwt創建excel文件,並寫入數據代碼
  • 使用Pandas讀取複雜的Excel數據
    問題緣起pandas read_excel函數在讀取Excel工作表方面做得很好。但是,如果數據不是從頭開始,不是從單元格A1開始的連續表格,則結果會不是很好。比如下面一個銷售表,使用read_excel讀取:
  • js讀取Excel報表文件
    進入正文:在實際開發中,經常會遇到導入Excel文件的需求,有的產品人想法更多,想要在前端直接判斷文件內容格式是否正確,必填項是否已填寫 依據HTML5的FileReader,可以使用新的API打開本地文件(參考這篇文章)FileReader.readAsBinaryString(Blob|File)FileReader.readAsText
  • 如何用PHP讀取excel文件內容、獲取單元格數據
    可以使用它來讀取、寫入不同格式的電子表格。②time() 返回當前時間的秒數的函數,用來獲取當前的系統時間③require_once 為了避免重複加載文件即加載文件一次④array()創建數組⑤memory_get_usage
  • 用R語言讀取EXCEL文件的方法
    資深表哥/表姐們都知道,Excel自帶數據統計功能,但卻處理不了大數據集。而CSV與TXT格式的文件,雖然容量大,但由於是純文本文件,所以不具有數據處理的功能。        為了解決這一尷尬的問題,下面我就教一下大家怎麼用統計專業的R語言來讀取數據(數據處理之前很重要的一個步驟)        用R讀取excel文件中的數據,需要先搭建一個Java的環境(配置好JDK),然後再用 install.packages("xlsx") 指令導入相關的包(常見的Excel文件格式是xlsx,而處理xlsx文件這個包是使用Java語言來寫的
  • 如何讀取文本數據
    常見的數據有txt、excel、csv、mat等,也有圖片、特殊數據格式的。如果是其它一些程式語言,比如c,你要做的話,得去了解這些文件編碼格式,從底層一點一點往上爬。想想就頭大。但是python不一樣,因為它有豐富的第三方庫。只要你會用這個庫,讀取文件就可以說是輕而易舉了。
  • (實用篇)PHPExcel讀取Excel文件的實現代碼
    以下是文章分享1群,由於群人數已超過100,不能掃碼進群,這個任務呢,就由小篇來拉你們進群了,掃描下面二維碼,加小篇好友~用PHPExcel讀取Excel 2007 或者Excel2003文件,需要的朋友,可以參考下。
  • 基於python的大數據分析-pandas數據讀取(代碼實戰)
    長按上方二維碼加入千人QQ群基於python的大數據分析實戰學習筆記-Anaconda基於python的大數據分析實戰學習筆記-pandas(數據分析包)基於python的大數據分析實戰學習筆記-pandas之DataFrame我們常見的數據存儲格式無非就是csv、excel、txt以及資料庫等形式
  • 手把手教你批量讀取數據文件
    曾經有網友問我如何讀取磁碟中數個文件的數據,並把這些數據合併到一張數據表中。
  • 《pandas數據讀取》
    ,需要使用不同的函數讀取,pandas內置了10餘種數據源讀取函數和對應的數據寫入函數,常見的數據源有3種,分別是資料庫數據,文本文件(包含一般文本文件和CSV文件)和Excel文件,掌握這三種數據源讀取方法,便能夠完成80%左右的數據讀取工作。
  • n種方式教你用Python讀寫Excel等數據文件
    (包含txt、csv等)以及.gz 或.bz2格式壓縮文件,前提是文件數據每一行必須要有數量相同的值。,可以讀取各種各樣格式的數據文件,一般輸出dataframe格式。如:txt、csv、excel、json、剪切板、資料庫、html、hdf、parquet、pickled文件、sas、stata等等read_csv方法read_csv方法用來讀取csv格式文件,輸出dataframe格式。
  • Matlab—Excel數據的讀取
  • n種方式教你用python讀寫excel等數據文件
    (包含txt、csv等)以及.gz 或.bz2格式壓縮文件,前提是文件數據每一行必須要有數量相同的值。,可以讀取各種各樣格式的數據文件,一般輸出dataframe格式。如:txt、csv、excel、json、剪切板、資料庫、html、hdf、parquet、pickled文件、sas、stata等等read_csv方法read_csv方法用來讀取csv格式文件,輸出dataframe格式。
  • 乾貨 | 用 pandas 讀取 csv 和 Excel 數據
    本文採用真實的股票數據作為案例,教你如何在Python中讀取常用的數據文件。數據文件 listings.xlsxhttps://github.com/fishstar/Data-Analysis-Practice/blob/master/import%26manage_data_in_Python/listings.xlsxcsv文件用逗號來分隔數值,是常用的數據格式之一,其具體形式可參考上面給出的數據文件。
  • 使用Python對Excel多sheet合併與大規模數據集讀取,看這一篇就夠了
    問題描述在日常工作中,我們可能會遇到一些 Excel 文件,其中會有多個 sheet,每個 sheet 中的數據結構都相同,在分析的時候需要合併後再處理。如果文件數據量較小倒還好,萬一遇上幾百幾千萬行的多 sheet 的 Excel 文件,光是打開就要卡死老半天,更不要提處理數據了。本文就如何提高大數據量 Excel 多sheet 文件時的讀取效率,運用 Python 工具進行解決。