從今天起開始學習使用python的pandas模塊處理Excel表格。
以「光大2020年1月.xls」為例,此工作薄包含「bwz」和"wz"兩個工作表。下圖展示的是第二個工作表即「wz」工作表。

首先打開「2020年1月.xls」工作簿,需要使用pandas.read_excel( ),這個函數有許多參數,本次用到「io」和「sheet_name」兩個參數:
io參數,表示要打開的文件的路徑;
sheet_name參數,表示要打開的工作表的整數索引(從0開始)或名稱,默認為0。
打開excel工作表演示代碼如下:
# 導入pandas模塊並取別名為pd
import pandas as pd
# 打開光大2020年1月.xls的第二個工作表
bwz = pd.read_excel('光大2020年1月.xls',
sheet_name=1)
# sheet_name= 'wz'和 sheet_name=1作用相同
print(bwz)
運行結果如下:

結合圖33-1,33-2我們可以看到以下幾點:
運行結果顯示「20 rows×7 columns」(列表有20行7列),所以讀取的是有效行和列的值,但列的內容中間都以省略號表示。交易日期的時間顯示和工作表「wz」不同;第一行的表頭被作為了列索引的開始,其他列索引都顯示「 Unnamed」(未命名);表格內空白的單元格都被填充了"NAN";怎麼讓隱藏的列內容顯示呢?只需要設置展示數據寬度,代碼如下:pd.set_option('display.width',None)
我們平時下載對帳單後,一般只需要用到交易日期以後的內容。而且對帳單經常會很長,也沒有必要把全部內容都列印出來。這時候我們就要知道這個工作表的大小(幾行幾列)及有用數據區域。這裡用到shape和head方法。
shape:用來查看工作表的大小
head(n):預覽工作表前幾行,參數n表示預覽到第幾行。不傳入參數,默認預覽前5行。
代碼展示:
# 查看工作表大小
print(bwz.shape)
# 預覽工作表前幾行
print(bwz.head())

從圖33-3的運行結果可以看到這個工作單的行和列數及前5行信息。
今天就學習到這裡,明天繼續使用pandas模塊對這個工作表進行操作。