柳小白Python學習筆記33 Excel表格處理1

2021-01-07 一直在學習的柳芽兒

從今天起開始學習使用python的pandas模塊處理Excel表格。

以「光大2020年1月.xls」為例,此工作薄包含「bwz」和"wz"兩個工作表。下圖展示的是第二個工作表即「wz」工作表。

33-1

首先打開「2020年1月.xls」工作簿,需要使用pandas.read_excel( ),這個函數有許多參數,本次用到「io」和「sheet_name」兩個參數:

io參數,表示要打開的文件的路徑;

sheet_name參數,表示要打開的工作表的整數索引(從0開始)或名稱,默認為0。

打開excel工作表演示代碼如下:

# 導入pandas模塊並取別名為pd

import pandas as pd

# 打開光大2020年1月.xls的第二個工作表

bwz = pd.read_excel('光大2020年1月.xls',

sheet_name=1)

# sheet_name= 'wz'和 sheet_name=1作用相同

print(bwz)

運行結果如下:

33-2

結合圖33-1,33-2我們可以看到以下幾點:

運行結果顯示「20 rows×7 columns」(列表有20行7列),所以讀取的是有效行和列的值,但列的內容中間都以省略號表示。交易日期的時間顯示和工作表「wz」不同;第一行的表頭被作為了列索引的開始,其他列索引都顯示「 Unnamed」(未命名);表格內空白的單元格都被填充了"NAN";怎麼讓隱藏的列內容顯示呢?只需要設置展示數據寬度,代碼如下:pd.set_option('display.width',None)

我們平時下載對帳單後,一般只需要用到交易日期以後的內容。而且對帳單經常會很長,也沒有必要把全部內容都列印出來。這時候我們就要知道這個工作表的大小(幾行幾列)及有用數據區域。這裡用到shape和head方法。

shape:用來查看工作表的大小

head(n):預覽工作表前幾行,參數n表示預覽到第幾行。不傳入參數,默認預覽前5行。

代碼展示:

# 查看工作表大小

print(bwz.shape)

# 預覽工作表前幾行

print(bwz.head())

33-3

從圖33-3的運行結果可以看到這個工作單的行和列數及前5行信息。

今天就學習到這裡,明天繼續使用pandas模塊對這個工作表進行操作。

相關焦點

  • 柳小白Python學習筆記 23 xlrd6日期讀取
    在柳小白Python學習筆記 22文末提到,只讀取「bwz」工作表中日期的年月日,而且還想和工作表中的格式一樣,今天就來解決這兩個問題吧。首先導入需要用到的模塊xlrd和datetime,讀取「光大2020年1月.xls」工作薄中的「bwz」工作表。沿用筆記22循環輸出datetime格式日期的例子。
  • 放棄Excel,學習Python的理由,1個案例領略Python處理表格的魅力
    前面內容,我們講了一些關於Python處理Excel文件的案例。Excel表格處理老司機教你:使用Python處理電子表格公式的正確姿勢真實案例引發的思考,如何分組統計電子表格數據,Python輕鬆搞定Excel表格搬到Python界面上?可以實現!
  • 柳小白Python學習筆記34 pandas對Excel表格基本信息的查看
    想要高效快捷地處理一件事情,就要在處理前對它有所了解。昨天我們對'光大2020年1月.xls'工作薄中的「wz」工作表做了大致的了解。知道了它的數據有幾行幾列及前五行的內容,但是這種程度的了解遠遠不夠。
  • 柳小白Python學習筆記35 Excel之科學計數法類型轉換及數據選取1
    昨天學習了使用pandas模塊如何查看Excel工作表「wz」的基本信息。今天學習,轉換數字科學計數法格式及提取需要處理的數據,接下來就進入今天的學習吧。一、轉換科學計數法格式在昨天的學習中,不知道大家有沒有發現有列數據是依科學計數法的格式顯示的,這是因為這列數字太長,默認這樣顯示。大家知道在Excel中我們把單元格設置為文本類型來輸入這些長數字,在python這種方法同樣適用。
  • Python讀寫Excel表格,就是這麼簡單粗暴又好用
    最近在做一些數據處理和計算的工作,因為數據是以.csv格式保存的,因此剛開始直接用Excel來處理。但是做著做著發現重複的勞動其實並沒有多大的意義,於是就想著寫個小工具幫著處理。以前正好在一本書上看到過使用Python來處理Excel表格,可惜沒有仔細看。於是我到處查找資料,基本解決了日常所需,終於算是完成了任務,因此撰寫此文就算是總結吧,主要記錄使用過程的常見問題及解決。
  • Python讀寫Excel表格,就是這麼簡單粗暴又好用(文末送書)
    來源 | 戀習Python(ID:sldata2017)最近在做一些數據處理和計算的工作,因為數據是以.csv格式保存的,因此剛開始直接用Excel來處理。但是做著做著發現重複的勞動其實並沒有多大的意義,於是就想著寫個小工具幫著處理。以前正好在一本書上看到過使用Python來處理Excel表格,可惜沒有仔細看。
  • 未明學院:用excel不好嗎?為什麼還要學python?
    在大數據背景的今天,面對千萬條以上動輒成百上千G的數據,單用excel難免顯得力不從心,越來越多的人將關注點轉向python。1、易踩坑!而python在數據處理的量級和性能上明顯高於excel,對python來說,只需調用drop_duplicates方法就可以輕鬆處理大批量數據,無需擔心軟體崩潰異常退出。
  • 【校園雜工】Python腳本處理檔案圖片之完結篇:Python處理Excel
    這是一個系列的文章,這是第三篇,前兩篇的連結如下:【校園雜工】Python腳本處理檔案圖片之一【校園雜工】Python腳本處理檔案圖片之二任務描述給定一個文件夾,其中有大量圖片(沒有子文件夾)需要做的是:圖片處理在前面兩篇文章裡,我們已經學習了用內置庫 os提供的方法遍歷該文件夾下所有的圖片,並利用 pillow模塊提供的類和方法得到所有圖片的縮略圖
  • 如何使用Python批量化處理Excel——零基礎入門指南
    本教程旨在幫助零編程基礎,但是又有「批量化處理Excel表」這種需求的大家。 在進入教程時,請確保你具有以下資質: 1、 並非工作壓到頭上了,急需解決一批表所以想過來速成,而是願意耐心花上幾個小時學習來獲得一項長久性的技能。
  • 適合新手的 python pandas 學習筆記(2)
    回顧一下昨天的學習筆記在適合新手的 python pandas 學習筆記(1)中,準備工作已經完成。
  • 柳小白Python學習筆記 7 循環語句學習
    昨天學習的是條件語句,今天開始學循環語句。在python中我們可以使用循環語句讓某個語句或代碼組多次執行。這時就會會用到for和while語句。在python中循環語句用於循環執行程序,來處理需要重複處理的任務。
  • 柳小白Python學習筆記32 pandas之表格型數據結構的創建
    32-2二、默認索引的表格型數據結構的創建2.1 由單個列表創建的表格型數據結構前面學習了由單個列表創建的Series數據結構,現在用列表['a', 'b', 'c', 'd'],分別創建bg_1表格型數據結構和Series數據結構num_1,兩者做個比較。
  • 文職美女上班手動用Excel表格太麻煩,當學會python後easy操作
    通過程序操作excel表格是編程中比較常見的操作,python本身不能直接操作excel,需要安裝第三方的模塊來實現excel的操作。Python中可以操作excel模塊主要有:1、xlrd 模塊實現exlcel表格讀取2、xlwd 模塊實現excel表格創建和寫入3、pandas模塊也可以實現excel常規操作
  • 利用python操作Excel教程
    很多人都會使用excel來對數據做處理,但隨著python的日益強盛,不甘落後的我們也可以用python來完成這些工作,該教程目的是教會您用Python腳本來對excel做處理。案例一:以下是創建Pandas數據框並使用該to_excel() 方法將該數據寫入Excel文件的簡單示例 :結果顯示:
  • Python3 量化分析筆記小白到破產-列表進階 切片組合
    這些操作包括:索引(前面已經講過)切片組合(加、乘)成員檢測(前面也講過)成員遍歷長度和最值下面,我們開始一個一個的來學習這些具體的實現方法。1、索引索引在之前已經講過了,索引的序號從0開始,並且用「[ ]」括號將序號擴起來,放在對象的後面,表示該列表對象中的具體某一個值。stock_list[5] 表示stock_list中的第6個元素。
  • PDF轉EXCEL,python的這個技能知道嗎?
    當在pdf上看到自己想用的表格,卻無法將其複製下來的時候,只能默默地打開excel對照著pdf表格的形式敲打出來,既費時又費力!這裡介紹如何用python程序將pdf上的表格自動轉化為excel表!1.使用的庫簡單介紹一下要使用的庫:pdfplumber 和xlwt1.pdfplumberpdfplumber使用來解析pdf的文字與表格。
  • Python利用openpyxl處理excel文件(openpyxl的安裝及簡介)
    但是試想,如果把上述excel公式變成諸如python中的if-else結構,其可讀性肯定是不容置疑的……今天,我們來介紹一款excel處理利器—openpyxl(python庫文件)。>(四)對excel文件中單元格及行列的操作;(五)在excel文件中公式及圖表的簡單操作;(六)在excel文件中印表機及列印選項設置;(七)使用Pandas和Numpy在excel中進行數據操作。
  • 堪比python、秒殺Excel表格,這個數據分析工具太猛了
    這是一個老生常談的話題,網上很多人都推薦去學習SQL、Excel的VBA、python這些語言。但其實並不是所有人都適合這些語言,很多業務人員和運營人員根本不會去學這些東西,他們不熟悉編程和代碼,沒有必要花時間學習這麼專業的軟體。
  • 如何用Python增強Excel,減少處理複雜數據的痛苦?
    1.在Excel中可以創建自定義函數,而不必學習VBA(如果讀者還不知道的話)2.用戶對Excel很滿意3.使用Python可以顯著加快數據操作4.在Python中,幾乎所有東西都有庫(機器學習、數據科學等)
  • Python辦公自動化| word 表格轉excel
    之前寫過一篇 Python辦公自動化 | 批量word報告生成工具 ,有小夥伴提出了逆向需求,即:從批量word中獲取內容並寫入excel,需求背景是匯總一些材料,舉例:實習鑑定表、個人簡歷、檔案等。實際需求是這樣的,現在有如下格式的若干word文檔,需要錄入標黃信息到excel,手工錄入效率太低了,能不能用python實現呢?