如何使用Python批量化處理Excel——零基礎入門指南

2021-01-07 騰訊網

本教程旨在幫助零編程基礎,但是又有「批量化處理Excel表」這種需求的大家。

在進入教程時,請確保你具有以下資質:

1、 並非工作壓到頭上了,急需解決一批表所以想過來速成,而是願意耐心花上幾個小時學習來獲得一項長久性的技能。

2、 能熟練使用搜尋引擎,明白絕大部分你產生的問題和出現的錯誤都可以在百度上找得到。

對於「用Python批量化處理Excel表」這件事,你應當具有如下認識:

Excel本身也是可編程的,當你點擊一個單元格,寫下一個函數,定義它是SUM,然後依次點擊幾個單元格,Excel自動給你求和時,你就完成了一次編程。這個過程對於不會使用計算機的人來說可能匪夷所思,但是對於常年和office打交道的我們來說其實很簡單易懂。完成一次這樣的簡單編程,我們並不用去了解Excel到底s是怎麼實現這個函數的,我們只用選擇一個函數,比如SUM,然後選擇幾個我們要計算的單元格即可得到我們想要的結果。Python也是這樣的,它已經有了非常強大和完備的函數庫,我們只需要調用函數,然後修改參數,就可以用Python來處理我們自己的表格,它與Excel的區別無非就是沒有可視化圖形界面而已,你選不中單元格,沒有各種菜單選項給你點,你只能手動敲擊文本,但當你學習明白函數、參數、返回值、變量等概念,你就能像使用excel那樣使用命令行來進行python編程,並驚嘆於其強大。

對於這個教程本身,你當有這樣的覺悟:

教程並非介紹完了預備知識才開始實踐,而是一鼓作氣的實踐到最後,這個過程中,你將會因為欠缺預備知識而感到不適,但也會因此快速的具備對python處理excel這件事的直觀印象和理解,你將在配置好開發環境並且動手實踐過後,再來補充學習自己所需的基礎知識。所以本教程鼓勵你對不了解的名詞和概念都百度一下(比如先了解一下到底什麼是python),但不要受限於此。

而學完本教程將使你做到:

1、 安裝好Python

2、 安裝好Python下用於處理Excel表的相關工具

3、 進行一次「Python批量化處理Excel表」實踐

4、 自行練習和實踐後,擁有「遇到特定問題後百度相關函數即可自行寫出相應程序」的能力

Here we go!

安裝Python

首先百度python,進入官網

在Download下點最新版的python

在下載頁面拉到最後,可以選取下載哪個安裝包。

X86-64是AMD的CPU,x86是inter的CPU,因為AMD是兼容inter的,所以大家下X86-64即可。而executable installer的意思指下載下來的安裝包是個exe文件。

於是就得到了python的安裝包

雙擊打開進行安裝,這裡記得勾選把python添加進環境變量,這是個很重要的選項,如果這裡不勾選,安裝結束後我們還要手段添加環境變量。之後我們Install Now自動安裝即可。

安裝結束,我們搜索python,能看到剛才安裝好的python的idle。

Idle的意思是集成開發環境。也就是說這個東西把編程過程中的編輯、編譯、運行等過程全部集中起來了。我們只要打開這個像是文本編輯器一樣的東西,輸入命令,然後點擊運行,就能完成整個編程過程。

點擊idle打開是這個樣子的。

我們試一試:輸入 print(『HellowWorld』),敲下回車,屏幕上會列印出HelloWorld。

安裝Python下處理Excel表的庫

現在我們擁有了python,相當於擁有了錘子、扳手、斧頭等等所有的基礎生產工具了,理論上我們可以創造萬事萬物了!但是,想用這些東西去修房子也太乏力了,而python的強大之處在於,別人基於這些基礎的生產工具二次開發出來的高級生產工具,我們也可以直接拿來用。意思是,我們可以用python導入別人寫好的庫/包,來進行更為方便的生產開發,這意味著只要你想,你就可以獲得推土機、起重機、腳手架等工具來修房子。

而python下導入庫(別人寫好的工具包),需兩個步驟,一個是安裝,一個是編程時導入。接下來我們就安裝python下一個很好用的excel處理包,叫pandas。現在高版本的Python都自帶了pip(python自動化安裝工具),所以安裝包將會變得非常簡單。

我們需要徽標鍵(就是Ctrl和Alt中間那個)+R,然後輸入cmd,點擊回車,打開命令行程序。

在cmd裡,輸入pip install pandas,意思就是用pip(python自帶的安裝包的工具)來安裝(install)名字叫做pandas的包。敲擊回車後,就可以在命令行界面看到安裝開始了。

當你看到successful,意味著pandas包就已經裝好了。

這個時候我們打開idle試試當我們import(導入)一個未安裝的包時,會報錯,但是當我們import剛才已經安裝好的包時,沒有提示信息,說明導入成功了。

當然,為了使用pandas包,我們還需要pip安裝一些別的包,不過這裡按下不表,在下一節遇到錯誤時,我們再回頭安裝。

動手寫一個處理Excel的python腳本!

至此,開發環境我們就已經配置好了。為了能使python腳本可以不添加路徑就讀取到表格文件,我們配置一個理想的實驗環境,新建一個文件夾,把Excel表和Python腳本放在一起。

創建python文件,可以在idle下Ctrl+N新建一個文件,然後在file菜單下面選擇save as另存為進你想要的文件夾。而對於一個py腳本,雙擊是直接運行,你想要編輯它的話,需要右鍵然後點擊Edit with IDLE。

接著打開表和py腳本。我們通過編輯腳本並運行,來將這個表篩選一下,把居住地不是貴州的人員給刪掉。

這樣寫:

並敲擊F5運行

報錯了,說要裝xlrd,那我們接著用cmd上pip install xlrd

成功後再回來運行腳本

又說要openpyxl包,接著裝唄~

成功後再去運行腳本

沒報錯,說明成功了(這是因為pandas包相當於是基於諸如openpyxl這些包再二次開發出來的工具,所以我們用到相關函數時,需要先裝好這些基礎包。正是因為這些工具包的不斷迭代,python才變得異常強大)。

打開文件夾多出了個新表,打開

的確是我們想要的數據(把居住地不是貴州的人員給刪掉了)。

下面解釋一下代碼

現在,你改改參數。

比如這樣

你會發現文件夾多了我們想要的表

這裡你可以思考一下,你改了什麼參數,達到了什麼目的呢?

接下來我們再試一試批量化操作。

此時的文件夾

改出一個新的腳本:

運行後發現所有表裡的姓名為毛豆的行都被刪掉了。

解釋一下代碼

(你試試修改參數復刻一下這個操作?)

接下來你如何擁有自己解決問題的能力?

如果你沒有編程基礎但還是跟著操作了一遍到這裡,我相信這過程中你肯定會遇到許多未知錯誤和困難,但如果你運用搜尋引擎或者自己相關的儲備知識搞定了,我認為你足以證明自己接下來將會通過短暫又迅速的學習,快速上手一些簡單的批量化表格處理工作。

為此,你需要補充的知識是:

學習python,起碼知道什麼是變量、什麼是參數、什麼是返回值、什麼叫字符串等等基礎知識。這個過程不會花費很多時間,但是足以讓你能夠成功抄到代碼。不然就算你搜到了實現某個功能用什麼函數,你也無法正確的修改參數得以應用。

學習pandas,起碼知道python讀取一個excel表是以怎樣的一個結構存儲和操作的,這將使你能夠擁有組合各項操作命令來實現自己特定目標的能力。

熟練使用搜尋引擎,把自己想要完成的某個任務劃分為更為具體的目標,對於每個目標,都去百度搜如何使用python使用pandas實現,把別人的代碼copy下來,修改參數應用在自己的腳本裡面,依次完成這些小目標,從而攻克自己要完成的大任務。

比如你這樣搜:

就會有大把簡單易行的方案:

練習和實踐,找一個實際問題,自己嘗試去解決它,在這個過程中,把任務分而治之,克服困難,耐心去學習自己欠缺的知識。只要完成兩個簡單的小項目,你的能力就已經迭代起來了,並會從這個過程中感到爽快和滿足,接下來就真正擁有了「遇到特定問題後百度相關函數即可自行寫出相應程序」的能力。

相關焦點

  • 零基礎入門學習python
    零基礎入門可以學習python嗎?書聲琅琅Python培訓徐老師介紹,很多的朋友諮詢徐老師,想知道如果自己是零基礎的話,到底要如何快速學習Python,由於Python的作用非常大,我們知道PYTHON有全棧課,PYTHON有人工智慧課,今天我們來介紹一下小白如何最快學會寫簡單Python爬蟲。
  • 利用python操作Excel教程
    很多人都會使用excel來對數據做處理,但隨著python的日益強盛,不甘落後的我們也可以用python來完成這些工作,該教程目的是教會您用Python腳本來對excel做處理。案例一:以下是創建Pandas數據框並使用該to_excel() 方法將該數據寫入Excel文件的簡單示例 :結果顯示:
  • 【校園雜工】Python腳本處理檔案圖片之完結篇:Python處理Excel
    這是一個系列的文章,這是第三篇,前兩篇的連結如下:【校園雜工】Python腳本處理檔案圖片之一【校園雜工】Python腳本處理檔案圖片之二任務描述給定一個文件夾,其中有大量圖片(沒有子文件夾)需要做的是:圖片處理在前面兩篇文章裡,我們已經學習了用內置庫 os提供的方法遍歷該文件夾下所有的圖片,並利用 pillow模塊提供的類和方法得到所有圖片的縮略圖
  • 如何使用 Pandas 讀寫Excel
    本文與NumPy圖解  NumPy正確食用指南  十分鐘入門潘大師(Pandas)搭配使用更好哦。
  • Python自動化如何處理excel文件數據
    python文件中嗎?應對這一問題,可以將數據寫excel文件,針對excel 文件進行操作,完美解決。本文僅介紹python對excel的操作。安裝xlrd 庫xlrd庫 官方地址:https://pypi.org/project/xlrd/pip install xlrd
  • Python利用openpyxl處理excel文件(openpyxl的安裝及簡介)
    但是試想,如果把上述excel公式變成諸如python中的if-else結構,其可讀性肯定是不容置疑的……今天,我們來介紹一款excel處理利器—openpyxl(python庫文件)。根據openpyxl官方文檔,結合個人近年來使用心得,總結openpyxl應用中以下幾個知識點:(一)openpyxl的安裝、導入及相關注意事項;(二)對excel文件的打開、讀寫、編輯、保存相關;(三)對excel文件中樣式的編輯;
  • 如何快速學會Python處理數據?(5000字走心總結)
    今天我分享一些自己學習Python的心得,並用一個案例來說明python解決問題的基本思路和框架。1 如何學好Python 1.1 明確自己的需求(最好是剛需)聽到別人說Python很牛很厲害,也想跟著學,這樣的人肯定是學不好python的。沒有明確的需求和動力,就會導致你學python兩天打魚三天曬網,沒有恆心也沒有決心。
  • Python 用xlwings庫處理Excel
    xlwing庫在網上查看了一些python處理excel庫資料,參考相關內容《Python讀寫Excel文件第三方庫匯總,你想要的都在這兒
  • Python神器Pandas讀取excel
    學習python是以處理和分析數據為目的,避不開要接觸Pandas庫,這個庫非常之強大首先介紹一下這個庫
  • 如何用Python增強Excel,減少處理複雜數據的痛苦?
    當然,可以使用ExcelVBA來解決這些問題,但是在2020年,幸運的你不必這麼做了!如果有辦法把Excel和Python集成在一起,Excel……就會插上翅膀!現在有了。一個名為xlwings的python庫允許用戶通過VBA調用python腳本並在兩者之間傳遞數據。
  • 像Excel一樣使用python進行數據分析
    Excel是數據分析中最常用的工具,本篇文章通過python與excel的功能對比介紹如何使用python通過函數式編程完成excel中的數據處理及分析工作。在Python中pandas庫用於數據處理,我們從1787頁的pandas官網文檔中總結出最常用的36個函數,通過這些函數介紹如何通過python完成數據生成和導入,數據清洗,預處理,以及最常見的數據分類,數據篩選,分類匯總,透視等最常見的操作。文章內容共分為9個部分。這是第一篇,介紹前3部分內容,數據表生成,數據表查看,和數據清洗。
  • Python零基礎入門在線課程 | Crossin的編程教室出品
    Python零基礎入門入門課程面向沒有編程基礎或剛剛接觸編程的學習者。課程教學內容大約 50 個學時。除課程內容外,還需要通過練習來鞏固所學的編程知識。對於新手,建議先按照課程列表依次學習,至少完成前八章,掌握 Python 的編程基礎。
  • Python視頻教程網課編程零基礎入門數據分析網絡爬蟲全套Python...
    因篇幅有限,以下展示的只是課程裡部分內容如對python課程有更多疑問 請諮詢客服 1零基礎入門全能班 01 –python簡介 02 第一個程序 03-python執行方式和pycharm設置 04-程序的注釋和算術運算符 05 程序執行原理 06變量的使用以及類型 07
  • 放棄Excel,學習Python的理由,1個案例領略Python處理表格的魅力
    前面內容,我們講了一些關於Python處理Excel文件的案例。Excel表格處理老司機教你:使用Python處理電子表格公式的正確姿勢真實案例引發的思考,如何分組統計電子表格數據,Python輕鬆搞定Excel表格搬到Python界面上?可以實現!
  • PDF轉EXCEL,python的這個技能知道嗎?
    當在pdf上看到自己想用的表格,卻無法將其複製下來的時候,只能默默地打開excel對照著pdf表格的形式敲打出來,既費時又費力!這裡介紹如何用python程序將pdf上的表格自動轉化為excel表!1.使用的庫簡單介紹一下要使用的庫:pdfplumber 和xlwt1.pdfplumberpdfplumber使用來解析pdf的文字與表格。
  • Python使用xlrd和xlwt讀寫Excel的簡單用法
    數據處理是 Python 的一大應用場景,而 Excel 則是最流行的數據處理軟體。
  • 使用Python將數據保存到Excel文件
    ,Pandas 前面,我們已經學習了如何從Excel文件中讀取數據,參見: 接下來,要知道的另一件重要事情是如何使用Python將數據保存回Excel文件。但是,這並不妨礙我們使用另一種語言來簡化我們的工作 保存數據到Excel文件使用pandas將數據保存到Excel文件也很容易。最簡單的方法如下:df.to_excel(),它將數據框架保存到Excel文件中。
  • python中讀取和寫入EXCEL
    必要的條件還是要有的,安裝好python,因為需要使用兩個模塊xlrd和xlsxwriter,兩個模塊安裝比較簡單直接:pip install xlrdpip install xlsxwriter 可以快速的安裝一、讀excel文件的代碼:# todo 對excel的操作import
  • 如何用python實現excel中的vlookup功能?
    因為刀哥是python初學者,對於需要用到的知識點,如果以前學過的要再複習一下,年紀大了嘛記性比較差,沒學過的新知識點要先學習一下,邊學邊用,所以做的速度比較慢,但是好在,哪怕慢,只要每天進步一點點,都是好的。今天這篇分享,就是刀哥在做的過程中,遇到的其中一個知識點,即用python來實現excel中的vlookup函數功能。
  • 自從學會了Pandas,我用Python處理Excel更高效了
    功能極其強大的數據分析庫可以高效地操作各種數據集csv格式的文件Excel文件HTML文件XML格式的文件JSON格式的文件資料庫操作2.經典面試題通過面試題引出主題,讀者可以思考,如果你遇到這題,該如何解答呢