慢步python,教你怎麼通過python編程來修改word文檔內標題

2020-12-25 地鐵慢步

大家好,這裡是地鐵慢步,快慢的慢,因為筆者業餘學的python編程,學得的確也算是慢,慢不打緊,一直在進步就好。

今天想教大家怎麼實現通過python編程來修改word文檔。熟悉word的人,可能會覺得多此一舉,直接用OFFICE或者WPS就可以了啊,幹嘛要用python?

慢步在工作中也有用到word,而且很大一部分時間都是在做重複性工作,而且上班用的不是自己的固定電腦,也不好用word宏。這樣慢步有個設想,通過python創造一個小型程序,進行word文檔的批量修改。

現在先實現第一個簡單的功能:修改word文檔內標題。

先創建有一個Word文檔。

慢步隨便搜索了一個通知,複製粘貼到新建的word文檔中,保存為標題的名字。文檔暫時保存在桌面吧。

新建項目、py文件、置入word文檔

用慢步喜歡的IDE(集成開發環境)pycharm,打開pycharm,新建一個項目。

File - New Project

新建一個changeheadline的項目。

如圖,打開目錄,點第二個DeskTop(桌面),新建一個文件夾,再輸入框內輸入文件夾的名字changeheadline。點OK,再點OK,再點右下角Create(創建)。

之後再跳出一個打開新project的提示,選擇ThisWindows(這個窗口)就好。

項目建好了,接著建一個同名的changeheadline.py。

在pycharm內項目目錄處右鍵-New-Python File 輸入py文件名changeheadline即可。

如對新建py文件有疑問可以回看作者的文章pycharm的基本操作,創建項目,新建py文件,編寫代碼及保存

因為路徑問題太複雜,咱選擇一種簡單的方式,把需要修改的word文檔放進項目文件夾裡(即,我們桌面上changeheadline文件夾)

python庫的引用,引用python-docx庫

python程序經常使用已有的功能代碼,這個過程叫引用。

python自帶很多標準庫,比如turtle庫,可以進行基本的圖形繪製;比如time庫,可以處理時間。import time 就可以引用time庫,在後續程序編寫中可以調用time庫的功能。

作為開源的程式語言,python也有很多第三方庫。其中python-docx庫,就是一個可以處理word文檔的庫。功能強大,但慢步找不到漢化版是python-docx庫使用手冊,只能自己到官網閱讀。

標準庫可以直接引用。但第三方庫,需要安裝到電腦上才能引用。不用擔心,pycharm很強大的,直接省了很多複雜的步驟,你可以在pycharm直接安裝第三方庫。

上圖就是慢步已安裝的庫文件。打開的方式為:

File - Setting - Project:changeheadline -Project Interpreter

打開翻譯器,看到窗體的主體部分有三列內容

Package(庫) Version(版本) Latest version(最新版本)

其中跟隨python 3.5.3 一起安裝的庫有兩個 pip 及 setuptools。

怎麼安裝第三方庫?

點Package(庫) Version(版本) Latest version(最新版本)右側的+

輸入想要的安裝的庫名稱python-docx

左下角Install Package(安裝庫文件)。等待安裝成功即可。

這時候,在py文件裡面輸入

import docx

就能實現引用python-docx庫。

實現我們的功能吧

單純描述有點難解釋,慢步選擇直接上圖

慢步寫好了代碼,並運行了。

運行的結果是:在pycharm列印了標題內容,修改標題並另存為相應的word文檔。如上圖。

可以打開新生成的文檔和原來文檔看看。

哈哈O(∩_∩)O哈哈~標題格式變了。

因為慢步這裡直接修改了文檔第一段的文本,如果不設定格式,python-docx庫會用它自己的默認格式。這比較坑了。

這個代碼:

"""word文檔標題修改程序作者:地鐵慢步日期:2020-4-7"""from docx import Documentd = Document("關於調整3月註冊國際投資分析師(CIIA)考試的公告.docx")print(d.paragraphs[0].text)changetotext = "word文檔標題修改程序測試標題"d.paragraphs[0].text = changetotextd.save("word文檔標題修改程序測試標題.docx")慢步決定再修改一下。把修改後的標題及保存的文件名再加個1,這樣就不會覆蓋之前產生的word文檔了。

代碼如下:

"""word文檔標題修改程序作者:地鐵慢步日期:2020-4-7"""from docx import Documentd = Document("關於調整3月註冊國際投資分析師(CIIA)考試的公告.docx")print(d.paragraphs[0].runs[0].text)changetotext = "word文檔標題修改程序測試標題1"d.paragraphs[0].runs[0].text = changetotextd.save(changetotext + ".docx")

再運行後,打開三個文檔,對比如下:

幸不辱命。標題格式還是原來那個。

在python-docx庫裡面,格式由run確定,這是比較難理解的。

代碼的解釋

from docx import Document實現docx庫Document功能的引用在寫這個簡單代碼時,其實也出過錯誤,比如引用庫的格式錯誤。大家注意到這裡引用多了一個from,意思是從python-docx庫裡面引用Document功能。即只引用庫裡面的一部分。

如果直接用import docx,那後面所有與docx庫文件有關的代碼都需要相應加上「docx.」比如第一句應該變為

d = docx.Document("關於調整3月註冊國際投資分析師(CIIA)考試的公告.docx")

d = Document("關於調整3月註冊國際投資分析師(CIIA)考試的公告.docx")打開文檔 關於調整3月註冊國際投資分析師(CIIA)考試的公告.docx 並把文檔賦值給變量d。之後的代碼中d代表這個文檔。print(d.paragraphs[0].runs[0].text)輸出顯示內容,文檔的,段落【0】即第一段的,run【0】的,文本(即標題內容)changetotext = "word文檔標題修改程序測試標題1"定義changetotext變量,賦值為文本內容"word文檔標題修改程序測試標題1"d.paragraphs[0].runs[0].text = changetotext把標題內容修改為changetotext變量的內容d.save(changetotext + ".docx")changetotext + ".docx"是字符串的運算,即把"word文檔標題修改程序測試標題1"與".docx"連在一起,得到"word文檔標題修改程序測試標題1.docx"d.save()就是關閉文檔d,括號內是保存的文檔名,數據類型是字符串,即帶雙引號文本。

有所收穫的話,給慢步點個讚唄。

相關焦點

  • 慢步學習,python編程實例中,對遍歷程序結構for語句的解析
    大家好,慢步繼續不定期更新通俗易懂的python編程學習內容。今天主要說說for語句。for語句是比較常見的語句,其實也算比較簡單的,多看幾個實例就可以了解。但慢步還是想囉嗦一些,跟大家解析一下。上圖,py文件代碼的功能是:輸出word文檔每段前10個字符。接著簡單解析一下這個實例的代碼。第1-5行,三引號內為注釋,供程式設計師閱讀。
  • 慢步python,說說import,引用功能代碼(功能庫、py文件代碼)
    今天慢步休息,繼續學習python語言。其實慢步已經將基礎和必要的python語言知識點寫了。就差手把手教了。今天想說說importimport是python語言的保留字,它能實現引用當前程序之外已有的功能代碼。python語言像積木,你可以根據你想要的功能,編寫一系列的代碼。比如筆者之前編寫的《word文檔標題置換》。
  • 使用 Python 操作 word文檔
    最近手頭有一個需求是對word文檔內容進行判斷,搜索到一個包感覺不錯,簡單記錄一下關鍵操作:python-docx能做什麼
  • 慢步學習,python庫文件概述,再來點第三方庫文件安裝的乾貨
    python庫文件是什麼?python的庫文件就是迄今為止,已經實證可以解決一定編程問題的代碼庫,所有python程序開發者都可以使用。就像哆啦A夢的百寶袋,你可以直接從這個百寶袋中取來「如意門」這個庫文件,通過正確使用這個庫文件,你就能按你心意,到達你想到達的地方。
  • Word 神器 python-docx
    首先想到 word 自身的替換功能,倒是能查到,但是沒法動態替換,即只替換兩邊引號,而不換中間內容;另外一種方案是,即用 VBA,通過編程來替換,雖說做過幾個項目,可好久不用,拾起費勁,再加上 VBA 中各種概念和用法,學習成本太高,放棄;
  • 【Python基礎】python使用python-docx操作word
    1、python-docx庫介紹該模塊兒可以創建、修改Word(.docx)文件;python-docx使用官網:python-docx官網我們在安裝此模塊兒使用的是pip install python-docx,但是在導入的時候是import docx;2、Python讀取Word文檔內容注意:每進行一個操作,必須保存一下,否則等於白做;1)word文檔結構介紹在這裡插入圖片描述2)python-docx
  • 第105天: Python 操作 Word
    標題文檔標題創建比較簡單,通過 Document() 創建出一個空白文檔,只要調用 add_heading 方法就能創建標題。('如何使用 Python 創建 Word',0)# 保存文件doc1.save('word1.docx')這樣就完成了創建文檔和文章標題的操作,下面通過命令 python word_1.py 運行程序,會生成名為 word1.docx 的文檔,打開文章顯示如下圖所示:
  • Python兩種基本數據類型:數值及字符串;python交互式運行環境
    慢步Python:輸出word文檔內每段前10個字,在編寫中學習知識點不是怎麼高大上,但乾貨還是有的嗯,對於學習編程的初學者來說。裡面用到很多python編程的知識點。筆者覺得有必要解釋一下。編程需要大量數據,為了編程方便,數據就分成了不同的類型,不同的數據類型有不同的特性。
  • 慢步學python,編程基礎知識,列表
    大家好,我百家號是:地鐵慢步,目前致力於python學習與分享。今天寫的是 python編程基礎知識: 列表python裡面最基礎的兩種數據類型是:數值和字符串。列表可以理解為一種數據結構。列,即有順序的隊列,有先後概念。
  • 慢步學python,編程基礎,字符串類型例子及輸出
    想了解python的安裝及運行的可以看慢步之前寫的文章。今天繼續python編程基礎內容,字符串類型數據。python裡面主要的數據類型是數值類型和字符串類型。計算機可以進行運算的是數值,字符串不能進行數學運算,像你在閱讀的文字,可以理解為字符串的一種。
  • 教你如何用python輕輕鬆鬆操作Excel、Word、CSV,一文就夠了,趕緊碼住!!!
    Excel 是通過 xlutils 庫的 copy 方法將原來的 Excel 整個複製一份,然後再做修改操作,最後再保存。寫入 Word平時我們在操作 Word 寫文檔的時候,一般分為幾部分:標題、章節、段落、圖片、表格、引用以及項目符號編號等。下面我們就按這幾部分如何用 Python 操作來一一介紹。
  • 如何用 Python 實現 Word 文檔操作?
    使用下列代碼新建文檔或者打開文檔doc = app.Documents.Add()doc = app.Documents.Open('你的Word文件路徑')3、Selection對象:選區:代表當前窗口的選區。它可以是文檔中的選擇(高亮)區域,也可以是插入點(如果沒有什麼被選中)。
  • 慢步學python,編程基礎知識,流程控制語句if
    慢步業餘學python編程,今天休息繼續分享python編程知識。面向過程編程,重要的是程序的流程,今天說說流程控制語句if。if結構python中常見的流程結構很多,if結構,在很多程式語言內也很常見。這個例子,先是敲入一個字符串變量a,然後放入判斷結構if裡面。type()函數可以得到括號內目標的類型。
  • Python編程基礎,數字及數學運算
    慢步越來越喜歡看「官網」了,一本python的二級教材大略看完,架構有了,發現還有很多細節沒有,網上各種網站找太複雜,這不,還是官網好。慢步去看了python的官網,純英文這個閱讀會比較難受,但收穫還是有很多的。發現了很多二級教材中沒有的細項內容。
  • Python自動化辦公(內容)
    操作pdf;python使用python-docx操作word;python使用python-pptx操作PPT;python如何自動收發郵件;python製作電話號碼歸屬地查詢工具;一:python操作excel1、openpyxl庫介紹2、python怎麼打開及讀取表格內容?
  • python 實用程序 | PDF 轉 Word
    現在網上有很多文檔是 pdf 格式,雖然這個格式閱讀起來很方便,並且裡面的內容不會亂掉,但相應的我們就無法修改裡面的內容。雖然現在市面上有很多 pdf 轉 word 軟體,比如 wps,但大多數的軟體是要收費的,並且價格不菲。前些天就有人叫我幫她把 pdf 文檔轉成 word 的文檔。
  • Python實戰009:讀取Word文檔中的表格數據及表格合併問題解決
    我現在要解析的word文檔中主要是表格、字符串、圖片等信息,我們主要是要拿到表格中的數據。     處理這類文檔數據當然優先考慮Python啦,python解析word文件可以使用包docx。首先我們需要安裝python-docx,直接執行命令:pip install python-docx即可安裝。當前的python-docx的版本為0.8.10,當python-docx安裝完畢後通過python命令啟動Python並輸入import docx命令,如果沒有提示任何錯誤即表示python-docx安裝成功了。
  • 別再問我Python怎麼操作Word了!
    前言在之前的自動化系列文章中,我們分別講解過👉Python操作Excel利器openpyxl,也講過👉Python操作PDF的幾種方式,今天我們將通過代碼講解Python操作Word文檔docx的常用方法。
  • 慢步學習,二級python,數字類型及其運算
    慢步學習,備考二級python語言,程序的基本語法元素慢步學習,二級python語言備考,基本輸入輸出函數今天想跟大家一起學習然後把一個西瓜分兩份,一個人吃一半,你0.5,我0.5,這是小數,在程式語言裡面叫浮點數。最後到科學計算的複數,例如3+5i,有實數部分3,和虛數部分5i。整數 就是我們常用的數字,不帶小數的數字。
  • 小白學編程?從一個簡單的程序開始學習Python編程
    筆者學習編程的時間也挺長的,因為業餘,因為時間不多,各種原因,自學編程的路特別難走。然後筆者發現,自己能為小白貢獻一些力量,然後決定創作適合小白的python編程類內容。今天,筆者想帶編程小白們從一個簡單的程序開始學習Python編程。