Python 自動化辦公—Word 文本操作命令

2021-01-08 Z先生點記

點擊上方 小張Python,加為星標

第一時間收到 Python 技術乾貨!

之前介紹了一個Python包 openpyxl ,用於處理 Excel ;而對於 Word 文本時同樣也有對應的 Python庫 Python-docx,在日常辦公中,如果需要處理多個 word 文本,且操作步驟都是重複單調的,我想這個庫就可以幫到你

在了解 Python-docx 常用函數之前,需要知道 在 Python-docx 各命令所對應 word 各部件,下圖所示,

Document 指的是 word 文檔;paragraph 對應段落;run 對應 一句話中的各個欄位,樣式調整時,一般面向的操作對象都是逐欄位進行;

1,安裝 Python-docx

通過 pip 工具即可進行安裝,在命令行中輸入 pip install Python-docx 即可

2,創建或打開 Document

Python-docx 導入包時是以 docx 命令存在的,與 Opencv 的 Python 版本導入方法相似;創建文件、打開文件以 Document() 命令操作,這裡操作時需要注意幾個點:

1,Document() 命令是基於默認」模板「創建一個空白文檔,隨後可對文檔進行編輯操作,最後沒有用 save() 函數存儲的話,文檔將伴隨程序結束同內存一起2,Document(path) 命令表示打開一個本地已經存在的 docx 文件,path 表示存放目錄若不存在則程序報錯;下面代碼中,創建了一個空白 docx,賦值給 document

from docx import Documentdocument = Document()3,加入一段落

段落作為 docx 文檔正文的主要成分,那怎樣在創建好的 Document 中加入一段話呢?官方給出了兩種方式

1,在文檔後面插入

這種方法是比較常見且簡單的,命令如下

paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')方法中將創建好的段落引用指向 paragraph ,表明了光標的位置,後面的一些操作可以藉助 paragraph 引用變量來作為定位操作

2,在指定地方的前面插入

文檔編輯正常順序是在末尾進行編輯,但有時在編輯時可能失誤少輸入一段話或文字,這時就用到 在指定位置前面進行插入操作

prior_paragraph = paragraph.insert_paragraph_before('Lorem ipsum')此命令常用於 修正文檔 ,當需要在一段話前面添加一些別的文字時。

4,標題

docx 中 會用一、二、三級標題將正文分為幾部分,讓文本主次感更強;Python-docx 有對應的內置函數供我們使用,內置函數中標題分為主標題和子標題

創建標題的函數方法中,有一個參數 level 可進行修改,若不設定時默認為 主標題(leve = 0);

document.add_heading('The REAL meaning of the universe')子標題分為 1-9 九個等級,修改參數 level 即可

document.add_heading('The role of dolphins', level=2)5,分頁符

在 Word 中進行文本編輯,想在單獨的一個新頁面編寫文本時,就需要加入一個 強制分頁符,命令如下

document.add_page_break()這裡需要注意下,加入分頁符之後,新頁面上編輯的段落樣式屬性與之前頁面段落屬性是分隔開的

6,表格

在文檔中創建一個 2*2 的 表格

table = document.add_table(rows=2, cols=2)表格中每個單元格可進行文本編輯,顏色填充;對於特定表格而言可通過 row、column 索引來進行定位,這裡藉助了操作 Excel 表格的思想

cell = table.cell(0, 1)賦值其文本內容

cell.text = 'parrot, possibly dead'對一個一個單元格修改操作太麻煩了,可以一次選中指定列,對其單元格數據進行逐個修改

row = table.rows[1]row.cells[0].text = 'Foo bar to you.'row.cells[1].text = 'And a hearty foo bar to you too sir!'table.rows[index] 返回索引為 index 的指定行,根據 .rows和.cols 表示 表格的全部行或列是可迭代的,因此可通過 for 循環來訪問每一個單元格

for row in table.rows:for cell in row.cells:print(cell.text)因為 .rows 和 .cols 是可迭代的,通過 len() 命令來獲取行、列數

row_count = len(table.rows)col_count = len(table.columns)除了以上操作之外,還可以向 table 中逐漸添加行、列命令

row = table.add_row()col = table.add_col()上面提到了 創建表格,單元格修改,創建新行/列,逐行/列迭代,下面用個實例做個簡單總結,代碼中完成功能如下:

1,item 創建一個 3*3 的元組數據;2,在 word 中新建一個 table,一行三列;3,創建好的 table 的表頭依次設置為 Qty,SKU,Description;4,將 item 中的元素,以 table 逐行 3 個的方式創建;# get table data ---items = ( (7, '1024', 'Plush kittens'), (3, '2042', 'Furbees'), (1, '1288', 'French Poodle Collars, Deluxe'),)# add table ---table = document.add_table(1, 3)# populate header row ---heading_cells = table.rows[0].cellsheading_cells[0].text = 'Qty'heading_cells[1].text = 'SKU'heading_cells[2].text = 'Description'# add a data row for each itemfor item in items: cells = table.add_row().cells cells[0].text = str(item.qty) cells[1].text = item.sku cells[2].text = item.desc此外,還可修改 表格的樣式,word 文檔中的表格樣式這裡都可以設定(樣式名稱可以通過word 文檔自有的樣式,將滑鼠放到樣式的縮略圖上即可查看),但需要注意的是,使用樣式時需要去掉word軟體中樣式名字中的空格,例如下面 Office 原樣式名字為 Light Shading-Accent1,這裡直接把中間空格去掉

table.style = 'LightShading-Accent1'7,圖片

在 python-docx 中添加圖片用下面命令即可完成

document.add_picture('image-filename.png')上面加入的是本地文件 path ,除此之外還可以使用 file-like object,這種格式對於資料庫或者網絡上的圖片讀取時時非常方便的

修改圖片大小

python-docx 加入圖像默認表示的是 native size,正常圖片加入時會出現相同圖片的一側出現 4.167 inches 的空白處,大概佔比紙張寬度的一半;在獲取想要圖像大小時,可以指定寬度或高度設為較為方便的單位

from docx.shared import Inchesdocument.add_picture('image-filename.png', width=Inches(1.0))8, 應用段落樣式

設定段落樣式方法有兩種,一種創建時就可以設置

document.add_paragraph('Lorem ipsum dolor sit amet.', style='ListBullet')另一種是創建完之後再再進行設置(這時不需要去掉樣式名稱中的空格)

paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')paragraph.style = 'List Bullet'9,字體加黑並斜體化

對字體做斜體和加黑操作之前, 需要理解在一個段落中都做了什麼事情,簡單來說兩部分:

1,一個段落具有全部 block-level formatting ,比如制表符、行高、tabs 等;2,Character-level formatting ,例如粗體、斜體,應用的是 run對象,在段落中的所有內容必須是一個 run ,且不僅包含一個,Run 對象同時包含一個 .bold 和.italic 屬性,可讓你來對其值進行設置

paragraph = document.add_paragraph('Lorem ipsum ')run = paragraph.add_run('dolor')run.bold = Trueparagraph.add_run(' sit amet.')上面代碼中最後創建的文本格式形如:Lorem ipsum dolor sit amet.

需要注意的是設置 bold 或 italic 時,可以把 .add_run() 命令直接放在右邊

paragraph.add_run('dolor').bold = True# is equivalent to:run = paragraph.add_run('dolor')run.bold = True# except you don't have a reference to `run` afterward10,字符樣式

除了上面加黑、斜體之外、還可定義字符樣式( character styles ), 定義時加入一行新的 run 對象;例如

paragraph = document.add_paragraph('Normal text, ')paragraph.add_run('text with emphasis.', 'Emphasis')上面創建一個文本 ,結果如下

Normal text,text with emphasis. ;text with emphasis. 部分應用 Emphasis(強調) 的字符格式

上面代碼也可改為;

paragraph = document.add_paragraph('Normal text, ')run = paragraph.add_run('text with emphasis.')run.style = 'Emphasis'與段落樣式一樣,樣式名字與 Word UI 裡的一樣,在 Word 樣式管理器中都能找得到!

好了,以上就是本篇文章的全部內容了,如果有什麼疑問可通過下方留言區告訴我

相關焦點

  • Python 自動化辦公 — Word 文本操作命令
    之前介紹了一個Python包  openpyxl ,用於處理 Excel ;而對於 Word 文本時同樣也有對應的 Python庫 Python-docx,在日常辦公中,如果需要處理多個 word 文本,且操作步驟都是重複單調的,我想這個庫就可以幫到你在了解 Python-docx
  • 從PPT到Word,用Python輕鬆實現辦公自動化
    來源  | 早起Python(ID:zaoqi-python)在之前的自動化系列文章中,我們分別講過如何使用 Python 將 Word 中表格信息批量提取至
  • python自動化辦公手冊之python操作PPT
    前言1)python自動化文檔手冊python自動化文章一直深受廣大python愛好者的青睞。基於此,我花了整整一周時間真理出來的python自動化文檔手冊,涉及到五個章節(如下圖所示),① python使用openpyxl操作excel;② python使用PyPDF2和pdfplumber操作pdf;③ python使用python-docx操作word;④ python使用python-pptx操作PPT;⑤ python如何自動收發郵件;⑥ python製作電話號碼歸屬地查詢工具。
  • 講一講我是如何通過Python實現辦公自動化的
    自動化辦公無非是excel、ppt、word、郵件、文件處理、數據分析處理、爬蟲這些,今天我們主要來講講excel、ppt、word自動化的操作技巧。我們需要學習的主要內容有:python基礎;excel自動化;ppt自動化;word自動化。
  • 【Python基礎】python使用python-docx操作word
    1、python-docx庫介紹該模塊兒可以創建、修改Word(.docx)文件;python-docx使用官網:python-docx官網我們在安裝此模塊兒使用的是pip install python-docx,但是在導入的時候是import docx;2、Python讀取Word文檔內容注意:每進行一個操作,必須保存一下,否則等於白做;1)word文檔結構介紹在這裡插入圖片描述2)python-docx
  • Python自動化辦公(內容)
    python自動化辦公(python操作Excel、Word、PDF、PPT)python使用openpyxl操作excel;python使用PyPDF2和pdfplumber操作pdf;python使用python-docx操作word;python使用python-pptx操作PPT;python如何自動收發郵件;python製作電話號碼歸屬地查詢工具;一:python
  • 別再問我Python怎麼操作Word了!
    前言在之前的自動化系列文章中,我們分別講解過👉Python操作Excel利器openpyxl,也講過👉Python操作PDF的幾種方式,今天我們將通過代碼講解Python操作Word文檔docx的常用方法。
  • Python辦公自動化|從Excel到Word
    文件名title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-驗貨報告'print(title)通過上面的代碼,我們就成功的從Excel中提取出來數據,這樣Excel部分就結束了,接下來進行word的填表啦,由於這裡我們默認讀取的word是.docx格式的,實際上讀者的需求是.doc格式文件
  • python辦公自動化(二) | 讀取.txt、.data、.doc和.docx文檔的部分內容
    python的文件操作,是python辦公自動化的最基礎部分。
  • Python自動化用這些知識點就夠了!
    這可能是很多非IT職場人士面臨的困惑,想把python用到工作中,卻不知如何下手?python在自動化辦公領域越來越受歡迎,批量處理簡直是加班族的福音。自動化辦公無非是excel、ppt、word、郵件、文件處理、數據分析處理、爬蟲這些,這次就來理一理python自動化辦公的那些知識點。下面一一詳解。
  • 聊聊python 辦公自動化之 Word(中)
    作者:星安果 來源:AirPython(公眾號)上一篇文章,對 Word 寫入數據的一些常見操作進行了總結,詳情請看聊聊python 辦公自動化之 Word(上)。相比寫入數據,讀取數據同樣很實用!本篇文章,將談談如何全面讀取一個 Word 文檔中的數據,並會指出一些要注意的點。
  • 最全總結 | 聊聊 Python 辦公自動化之 Word(下)
    新增數字索引我們經常需要在文檔頁腳處添加頁面數字索引,可惜 python-docx 並沒有提供現有方法但是,在 stackoverflow 上找到實現的方式https://stackoverflow.com/questions/56658872/add-page-number-using-python-docx?
  • 第105天: Python 操作 Word
    ('如何使用 Python 創建 Word',0)# 保存文件doc1.save('word1.docx')這樣就完成了創建文檔和文章標題的操作,下面通過命令 python word_1.py 運行程序,會生成名為 word1.docx 的文檔,打開文章顯示如下圖所示:
  • 別加班了,「膠水語言」辦公自動化Word篇——一招搞定300頁文檔
    這兩天在更新Python在辦公自動化方面的文章,前面發的是關於辦公軟體中的Excel部分,有網友私信我說想看看Python在Word方面的應用,今天就給大家從基礎的入門操作開始吧!我們在工作中會遇到需要讀取一個有幾百頁的word文檔並從中整理出一些信息的需求,比如產品的API文檔一般是word格式的。
  • Python辦公自動化| word 表格轉excel
    之前寫過一篇 Python辦公自動化 | 批量word報告生成工具 ,有小夥伴提出了逆向需求,即:從批量word中獲取內容並寫入excel,需求背景是匯總一些材料,舉例:實習鑑定表、個人簡歷、檔案等。實際需求是這樣的,現在有如下格式的若干word文檔,需要錄入標黃信息到excel,手工錄入效率太低了,能不能用python實現呢?
  • 你不能不知道的Word操作文本技巧!
    今天達人哥跟各位小夥伴分享word基礎知識—文本操作技巧。編輯文檔時經常需要對文本進行選中操作,本篇講述的文本操作,值得小夥伴熟知和牢記喲。小夥伴也可以根據實際需求選擇適合的方法。在操作word文檔時,有時我們需要將某位置開始的數據進行複製,這時用Alt鍵加滑鼠選擇就非常好用了。
  • 用Python玩轉PPT
    安裝pptx是一個非標準庫,需要在命令行中安裝pip install python-pptx要注意,安裝的時候是python-pptx,而實際調用時均為pptx。這裡和docx模塊相同。基本結構再看一下ppt結構組成,會較word複雜許多。當然這也跟ppt的高度自定義拓展性有關簡單來說,一個PPT文件為presentation,基本的結構為展示文件presentation-幻燈片頁slide-形狀shape組成,形狀就需要區分開,是包含文本的形狀還是不包含文本的形狀(純圖片等)。
  • Python辦公自動化—xlrd模塊如何應用在Excel中?
    Python辦公自動化主要包括Excel讀寫數據、PPT、Word三個方面的學習,上次安裝了Python自動化辦公的基本環境搭建(Python辦公自動化
  • python自動化辦公:玩轉word之樣式秘笈
    上節對python如何定製word的頁眉頁腳做了詳細介紹,當然,要作出一篇精彩的word文檔,樣式公布可沒,本章繼續介紹python如何玩轉word的樣式。使用樣式python如何玩轉word的樣式此頁面使用前一頁中開發的概念而不作介紹。如果術語不熟悉,請參閱word的樣式參考。
  • python操作Excel學習筆記,以後儲存數據 辦公很輕鬆!
    第一個例子的要求為:創建程序 ,從命令行接受數字 N,在一個 Excel 電子表格 中創建一個 N×N 的乘法表,另外行 1 和列 A 應該用做標籤,應該使用粗體。最終的實現效果如下:第二個例子要求為:創建一個程序,它接受兩個整數和一個文件名字符串作為 命令行參數。我們將第一個整數稱為 N,第二個整數稱為 M。程序應該從第 N 行開 始,在電子表格中插入 M 個空行。最終實現如下,在第4行插入5個空行: