小叮噹python人工智慧篇:英文課文寫入word中

2020-12-17 IT小叮噹

在「小叮噹python人工智慧篇:輕鬆獲得英語課本電子版」中,已為大家分享通過人工智慧圖文識別方法拿到英語課本的電子版。

思路是:通過課後網址--->拍照到電腦--->人工智慧圖文識別--->獲得大體正確的網址--->人工對比修正--->獲得正確網址--->訪問網址--->將內容複製粘貼到本地--->獲得課文電子版

但是,這種方法仍需要我們通過網址訪問後,進行手工粘貼複製內容到本地。當課文多時,那也可真是累成狗!

難道我們必須手工複製粘貼?答案當然還是:不存在的!

都人工智慧新時代了,這種機械重複的工作就交給計算機來完成吧。

而我們人類,應該過上舒服愜意而又快樂的生活。

所以,我們可以通過語法簡單、代碼簡潔、容易上手的python代碼來為我們工作,使我們從大量的簡單機械重複性的工作中解脫出來

通過「小叮噹python人工智慧篇:輕鬆獲得英語課本電子版」中的方法,我們已經可以輕鬆快速的拿到Unit1、Unit5單元的TextA和TextB的訪問網址。

曾有偉人說過,「世界上怕就怕認真二字!」

而IT小叮噹就最講究認真二字!我們得到的網址是否都對應著英文課本呢?

經過對比,果然發現有一個與課文內容不相符的網址——「url_unit5_texta」

此時我們仍利用「小叮噹python人工智慧篇:輕鬆獲得英語課本電子版」中的方法識別課文標題。將識別出來的標題放入百度中進行搜索,果然立馬就找到一個與課文相符的網址。

我們將網址複製粘貼給變量「url_unit5_texta",此時,我們已得到正確訪問的課文網址。

下面,我們就以unit1-texta為例,為大家分享怎樣通過python讓計算機為我們將英語課文自動寫入word。

Step1.拿到課文所在網頁內容

Step2.獲取課文內容

經分析發現,課文標題在一個class為「pageTitle」的h2標籤中。

課文內容p標籤下。

我們通過簡單的正則表達式即可拿到課文標題和內容。

但我們發現,此時的英文課文中還有一些「<br/>"換行標籤等的格式標籤存在。我們使用正則去掉"<>",從而將標籤去掉。

但此時我們發現,還有一種特殊字符存在,形如「&rsquo」之類的html字符實體。

我們使用python中的html庫,將其轉化為相應的字符。

可以看到使用html庫解析後,我們已得到不含特殊字符幹擾的英文課文。

Step3.將英語課文寫入word中

我們先新建一個名為「0英語課文電子版」的文件夾,用來存儲我們將要寫成word的英語課文。

建好存儲的文件夾後,我們來讓python為我們自動寫入英語課文,並保存為word形式。可以看到,程序運行前,該文件夾為空。

執行程序後,我們建的文件夾下便多了一個「unit1-texta.doc"的文件。可見,程序已幫我們自動寫好word文件。

雙擊打開後,提示選擇文檔編碼,默認選擇為"utf-8",我們點擊確定即可。

到此,我們已成功實現將獲得的英語課文寫入word之中。

雖然,我們已成功將英文課文寫入word中,但我們更需要的是獲得它的漢語翻譯。

由於今天四六級監考,時間有限,小叮噹將在「小叮噹python人工智慧篇:讓Google為我們自動翻譯英語課文!」為大家分享怎樣讓Goole為我們自動翻譯出英語課文。

相關焦點

  • 小叮噹python人工智慧篇:讓Google為我們自動翻譯英語課文!
    在「小叮噹python人工智慧篇:英文課文寫入word中」,已為大家分享拿到word版的英文課文的方法。今天,小叮噹就為大家分享如何通過人工智慧使用python讓谷歌為我們自動翻譯出英文課文!在人工智慧「AI+」的新時代,機器翻譯的水平越來越高,雖然有些翻譯結果不盡人意,Google翻譯總體來說還是可以令人接受的。
  • 小叮噹python人工智慧篇:輕鬆獲得英語課本電子版
    仔細觀察後發現,其課文構成可以分為兩大部分,一部分給出了課文網址,一部分沒有網址。今天,我們先解決有網址的課文。還記得「小叮噹Python人工智慧篇:一句代碼搞定圖文識別!」嗎?在那篇文章中,小叮噹已經為大家分享了如何使用一句代碼進行圖文識別。
  • 小叮噹Python人工智慧篇:一句代碼搞定圖文識別!
    在前幾篇文章「小叮噹Python人工智慧篇:圖文識別tesseract4.0引擎的安裝」、「小叮噹Python人工智慧篇:tesseract4.0引擎語言包的配置!」中已為大家介紹了如何安裝下載圖文識別開源引擎以及所需的安裝包的配置。在tesseract4.0引擎及語言包已配置好的前提下,我們就用一句代碼通過python來實現人工智慧中的圖文識別。
  • 第105天: Python 操作 Word
    add_paragraph 方法則是用來在文章中增加段落的,那我們現在就通過命令 python word_1.py 運行程序看下效果:# 段落中增加文字,並設置字體字號run = paragraph.add_run('(注意:這裡設置了字號為20)')run.font.size = Pt(20)# 設置英文字體run = doc1.add_paragraph('這裡設置英文字體:').add_run('This Font is Times New Roman ')run.font.name = 'Times New
  • 【Python基礎】python使用python-docx操作word
    1、python-docx庫介紹該模塊兒可以創建、修改Word(.docx)文件;python-docx使用官網:python-docx官網我們在安裝此模塊兒使用的是pip install python-docx,但是在導入的時候是import docx;2、Python讀取Word文檔內容注意:每進行一個操作,必須保存一下,否則等於白做;1)word文檔結構介紹在這裡插入圖片描述2)python-docx
  • 聊聊python 辦公自動化之 Word(中)
    作者:星安果 來源:AirPython(公眾號)上一篇文章,對 Word 寫入數據的一些常見操作進行了總結,詳情請看聊聊python 辦公自動化之 Word(上)。相比寫入數據,讀取數據同樣很實用!本篇文章,將談談如何全面讀取一個 Word 文檔中的數據,並會指出一些要注意的點。
  • 從PPT到Word,用Python輕鬆實現辦公自動化
    來源  | 早起Python(ID:zaoqi-python)在之前的自動化系列文章中,我們分別講過如何使用 Python 將 Word 中表格信息批量提取至
  • 如何將Excel中的數據寫入Word表?
    word中表格的數據讀入excel……之後有朋友表示知道了,又問如何將excel中的數據寫入word……此時此刻,我再一次清醒的意識到,這世界上像我這樣好的人已經不多了。再下圖是word中的一張excel表
  • Word 神器 python-docx
    首先想到 word 自身的替換功能,倒是能查到,但是沒法動態替換,即只替換兩邊引號,而不換中間內容;另外一種方案是,即用 VBA,通過編程來替換,雖說做過幾個項目,可好久不用,拾起費勁,再加上 VBA 中各種概念和用法,學習成本太高,放棄;
  • 教你如何用python輕輕鬆鬆操作Excel、Word、CSV,一文就夠了,趕緊碼住!!!
    修改 excel上面說了寫入和讀取 Excel 內容,接下來我們就說下更新修改 Excel 該如何操作,修改時就需要用到 xlutils 中的方法了。# 段落中增加文字,並設置字體字號run = paragraph.add_run('(注意:這裡設置了字號為20)')run.font.size = Pt(20)# 設置英文字體run = doc1.add_paragraph('這裡設置英文字體:').add_run('This Font is Times New Roman ')run.font.name
  • 別加班了,「膠水語言」辦公自動化Word篇——一招搞定300頁文檔
    這兩天在更新Python在辦公自動化方面的文章,前面發的是關於辦公軟體中的Excel部分,有網友私信我說想看看Python在Word方面的應用,今天就給大家從基礎的入門操作開始吧!我們在工作中會遇到需要讀取一個有幾百頁的word文檔並從中整理出一些信息的需求,比如產品的API文檔一般是word格式的。
  • Python自動化辦公(內容)
    操作pdf;python使用python-docx操作word;python使用python-pptx操作PPT;python如何自動收發郵件;python製作電話號碼歸屬地查詢工具;一:python如何向excel中寫入某些內容?
  • Python數據分析:pandas讀取和寫入數據
    我的公眾號是關於自己在數據分析/挖掘學習過程中的一些技術和總結分享,文章會持續更新......繼續深入學習pandas相關操作,數據讀取寫入、分組、合併,轉換等等。前面一篇文章裡已經寫了關於描述性統計以及常用的基本操作。接下來的一段時間裡,我將陸續地去掌握並輸出。這篇文章是關於數據讀取與寫入的知識點。
  • Python辦公自動化| word 表格轉excel
    之前寫過一篇 Python辦公自動化 | 批量word報告生成工具 ,有小夥伴提出了逆向需求,即:從批量word中獲取內容並寫入excel,需求背景是匯總一些材料,舉例:實習鑑定表、個人簡歷、檔案等。實際需求是這樣的,現在有如下格式的若干word文檔,需要錄入標黃信息到excel,手工錄入效率太低了,能不能用python實現呢?
  • 【Python】將資料庫中的數據查詢出來自動寫入excel文檔
    這樣查了兩天,我又嫌麻煩了,跟同事說了我的需求,問他能不能幫我用python搞成自動查結果然後把結果寫到excel中的。他聽完需求說這樣是沒有問題的。中午的時候他就把代碼給我了。將資料庫中的查詢語句轉譯到python中sql="""SELECT DATE_FORMAT(交易時間,'%d') 日期, 服務費,`商戶服務費`,流量費,count(*),sum(交易金額) ,'非雲閃付' 類別
  • Python學習第52課-寫入文件
    【每天幾分鐘,從零入門python編程的世界!】Python操作外部文件的數據,既然有讀取,就會有寫入。我們現在學習用Python寫入文件。●寫入文件文件寫入和文件讀取具有相似的步驟,即打開文件--讀取/寫入文件--關閉文件,對應open()--read()/write()--close()方法。write()方法描述:write() 方法用於向文件中寫入指定字符串。
  • python入門教程06-01(python語法入門之字符編碼)
    ,然後cpu從內存中取出指令並執行#3、軟體運行過程中產生的數據最先都是存放於內存中的,若想永久保存軟體產生的數據,則需要將數據由內存寫入硬碟2.2 文本編輯器讀取文件內容的流程#階段1、啟動一個文件編輯器(文本編輯器如nodepad++,pycharm,word)#階段2、文件編輯器會將文件內容從硬碟讀入內存#階段3、文本編輯器會將剛剛讀入內存中的內容顯示到屏幕上
  • Python和人工智慧有什麼關係?Python 和人工智慧的區別是什麼?
    人工智慧人工智慧是一個大的概念,在人工智慧下有計算機視覺,語音識別,自然語言處理等不同的技術領域,這些技術領域中在Github上又有許多開源的代碼可以直接用來開發,而這些代碼往往需要或者只支持人工智慧是一個大的範疇,包括很多方面的應用,比如機器學習,在機器學習中的回歸算法,它們是通過統計分析所有數據來建立多因式,然後求解式子,而在這個過程中程式語言起到的作用是清洗數據、處理數據、建立關係求解結果的作用,python適用於數據清洗且學習成本低,所以在一定程度上,好一部分人傾向於將python應用於人工智慧應用領域。
  • Python實現一鍵翻譯英文論文,實現了pdf文檔英譯漢,pdf格式不變
    目的省去看英文論文去各個翻譯網站對比翻譯結果的時間消耗。解決複製中文的caj或者pdf中的文欄位落時會出現格式的問題。下載翻譯後的pdf以及word不用花錢,收費如翻譯狗,有道等。使用必應的英譯漢翻譯文檔。
  • 用Python玩轉PPT
    安裝pptx是一個非標準庫,需要在命令行中安裝pip install python-pptx要注意,安裝的時候是python-pptx,而實際調用時均為pptx。這裡和docx模塊相同。如果是包含文本的形狀,則可以獲取內部的文本框,一個文本框又可以看作是一個小的word文檔,包含段落paragraph - 文字塊run現在對Office三件套的結構組成做一個小總結2.