Python實現一鍵翻譯英文論文,實現了pdf文檔英譯漢,pdf格式不變

2021-01-08 專業項目源碼分享

支持谷歌、必應、有道的免費翻譯接口,基於Django、PyMuPDF實現了pdf文檔英譯漢的功能,翻譯後的pdf格式基本保持不變,可以下載docx和pdf格式的翻譯文檔,基本解決複製caj中文論文時的格式問題,簡單的滿足看論文以及寫總結的需求。

目的

省去看英文論文去各個翻譯網站對比翻譯結果的時間消耗。解決複製中文的caj或者pdf中的文欄位落時會出現格式的問題。下載翻譯後的pdf以及word不用花錢,收費如翻譯狗,有道等。使用必應的英譯漢翻譯文檔。實現

基於django、PyMuPdf、谷歌、有道翻譯實現了pdf英譯漢的功能,翻譯後的pdf格式基本保持不變,可以下載docx和pdf格式的翻譯文檔。格式矯正方面基本解決了複製caj或者pdf中文論文時出現的格式問題。問題

word不能實現pdf一樣的排版,翻譯後的pdf還是存在樣式問題(需要考慮的很多,慢慢做優化)。表格無法寫入,公示混亂。搜狗,百度翻譯接口未實現。有道翻譯長句子有問題,建議使用谷歌、必應。環境

開發環境的系統平臺為 Windows 10 (64 位),Python 版本為 3.6 (64 位),Django版本為 2.2

atomicwrites==1.3.0attrs==19.1.0certifi==2019.3.9chardet==3.0.4colorama==0.4.1Django==2.2.1docx==0.2.4idna==2.8Js2Py==0.63lxml==4.3.3more-itertools==7.0.0pdfminer3k==1.3.1Pillow==6.0.0pluggy==0.11.0ply==3.11py==1.8.0PyExecJS==1.5.1pyjsparser==2.7.1PyMuPDF==1.14.13PyPDF2==1.26.0pytest==4.5.0python-docx==0.8.10pytz==2019.1requests==2.21.0six==1.12.0sqlparse==0.3.0tzlocal==1.5.1urllib3==1.24.3wcwidth==0.1.7展示

參考文檔

PyMuPDF參考文檔

只使用pdf翻譯

如果只是想要拿來翻譯論文的同學看這裡

下載該項目後記得將文件夾名由Easy-Trans-master改為EasyTrans。將要翻譯的文件放到input_file這個目錄中,將56行的代碼最後的pdf名字修改為要翻譯的pdf名字。運行trans_file.py等代碼執行結束,翻譯後的文檔就在output_file這個目錄下面。這裡採用的是必應翻譯,也可以自己修改為其它自己想用的翻譯方式,也可以修改目錄,方便自己運行翻譯就可以了。如果有好的改進pdf翻譯效果的建議或者問題聯繫qcs@stu.ouc.edu.cn。在本地運行項目

1.克隆項目到本地(不使用git工具的話,直接下載就ok)

打開命令行,進入到保存項目的文件夾,輸入如下命令:

https://github.com/QPromise/Easy-Trans.git

2.創建並激活虛擬環境(不使用可以跳過這裡)

強烈推薦在 Virtualenv 下進行 Django 的開發。Virtualenv 是一個 Python 工具,使用它可以創建一個獨立的 Python 環境。

在命令行進入到保存虛擬環境的文件夾,輸入如下命令創建並激活虛擬環境:

C:\WINDOWS\system32>pip install virtualenv

C:\WINDOWS\system32>virtualenv C:\Users\Envs\EasyTrans_env

C:\WINDOWS\system32>C:\Users\Envs\EasyTrans_env\Scripts\activate

(EasyTrans_env) C:\WINDOWS\system32>

3.安裝項目依賴

如果使用了虛擬環境,確保激活並進入了虛擬環境,在命令行進入項目所在的 Easy-Trans 文件夾,運行如下命令:

pip install -r requirements.txt

4.資料庫遷移

命令行輸入

python manage.py makemigrations

python manage.py migrate

5.創建後臺管理員用戶

命令行輸入

python manage.py createsuperuser

6.運行開發伺服器

命令行輸入

python manage.py runserver

在瀏覽器輸入:127.0.0.1:8000 就可以看到主頁了。

注意

fitz這個包是PyMuPDF的,只要安裝PyMuPDF就可以正常導入了。

相關焦點

  • PDF文檔翻譯神器,英文文獻一鍵翻譯成中文!
    我們平時下載的外文文獻,大多數是pdf的,所以在找翻譯軟體的時候,還要考慮到格式是否支持的問題。那麼,怎麼把英文pdf翻譯成中文?英文文獻翻譯軟體哪個更好用呢?下面我們就來分享一下英文pdf翻譯成中文的方法。
  • 迅捷PDF轉換器可以實現pdf翻譯嗎?
    怎麼實現pdf翻譯?在很多種情況下,我們需要轉換pdf文件內中文為英文,例如把文件發送給外國合作夥伴時。以前,身邊同事會選擇人力翻譯,而現在他們習慣藉助迅捷PDF轉換器來實現pdf翻譯操作。下面有詳細的軟體使用方法步驟,我們一起接著往下看哦。
  • PDF在線翻譯:一鍵翻譯整篇PDF文檔的方法
    翻譯對於很多朋友來說是件很煩惱的事。但是當你遇到長篇PDF文件需要翻譯時的時候,是不是有種想分分鐘爆炸的心情!今天我來給大家分享一個分分鐘就能解決PDF翻譯的免費在線網站——迅捷在線PDF轉換器,這是一個多功能的在線平臺,不僅可以完成各種文檔格式的相互轉換工作,還能實現PDF、Word文檔的翻譯工作,編輯PDF文件也是SO EASY的事!首先,大家可以通過百度搜索「PDF在線轉換器」、「迅捷pdf 在線轉換器」、「在線pdf轉換器」等,找到平臺網站。
  • 怎麼翻譯pdf文檔?可以翻譯pdf的軟體有哪些?
    怎麼翻譯pdf文檔?與外國合作夥伴打交道時,小夥伴們需要翻譯pdf格式文件中文為相應外文。這個時候,大家可以嘗試使用下迅捷PDF轉換器,它可以把pdf簡體中文譯為英文、繁體中文以及日語等。下面有方法步驟,你們可以接著尋找答案哦。
  • 英文文獻看不懂?教你如何實現PDF全文翻譯!
    很多同學在查閱資料的時候發現,中文文獻中常常找不到想要的內容,而去讀英文文獻呢又看不懂。所以今天就為大家介紹幾種常用的pdf翻譯方法,大家可以根據自己喜好選擇使用。首先介紹幾個常用網站,這些網站都是通過上傳文檔來實現全文翻譯的。
  • 如何對pdf文檔進行翻譯處理,教你一個pdf翻譯的方法
    pdf翻譯顧名思義就是將文檔中的文字語言翻譯並轉換成另一種語言。當我們獲得一份英文文獻看不懂,或想把自己打包好的pdf文件的中文轉換成英文時都可以對其進行pdf翻譯,那我們該如何去對pdf文檔進行翻譯處理呢?
  • 在線pdf下載可以在什麼網站實現文檔格式的轉換?
    本期我主要想推薦一個支持文檔格式轉換的在線網站——迅捷PDF在線轉換器給大家,它都針對PDF轉換其他格式或其他格式轉為PDF的工具,免費、易操作,有需要的夥伴可看看並收藏網頁,以備不時之需。
  • 教你一鍵搞定整個PDF文檔翻譯!
    無論是研究生、博士還是科研人員,都免不了要接觸英文文獻。大家也都知道,英文文獻不僅找起來麻煩,而且還要先把文獻翻譯成中文再看,需要花費很多時間。尤其在自身英文水平不足的情況下,如果找人工翻譯,費用方面也將是一筆不小的消耗。也許有人會說,可以用翻譯軟體。的確,目前市面上翻譯軟體有很多,但不可否認的是,這些軟體也會存在限制,比如文檔格式不支持、翻譯後格式錯亂等。那麼,還有沒有什麼辦法可以解決文獻的翻譯問題呢?
  • word文檔轉換成pdf怎麼實現?word格式怎麼變成pdf格式?
    別以為word就只能是word,Excel就只能是Excel,PDF就只能是PDF,實際上,文檔格式是可以互相變化的,我們可以將word轉換成Excel,可以將Excel轉換成PDF,當然,也可以將word轉換成PDF。
  • pdfkit | 利用python實現html文件轉pdf
    在用jupyter notebook寫代碼文檔的時候,有時需要導出pdf版本,但jupyter會報錯。我在想,除了網上的debug方法,還沒有其他方案可以生成pdf。其實也有很多軟體提供pdf生成服務,但這樣太不python了,那下面就來試試pdfkit怎麼用吧!
  • 20行Python代碼實現一款永久免費PDF編輯工具
    PDF(Portable Document Format),中文名稱便攜文檔格式是我們經常會接觸到的一種文件格式,文獻、文檔...很多都是PDF格式。它以格式穩定的優勢,使得我們在列印、分享、傳輸過程中能夠最優的保持原有色彩和格式。
  • Python讀取PDF文檔並翻譯
    自製文檔翻譯小工具,告別xxx詞典的收費翻譯!翻譯服務選擇免費的百度翻譯api:https://api.fanyi.baidu.com/標準版服務完全免費,不限使用字符量完成身份認證,還可免費升級至高級版、尊享版,每月享受200萬免費字符量及增值服務
  • 在線編輯pdf文檔該怎麼操作?什麼網站可以實現?
    在線編輯pdf文檔該怎麼操作?對於學生黨、上班族來說,pdf格式文件是最為常見的文件類型之一。平時,大家也常常需要對它進行修改、編輯等。不想佔用電腦過多內存的話,小夥伴們可以藉助迅捷PDF轉換器在線網站對pdf文檔進行編輯操作哦。
  • 翻譯pdf怎麼弄?用什麼pdf轉換器可以翻譯pdf文檔?
    翻譯pdf怎麼弄?平時,當我們把pdf格式文件發送給外國友人時,會先使用迅捷PDF轉換器對它進行翻譯。而除了翻譯pdf,這款軟體也支持翻譯word、ppt、excel格式文件。下面有軟體翻譯pdf的詳細步驟,往下看便能收穫到滿意答案哦。運行軟體後,根據頁面提示,我們來一步步完成pdf翻譯操作吧!點擊頁面【特色轉換】-【pdf翻譯】功能選項,進入該功能頁面。頁面中間有提示說,應該怎麼完成文件添加。點擊此處,或者把pdf格式文件直接拖拽進來,皆可以打開文件。
  • 翻譯狗:超實用的PDF翻譯工具,文檔翻譯神器!
    不管是看外文文獻,還是處理工作中的英文資料,都會遇到要翻譯PDF文檔的情況。平時我們用PDF傳輸資料的好處不用多說,但是一旦遇到需要翻譯的時候,缺點也很明顯:需要轉換格式、排版錯亂、圖表公式丟失…怎麼辦?
  • 怎麼翻譯pdf文檔?需要下載哪款pdf轉換器?
    怎麼翻譯pdf文檔?當文件兩頭所接觸的人群不同,我們便需要藉助軟體對它進行翻譯,例如把中文轉英文、英文轉中文。不知道怎麼選擇軟體的話,小夥伴們可以下載、使用迅捷PDF轉換器,看看它適不適合自己。下面有軟體翻譯pdf的操作技巧,大家繼續往下看。
  • pdf文檔翻譯怎麼做?怎麼把pdf文檔翻譯成中文?
    pdf文檔翻譯怎麼做?平時工作上,很多小夥伴需要和外國客戶打交道。這時候,便需要使用迅捷PDF轉換器翻譯pdf文檔後,再發送出去。這款軟體可以把pdf文檔中文翻外文,也支持把pdf文檔翻譯成中文。下面,我們一起來看看怎麼用它翻譯pdf文檔哦。
  • 如何翻譯大量PDF文獻?這個在線翻譯工具安利給你!
    寫畢業論文,經常需要度一些英文文獻,而且下載下來還都是pdf版本的,很多文檔翻譯工具翻譯出來的效果都不是很理想,要麼翻譯質量差強人意,要麼文檔格式錯亂、數據圖表丟失。怎麼辦?有什麼方法可以直接把一篇pdf文獻翻譯成中文嗎?今天小編給大家介紹一個超實用的文檔翻譯網站——翻譯狗,具體怎麼操作?翻譯效果怎麼樣?下面我們就一起來體驗一下~首先,你需要準備好一份pdf格式的英文文獻,然後通過瀏覽器搜索「翻譯狗」進入官網,註冊登錄之後,就可以開始翻譯啦。
  • 手機上pdf轉換成word可以用什麼軟體實現
    有什麼比較不錯的pdf轉換APP?不管是學習,還是工作中,我們經常都可以接觸到pdf格式文件。對它進行格式轉換、內容編輯等操作,也是較為普遍的一個操作。但對於職場新人來說,可能對於pdf轉換操作還不是那麼熟悉。
  • 如何拆分pdf?什麼工具可以實現pdf分割?
    什麼工具可以實現pdf分割?夥伴們好,我是一名心理學愛好者,最近恰逢輪休,終於不用每天急急忙忙地去上班了,可以在家做一些自己喜歡的事情。於是我從網上找來一些比較實用的心理學資料,想梳理一些基本知識,打算慢慢入門。