支持谷歌、必應、有道的免費翻譯接口,基於Django、PyMuPDF實現了pdf文檔英譯漢的功能,翻譯後的pdf格式基本保持不變,可以下載docx和pdf格式的翻譯文檔,基本解決複製caj中文論文時的格式問題,簡單的滿足看論文以及寫總結的需求。
目的
省去看英文論文去各個翻譯網站對比翻譯結果的時間消耗。解決複製中文的caj或者pdf中的文欄位落時會出現格式的問題。下載翻譯後的pdf以及word不用花錢,收費如翻譯狗,有道等。使用必應的英譯漢翻譯文檔。實現
基於django、PyMuPdf、谷歌、有道翻譯實現了pdf英譯漢的功能,翻譯後的pdf格式基本保持不變,可以下載docx和pdf格式的翻譯文檔。格式矯正方面基本解決了複製caj或者pdf中文論文時出現的格式問題。問題
word不能實現pdf一樣的排版,翻譯後的pdf還是存在樣式問題(需要考慮的很多,慢慢做優化)。表格無法寫入,公示混亂。搜狗,百度翻譯接口未實現。有道翻譯長句子有問題,建議使用谷歌、必應。環境
開發環境的系統平臺為 Windows 10 (64 位),Python 版本為 3.6 (64 位),Django版本為 2.2
atomicwrites==1.3.0attrs==19.1.0certifi==2019.3.9chardet==3.0.4colorama==0.4.1Django==2.2.1docx==0.2.4idna==2.8Js2Py==0.63lxml==4.3.3more-itertools==7.0.0pdfminer3k==1.3.1Pillow==6.0.0pluggy==0.11.0ply==3.11py==1.8.0PyExecJS==1.5.1pyjsparser==2.7.1PyMuPDF==1.14.13PyPDF2==1.26.0pytest==4.5.0python-docx==0.8.10pytz==2019.1requests==2.21.0six==1.12.0sqlparse==0.3.0tzlocal==1.5.1urllib3==1.24.3wcwidth==0.1.7展示
參考文檔
PyMuPDF參考文檔
只使用pdf翻譯
如果只是想要拿來翻譯論文的同學看這裡
下載該項目後記得將文件夾名由Easy-Trans-master改為EasyTrans。將要翻譯的文件放到input_file這個目錄中,將56行的代碼最後的pdf名字修改為要翻譯的pdf名字。運行trans_file.py等代碼執行結束,翻譯後的文檔就在output_file這個目錄下面。這裡採用的是必應翻譯,也可以自己修改為其它自己想用的翻譯方式,也可以修改目錄,方便自己運行翻譯就可以了。如果有好的改進pdf翻譯效果的建議或者問題聯繫qcs@stu.ouc.edu.cn。在本地運行項目
1.克隆項目到本地(不使用git工具的話,直接下載就ok)
打開命令行,進入到保存項目的文件夾,輸入如下命令:
https://github.com/QPromise/Easy-Trans.git
2.創建並激活虛擬環境(不使用可以跳過這裡)
強烈推薦在 Virtualenv 下進行 Django 的開發。Virtualenv 是一個 Python 工具,使用它可以創建一個獨立的 Python 環境。
在命令行進入到保存虛擬環境的文件夾,輸入如下命令創建並激活虛擬環境:
C:\WINDOWS\system32>pip install virtualenv
C:\WINDOWS\system32>virtualenv C:\Users\Envs\EasyTrans_env
C:\WINDOWS\system32>C:\Users\Envs\EasyTrans_env\Scripts\activate
(EasyTrans_env) C:\WINDOWS\system32>
3.安裝項目依賴
如果使用了虛擬環境,確保激活並進入了虛擬環境,在命令行進入項目所在的 Easy-Trans 文件夾,運行如下命令:
pip install -r requirements.txt
4.資料庫遷移
命令行輸入
python manage.py makemigrations
python manage.py migrate
5.創建後臺管理員用戶
命令行輸入
python manage.py createsuperuser
6.運行開發伺服器
命令行輸入
python manage.py runserver
在瀏覽器輸入:127.0.0.1:8000 就可以看到主頁了。
注意
fitz這個包是PyMuPDF的,只要安裝PyMuPDF就可以正常導入了。