經常在網上查詢文檔資料的朋友一定有過這樣的經歷:好不容易找到了需要的內容,可是別說下載了,連複製一句話都不給複製的。
尤其是 PDF 文檔和圖片類資料,就算我們充值下載到本地,很多也無法複製文本,只能手動慢慢照著打進去,或者利用OCR文字識別技術
OCR(optical character recognition)文字識別是指電子設備(例如掃描儀或數位相機)檢查紙上列印的字符,然後用字符識別方法將形狀翻譯成計算機文字的過程;即,對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面信息的過程。
早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數字。當時的識別效率也不高,進入20世紀90年代以後,隨著平臺式掃描儀的廣泛應用,以及我國信息自動化和辦公自動化的普及,大大推動了OCR技術的進一步發展,使OCR的識別正確率、識別速度滿足了廣大用戶的要求。
就是一款ORC文字識別技術軟體,可幫助我們解決這一類問題。
PandaOCR是網友miao_miao在GitHub上建立的一個項目。
它主打OCR文字識別,並附帶有自動翻譯、語音朗讀和彈窗提醒功能。PandaOCR最大的特點,就是完全免費無廣告,不會有任何功能限制。
軟體為單文件綠色版,下載後將文件解壓到一個文件夾中,雙擊運行 PandaOCR.exe 即可。
主要功能按鍵全部排列在右側和底部,控制面板各項功能非常清晰,大家按需要勾選設置即可。
該軟體包含了圖片識別、截圖識別、剪切識別這三大功能。它的截圖識別非常好用,快捷鍵是F4。在電腦任何位置,我們可以很方便地進行識別並翻譯。而且,每翻譯一段文字,它都會自動進行朗讀。
當然,對於可複製的文本,剪切識別也非常好用。建議大家打開「監聽文本並翻譯」和「顯示兩者」的設置。這樣我們最小化軟體後,右鍵複製文字,或者按F4截圖,它都會直接在屏幕右下角顯示識別翻譯結果。
PandaOCR內置了很多識別引擎和翻譯引擎,準確率非常高。它的輔助功能真的很好用,建議大家可以好好研究下設置裡的選項。
要注意的是,下載這款軟體,有時Windows安全中心會誤報。
這是作者給的說明,選擇信任的話,就在Windows安全中心選擇「允許在此設備上」