itext mac中文特別版是一款從圖片中識別文字的OCR(光學字符識別)工具。通過截圖、拖拽圖片,即可以從掃描版的PDF等任意圖片中識字,並且可以很好的解決摘抄和批註需求。而且itext mac版使用騰訊、Google 雙引擎,識別效果驚人地準確。此軟體測試環境為10.14.4系統!
iText for mac特別版功能介紹
輕鬆選擇圖像
iText支持多種方式選擇圖像,操作非常方便。
捕獲屏幕
iText內置屏幕捕獲工具。只需按下快捷鍵1,捕獲屏幕上的任何區域,即可提取其中的文本。提示:已識別的文本已複製到系統剪貼板。你可以直接粘貼。
將圖像拖動到菜單欄圖標
例如,當您在Twitter中看到圖像並想要提取內部的文本或數字時,只需將圖像拖動到iText的菜單欄圖標,您就可以得到您想要的內容。
選擇圖像文件
當然,您也可以選擇要識別的圖片文件。但是,在這種情況下,優選上述拖動。
持續認可
例如,在PDF中截取不同位置的屏幕截圖,iText將依次識別文本並自動連接結果。
由Google提供支持
首先,我排除了脫機識別庫,因為離線庫已經死了,無法自我改進。接下來,在許多在線OCR服務中,我比較了微軟,谷歌等產品。最後,我選擇了Google的服務,因為它非常強大,可以識別50多種語言。
- 對於普通的自然語言,例如書頁,新聞稿,識別結果非常準確,甚至高達100%。
- 對於複雜排版,特別是對於特殊字符(例如,程序原始碼),識別結果不是那麼好,您可能需要在識別後手動修改結果。
- 例如,對於一條垂直線,機器無法區分小寫字母l或大寫字母I(順便說一句,你能識別它們嗎?); 相反,機器需要理解上下文以優化結果。但是現在機器很難理解程序原始碼之類的非自然語言。
優化識別結果
OCR服務可以準確地識別圖像中的文本,但不能用於進一步識別,例如段落識別等。
因此,iText包含自己的算法來優化結果,例如,
- 自動識別段落。
- 刪除英文單詞和標點符號之間的額外空格。
- 將英文的第一個字母大寫。
預覽原始圖像以進行校對
由於目前的OCR技術不能始終100%識別文本,因此有必要檢查原始圖像以修改結果。在iText中,您可以:
- 拖動圖像附近的結果窗口。
- 在結果窗口的左側顯示圖像。
自動翻譯
識別圖像中的文本後,iText可以自動將它們翻譯成100多種語言,由Google提供支持。