一款中英文識別的版面恢復利器 佳能掃描儀OCR

2020-12-17 搜狐數碼

  我雖說是一個軟體行家,但是絕大多數軟體的簡單操作我還是手到擒來。由於工作關係,用過了很多的文字識別軟體,俗稱OCR軟體,對於大多數這類軟體都覺得功能還可以,但總有不如意的地方。當朋友拿來一款新的佳能掃描儀和隨機的OCR識別軟體軟體的時候,我決定試用一下。

  所謂文字識別,就是把紙張的文字轉換成為可以用軟體編輯這些文字的工具,將原有的圖形文件轉換成為電子數據的文檔,便於保存,發送或是修訂。這就需要使用掃描儀,將列印或是報紙、雜誌等等文稿掃描成為圖片,然後再使用軟體將這些圖像上的文字轉換成為可以用word,excel等軟體進行編輯的文檔。

  佳能隨機軟體是RosettaStone。啟動這個軟體的時候,屏幕上出現一隻銜著字母的小鳥,後面黃色的巖石上面有很多鳥獸符號,聽說這是在尼羅河發現的埃及神石,上面記錄了埃及不同時代的文字,這可能是表示這款軟體對於文字識別的優勢。先看了一眼版本信息,竟然發現這款軟體的版權是佳能公司,一直以為佳能生產相機,外設,沒想到還有軟體開發呢。

  以前也使用過相關的識別軟體軟體,覺得應該沒有問題,但第一次用這個佳能掃描儀送的軟體,感覺還是有點不知所措。他的界面要比其他軟體顯得更工整,真是大公司的產品,但就是有點不知從哪裡開始的感覺。在屏幕左上有一個「Wizard」的按鍵,點擊按鍵彈出一個對話框:OCR嚮導第一步/共三步。有兩個選擇,掃描儀輸入和圖像文件輸入,它不僅支持掃描儀掃描的圖像也支持對已有得圖像進行識別。實際上這個按鍵是一個自動OCR的功能,讓用戶能夠根據提示進行文字識別工作。 選擇掃描儀輸入並點擊下一步,進入第二步:選擇區域劃分的方法。選擇了自動區域劃分。進入第三步:選擇輸出目標。可以選擇保存到文件,作為郵件的附件發送,保存到剪貼板,在文本窗口中顯示。我選擇了保存到文件,點擊結束按鍵。

  在做完設置後,自動彈出了佳能掃描儀的驅動程序。使用佳能掃描儀驅動的簡單模式,在掃描目標項目下有OCR(300dpi)的選項。預覽後直接點擊掃描就可以了。RosettaStone會直接將掃描後的圖像進行區域劃分,並進行識別工作,直接保存識別結果。在輸入文件名稱後,會提示保存文件的類型;包括帶框和無框的RTF文件,這個文件類型是Word軟體支持的類型;HTML文件格式,這是網頁使用的文件;文本文件;以及CSV文件,這個文件是EXCEL軟體支持的表格文件。如果想要立刻編輯這個文件,一定用「√」將「啟動相關應用程式」選中,這樣就可以啟動與保存文件類型相應的軟體進行編輯整理工作了。

  實際上,還可以通過Wizard旁邊的四個功能按鍵進行掃描識別工作,其作用和Wizard是相同的,只是需要按照提示操作,但加入了更多的個性化的步驟。其實為了保證識別效果,需要很多個人的操作方式。我們就以對雜誌上的文件進行文字識別加以說明。很多需要進行識別的文件會有一些雜質比如筆記,油汙等,特別是掃描後的圖像會更清晰,就需要在區域劃分前對版面進行一定的處理,用軟體提供的橡皮擦除識別區域外多餘的部分。對於黑色底的文檔識別,可以用黑白反轉功能。如果掃描文件沒有放置在正確位置而略有傾斜,這個軟體能夠進行自動傾斜校正功能。這樣做的好處就是提高掃描識別的效果,減少後期不必要的操作。

  在進行完區域劃分後,軟體會提示劃分的內容,綠色部分是中文文檔部分,黃色為英文文檔,藍色為圖像,粉色是表格區域。RosettaStone 軟體擁有強大的中、英文混排識別功能,能夠快速、準確地識別出不同區域內的英文和中文文字。對於中文豎排版的文件,也能夠在同一個區域劃分中進行有效劃分,並準確識別。當區域劃分時有不當的劃分區域,建議還是自己手動劃分,效果會更好。

  作為日常工作中大量運用的表格,RosettaSone 也能夠準確無誤的進行識別。所有識別結果會在軟體的右邊進行顯示。如果發現某些文字不能識別出來,用滑鼠拖住這部分,就會在右側的圖像中顯示原始的圖像。另外,如果點擊滑鼠右鍵還有分離模式和合併模式,這樣可以對照原有的文字圖像進行有效的修改,提高了軟體的使用效率。


 

  不過在這個區域中,用戶是看不到任何的圖像和表格的,在所有識別工組和校正工作結束後,需要點擊最後一個圖標「保存到文件」,這樣就能夠看到識別文件的版面恢復效果了。保存文件的格式上面已經說過就不再說明了。

  從識別效果來說,RosettaStone的識別率還是非常高的,我估計文字的識別率能夠達到98%左右。不過在中英文混排的位置由於字體和大小不同,會有一些出入。即使這樣,在我所用過的隨機附送的識別軟體中,這個識別率以及中英文混合識別的水平也超越了其他產品。主要是識別成了別的字或是出現分割的錯誤。最讓人不可小看的是在中文,英文同時存在的條件下,英文的識別率特別高。沒有出現其他品牌的亂碼現象。另外一個我非常喜歡的地方在於它能夠將原始文件的排版格式還原在電子文檔中,圖像位置與文字的排版非常準確,不用再做二次處理了。


 

  總和而言,我覺得佳能送的這款軟體具有得天獨厚的優勢。不過很多功能我估計還沒有使用到。話說回來,再好的軟體如果各位只是停留在觀看而不去使用的話永遠不會發現他的好處的。想讓文字錄入工作變得輕鬆起來嗎,還不快點試試佳能掃描儀隨機文字識別軟體軟體——RosettaStone。


 


搜狗(www.sogou.com)搜索:"識別",共找到 9,066,293 個相關網頁
搜狗(www.sogou.com)搜索:"OCR",共找到 10,533 個相關網頁
搜狗(www.sogou.com)搜索:"區域劃分",共找到 17,018 個相關網頁

(責任編輯:王偉)

相關焦點

  • 你們要的快準狠的漢王PDF OCR光學識別神器-它來了
    漢王pdf ocr8.1簡體中文版是來自北京漢王科技開發的一款優秀的專業orc文字識別軟體,擁有所見即所得的版面還原功能
  • OCR(字符識別)軟體
    中文識別率排名:白描>Textgrabber>掃描全能王英文識別率排名:Textgrabber>掃描全能王>白描中英文混排識別率排名:Textgrabber>白描>掃描全能王總的來說,識別中文文檔推薦白描,識別英文文檔推薦 Textgrabber。
  • OCR識別技術,提高辦公學習效率利器!
    OCR(optical character recognition)文字識別是指電子設備(例如掃描儀或數位相機)檢查紙上列印的字符,然後用字符識別方法將形狀翻譯成計算機文字的過程;即,對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面信息的過程。
  • 分享一款能讓你每天提前下班的OCR文字識別軟體,良心推薦!
    比如早期人們通過掃描儀,後來人們發現在手機上用微軟的OfficeLens也不錯,也有人發現在電腦上用俄羅斯某款識別軟體也很棒!各種各樣的文字識別軟體,有免費的,有收費的,體積大小、各自功能都不太一樣。我挨個試了幾個,湊合著用吧,滿意的太。最近,我發現了一款名叫 「風雲ocr文字識別」的軟體,試了一下,激動得半天沒有說話。
  • OCR多彩世界
    並且支持多任務,可以在識別一篇文章的同時掃描或編輯其它文檔。對於每個區域可以設定不同的字體。版面分析前根據實際情況選擇「報紙版面」或「雜誌版面」可以提高版面分析正確性。對一般文本識別掃描解析度用300DPI比較合適,別小於5號的字可選400DPI。選擇「簡體全字集」或「繁體全字集」,能夠識別更多的字體和全部字符集,但識別速度較慢。
  • 輕鬆識別文字,這款Python OCR庫支持超過80種語言
    有一款軟體叫掃描全能王,想必一些小夥伴聽過,這是一個OCR集成軟體,可以將圖像內容掃描成文字。所以說,OCR作用是對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息。細心觀察便可發現,身邊到處都是OCR的身影,文檔掃描、車牌識別、證件識別、銀行卡識別、票據識別等等。OCR本質是圖像識別,其包含兩大關鍵技術:文本檢測和文字識別。
  • 輕鬆識別文字,這款 Python OCR 庫支持超過 80 種語言
    有一款軟體叫掃描全能王,想必一些小夥伴聽過,這是一個OCR集成軟體,可以將圖像內容掃描成文字。所以說,OCR作用是對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息。細心觀察便可發現,身邊到處都是OCR的身影,文檔掃描、車牌識別、證件識別、銀行卡識別、票據識別等等。
  • 支持直立掃描 佳能LiDE200掃描儀簡析
    【中關村在線辦公列印頻道原創】佳能LiDE 200是一款設計非常有特點的產品,考慮到消費者的實際需求,全部體現在產品應用中,在定價方面也比較合理,不過隨著產品的大量到貨,還有進一步降低的空間。佳能CanoScan LiDE 200掃描儀    佳能LiDE 200採用了白光LED作為掃描光源,能有效節省能耗。
  • 教你一款圖片文字識別軟體,快速提取文字!
    很明顯,光是一臺掃描儀是不足以讓這些文檔轉變成可以編輯的文檔,也就是Microsoft Word。掃描儀可以做的只是創建圖片或者一張黑白或者彩色的圖像文檔。為了從掃描文檔、PDF或者數碼圖片中提取文字和數據,你需要OCR軟體識別圖片上的信息,從單詞到句子,然後變成整個可以編輯的文檔。
  • 佳能推出G2000系列新品 三款生產型高速文件掃描儀
    【PConline 資訊】2019年1月3日,佳能(中國)有限公司(以下簡稱:「佳能(中國)」)宣布推出三款新的生產型高速文件掃描儀,分別為imageFORMULA DR-G2140、DR-G2110以及DR-G2090。
  • ABBYY FineReader:一款牛逼的OCR文字識別軟體
    (2)在PDF文檔集中,輕鬆插入添加遺漏的頁面,支持直接添加PDF文件、從掃描儀直接掃描添加、加空白頁等等。(1)你再也不用想著,將Word文檔的一階段設計文件怎樣轉換成PDF了。(2)你也不用擔心,想要引用人家好的文稿內容,苦於沒有源文件了。像我的這種施工圖中的文字、表格、圖片都可以輕鬆識別和轉換出來,需要引用工程量表到設計方案中,那不是輕鬆的事了。
  • Halcon OCR識別
    2.目標區域分割(ROI)對預處理後的圖像進行ROI提取,分割出單個字符組成的區域3.字符識別,即模式識別技術4.結果處理將識別完的文字按特定的次序和規則組合輸出!上述4個步驟中,OCR的核心部分自然是第3步,即模式識別技術模式識別技術訓練分類器第一步:將分割好的字符區域加入訓練集,使用函數append_ocr_trainf(Character,Image::Class,TrainingFile:)參數解析:Character:字符區域Image
  • ocr識別文字的方法,有什麼文字識別軟體推薦?
    ocr識別文字的方法有什麼?朋友小葵可以說是一枚文藝女青年了,平時就愛看看書、旅旅遊,還有彈彈吉他。對了,有時候她還會做下兼職投稿,給雜誌社寫寫文章。此外,小葵還有個興趣愛好是摘抄、記錄入心字句,做寫作素材。
  • 關於easyocr、paddleocr、cnocr之比較
    cnocr自帶了訓練好的識別模型,安裝後即可直接使用。cnocr主要針對的是排版簡單的印刷體文字圖片,如截圖圖片,掃描件等。cnocr目前內置的文字檢測和分行模塊無法處理複雜的文字排版定位。如果要用於場景文字圖片的識別,需要結合其他的場景文字檢測引擎使用。EasyOCR 是一個使用 Java 語言實現的 OCR 識別引擎(基於Tesseract)。
  • 文字識別(OCR)
    尤其是由清華大學電子工程系研製的清華TH一OCR產品和由漢王集團開發的尚書OCR產品,它們始終都處於技術發展的最前沿,並佔據著最大的市場份額,代表著印刷體漢字識別技術的發展潮流。目前,印刷體漢字識別技術的研究熱點已經從單純的文字識別轉移到了表格的自動識別與錄入,圖文混排和多語種混排的版面分析、版面理解和版面恢復,名片識別,金融票據識別和古籍識別等內容上。
  • 推薦幾款OCR識別App(提取圖像中的文字,適用安卓與ios)
    比如要把書上的文字複製下來, 需要照著書一個一個字打,但是如果通過ocr識別軟體, 我們就可以直接通過拍照的形式把這些文字截取下來.舉個例子:>控制模式必須因時制宜,一藥不能治百疾現在讓我們來看看人的行為如何被控制或影響。
  • OCR識別技術
    OCR(Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數位相機)檢查紙上列印的字符,通過檢測暗、亮的模式確定其形狀,然後用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,採用光學的方式將紙質文檔中的文字轉換為黑白點陣的圖像文件,並通過識別軟體將圖像中的文字轉換成文本格式,供文字處理軟體進一步編輯加工的技術。
  • 改天換地 佳能雷射列印鼓粉分離留懸念
    【中關村在線辦公列印頻道原創】日前,佳能推出多款商用辦公新品,包括11款採用鼓粉分離技術的A4幅面黑白雷射印表機、2款A4幅面商用噴墨印表機及2款專業照片掃描儀。易用性高,用戶更省心        佳能此次推出的雷射印表機新品中,「智能黑立方」雷射多功能一體機MF269dw及MF266dn配備了6行中英文觸控螢幕,其餘8款印表機MF263dn、MF913w、MF113w、MF112、LBP162dw、LBP161dn、LBP913w、LBP113w配備了5行中英文觸控螢幕,用戶可直接通過屏幕查看剩餘墨量
  • 這個超輕量中文OCR開源項目在Github火了
    光學字符識別(OCR)相信大家都不陌生,就是指電子設備(例如掃描儀或數位相機)檢查紙上列印的字符,通過檢測暗、亮的模式確定其形狀,然後用字符識別方法將形狀翻譯成計算機文字的過程
  • TH-OCR文字識別系統介紹
    一.TH-OCR  TH-OCR是英文Optical Character Recognition的縮寫,意思為光學字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數位相機等光學輸入設備獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態特徵,判斷出漢字的標準編碼,並按通用格式存儲在文本文件中,由此可以看出,OCR實際上是讓計算機認字