拋棄手寫和輸入 塗書筆記識別精度有多高?

2020-12-10 中關村在線

1拋棄手寫輸入 塗書筆記精度有多高?

     輸入一直是手機的軟肋,可是現在偏偏什麼時候都需要用到手機,記錄筆記、存放紙質文件等等手機是最好的工具,無奈受限於蹩腳的輸入,用手機記錄給我們徒增很多麻煩。市面上也有很多拍照掃描工具,把文字資料保存為圖片,但手機這張「小臉」卻天生不是查閱PDF的命。竊以為拍照自動識別文字並保存才是手機錄入的正確用法,於是有人突發奇想搞出了這款「塗書筆記」——塗抹你想要的文字,識別成文字自動錄入。


拋棄手寫和輸入 塗書筆記識別準度有多高?

    在「塗書筆記」之前我們也介紹夠非常多的文字識別工具,拍一張照片就可以把圖片中的文字識別出來,不過這裡也有一個嚴重的Bug,天知道我拍出的照片都是我想要的內容?因此在「圖塗筆記」中加入了手指塗抹的過程,這個塗抹就是人工識別的過程,把那些「搶鏡頭」的內容去除掉,讓手機專心識別你想要的內容。

 
塗書筆記工作流程

    「塗書筆記」的使用場景是怎麼樣的?比如看一本金庸小說,其中一段描述盪氣迴腸,你想迫不及待的記錄下來,拿筆寫下來太落伍,用手機拍下來看起來不方便,這個時候打開「塗書筆記」,開啟底部的攝像頭橫屏拍照(暫不支持豎屏),以最好垂直角度拍一張亮度足夠的照片,然後用手指塗抹你想要摘抄的那一段,接下來一段電子版的金庸武俠就快速的摘抄下來了,整個過程花不了30秒。

    「塗書筆記」的識別準確率怎麼樣?都能識別哪些文字?它能否替代手寫和拍照成為我輸入筆記的重要工具?下面我們就帶著這些問題來測試一番。

2實測塗書筆記對長文字識別精準度

實測塗書筆記對長文字識別精準度

    「塗書筆記」對小段內容的識別能力還是值得讚賞的,一般百字的內容基本上可以完全識別。


一段文字的識別


百分百識別

    我們也對多段長文字內容進行了測試,其中發現了一些問題。比如大段文字識別明顯反應變慢;識別率也有下降但也維持在90%以上;對標點符號和特殊符號的識別能力較弱,經常丟符號;無法識別段落並排版;光線較差時出現無法開啟散閃光燈的現象。


長段文字的識別


識別精度下降

    雖然有以上問題,但作為一款新生產品「塗書筆記」表現的還不錯,對於中文用戶來說拋掉輸入和手寫已經足夠了。

3英語、日語、繁體和手寫識別測試

英語、日語、繁體和手寫識別測試

    當然我們對「塗書筆記」的期待有很多,比如對英文識別,手寫識別以及其他國家語言識別的效果如何呢?我們也對這些問題記性了測試。

    三月份的版本中「塗書筆記」加入了英文識別功能,從測試來看效果還不錯。


英語識別測試


英文識別很準確


繁體輸入識別


識別效果很贊

    對於懶人來說不想抄筆記,那麼「塗書筆記」其實最適合大家,我們來測試一下手寫筆記能否識別。


手寫輸入


識別效果不佳

    事實證明「塗書筆記」並沒有給懶人抄筆記的機會,手寫筆記由於筆畫過於複雜很難識別,加之各種符號和手寫風格難以統一,「塗書筆記」現在還沒有這麼大的本事。


無法識別日文

    另外經過測試發現,像日文、韓文等還沒有加入識別功能,因此對於對於日韓愛好者來說錄入日韓文字還是手寫或者輸入吧。

4原理解析 文字識別技術是如何實現的?

原理解析 文字識別技術是如何實現的?

     OCR文字識別是指電子設備(例如掃描儀或數位相機)檢查紙上列印的字符,然後用字符識別方法將形狀翻譯成計算機文字的過程

    和語音識別技術一樣,人們對文字識別早在50年代就已經開始,並研製出光學字符識別器。60年代出現了採用磁性墨水和特殊字體的實用機器。60年代後期,出現了多種字體和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用於信函分揀的手寫體數字識別機和印刷體英文數字識別機。70年代主要研究文字識別的基本理論和研製高性能的文字識別機,並著重於漢字識別的研究。


漢王的文字識別

    像「塗書筆記」這樣的工具就是利用了現在的OCR文字識別技術,這個過程一般包括圖像輸入、預處理等,拍照其實就是圖像輸入的過程,接下來對圖片進行二值化處理,例如將彩色圖片黑白化,分為更容易識別的前景後景信息。     

    對於不同的文檔還需要進行噪聲處理,很多時候我們排出的圖片都不可避免出現傾斜這個時候也需要進行矯正處理。然後是字符切割,對於連筆的狀況進行切割處理,接著就是要對單個文字進行識別,比較早有模板匹配,後來以特徵提取為主,由於文字的位移,筆畫的粗細,斷筆,粘連,旋轉等因素的影響,極大影響特徵的提取的難度。

    最後還會有排版、後處理以及校對等環節,看似一個拍照的過程其實中間涉及到非常多的繁瑣過程,而真正識別出來的確需要很強大的技術。和語音的精準度一樣,提高文字識別的精準度也是我們追求的終極目標,不過這都是實打實的技術活,「塗書筆記」也只是在現有的技術基礎上提升用戶體驗。

相關焦點

  • 蘋果推出高精度手寫識別系統,可準確識別3萬字符集
    在手機、平板和可穿戴設備不斷普及的今天,手寫識別比以往任何時候都重要。但這並非易事,拿漢字來說,讓行動裝置識別大量手寫漢字字符還是個挑戰。由於漢字數量和書寫樣式多,手寫識別確實是個大挑戰。 字母類的語言也就涉及到100多個字母的排列順序,但在中國國家標準GB 18030-2005《信息技術中文編碼字符集》中就收錄了27533個字符。 日常生活中,人們只用得到最具代表性的一小部分。因此,國標GB2312-80《信息交換用字符編碼字符集·基本集》中僅包含6763個字符。
  • MyScript(Nebo&Calculator 2)-手寫識別、轉換和計算
    Nebo是一個記錄、編輯和轉換的筆記工具。您可利用標題、段落和列表來整理手寫筆記,然後將其轉換成文字形式,並同時保留排版、顏色和樣式,實現手寫輸入與文字識別同步進行。可以識別你所有手寫的內容,包括繪製圖表、數學公式、圖像批註和草圖繪製。66 種手寫識別語言。還可以將記錄的文件導出為Word、文本、PDF或者Html。
  • 蘋果這項新專利,會讓你手寫輸入中文更快
    如果 iPhone 有新功能的話,你希望是什麼?除了最近流傳的新一代 iPhone 將取消所有接口的傳言,我們也可以從蘋果的專利,大膽推測未來的 iPhone 會怎樣。▲ 實時手寫識別示意圖,圖片來自:美國商標管理局近日美國專利商標局公布了蘋果的一項新專利——「實時手寫識別技術」。該項專利上可以讓用戶在設備上進行手寫輸入,識別上萬個單手輸入的字符,尤其是中文。
  • 有道雲筆如何實現手寫筆記實時同步到雲端?
    不知道現在多少朋友還在記筆記呢?紙質筆記依然是快速記錄中最常用的方式,但是紙質筆記最麻煩的就是保存與同步了,使用電腦進行記錄雖然方便,但是效率不一定有手寫快,而且遇到圖形線條的記錄,往往就力不從心了。    其實筆者從學生時代,就想著如果有個東西,能夠一邊記錄,一邊保存,那麼絕對是必買黑科技。
  • 百度輸入法「手寫輸入」,不會拼音的人有福了,挺實用
    手寫輸入法在很早已經推出的,但是使用過程並不好,很多時候還沒有寫完,就已經顯示出別的文字,寫的速度過快也無法識別的。個人認為,手寫輸入法,要做好幾點:1、字跡潦草時候,識別準確率要高;2、寫字速度慢,也不會亂識別:3、寫得很快時,不會重疊出現其它字。做到這三點,才算是一款合格的手寫輸入法。
  • Nuance中文版T9 Write手寫輸入產品全面升級
    全球領先的語音、文字智能輸入和圖像解決方案提供商Nuance通訊公司(NASDAQ:NUAN) 日前宣布,針對基於手寫筆與觸控螢幕設備提供多點觸控以及重疊式輸入功能的升級版T9 Write手寫輸入產品正式發布。
  • 手寫輸入就是精準快 漢王筆Q先鋒+評測
    更加精準的輸入識別、更為靈敏的筆壓感應和便捷流暢的操作,這是市場對手寫板製造商的長期要求。此次評測的主角——漢王筆Q先鋒+,正是順應這一市場要求而生的佼佼者。4  手寫輸入,精準快捷  漢王筆Q先鋒+提供了7款手寫輸入相關軟體,能夠充分滿足使用者的不同需求。其中,漢王手寫窗口、漢王全屏幕、漢王輸入工具、漢王魔格輸入、漢王生肖輸入和漢王隨意籤主要用於手寫識別輸入,漢王閱讀精靈則用於聽讀文章內容。這些軟體的安裝渠道及方法和驅動安裝一致,非常簡便。
  • 華師期末每人手寫3萬字筆記 逼研究生多讀書
    「要命,每個人要手寫3萬字的讀書筆記!」對於華中師範大學教育學院《教育學原理》的期末考試,有學子稱這是該課史上最嚴考試。昨日,任課教師塗豔國教授表示,這樣做是為了「逼」研究生多讀點書。  參加這門課考試的是該學院2014級120名教育學類碩士生。此前,塗豔國翻閱了每位學子撰寫的3萬字的讀書筆記。
  • 手寫輸入的計算器應用MyScript Calculator
    和目前大家所熟悉的計算器應用不同,MyScript Calculator通過手寫輸入格式正確的算式,同時輸出結果可以是算式中任意部分的未知數。這種體驗與在紙上書寫一樣,而同時應用的計算並不僅僅局限於通過已知條件計算結果,也可根據已知的條件和結果推算出未知的條件。傳統的計算器Calcbot目前在iOS上的各款計算器應用,最受歡迎的就要屬Calcbot。
  • 訊飛輸入法3.0版:英文語音輕鬆輸入
    1月15日,訊飛輸入法3.0.1257版正式發布,新版本最大亮點是增加了英文語音輸入模式,和普通話、粵語輸入一樣,只要切換到英文模式,對著手機說英語,訊飛輸入法立馬識別你說的話! 國內首創英文語音輸入  告別「雞同鴨講」時代    當然,如果你想要練習英語口音,但又羞於表達自己,那麼訊飛輸入法也絕對是你的好幫手。
  • 百度輸入法整合手寫輸入方式,「自由寫」模式迎來新升級
    雖然目前多數人都會使用拼音輸入,但對於中老年用戶而言,手寫是最常用也是最易用的輸入方式,但由於使用智慧型手機的中老年人群體不夠龐大,人們對於這個群體在智能設備的使用方面也不夠重視,間接對手機輸入法的手寫輸入模式也並不熟悉,甚至有些輸入法都沒有提供「手寫模式」。
  • 賈伯斯最痛恨的手寫筆,卻陪蘋果度過漫長歲月
    PenLite 搭載的是經典的 Mac OS 作業系統,儘管 PenLite 支持手寫筆輸入,但實際上當時的手寫識別技術並不成熟,在 2012 年曝光的一段視頻中,可以看到當年蘋果工程師)和動畫《辛普森一家》都在作品中採用了 Newton 產品手寫識別失誤鬧笑話的梗,在《辛普森一家》中 Newton 手寫識別將「Beat up Martin」讀成「Eat up Martha」的橋段還出現在了 2015 年上映的電影《史蒂夫·賈伯斯》中。
  • 全棧AI工程師指南,DIY一個識別手寫數字的web應用
    ,下一篇文章將實現一個手寫字的輸入工具。 回到本篇的例子,我們在第2篇中已經寫過識別手寫字的代碼了,現在只需稍微調整下就可以形成一個python模塊,供其他文件調用了。 第四篇 介紹前端web單頁應用的開發 如果你練習裡前面三篇,相信你已經熟悉了Docker和Keras,以及Flask了,接下來我們實現一個提供給用戶輸入手寫字的前端web頁面。
  • 百度上線英語語音輸入功能識別準確率高得驚人
    本屆GMIC聚焦「人工智慧」,將主題定為:「AI」生萬物,寓意科學技術要有人文的溫度。早前,百度國際旗下的輸入法Facemoji將「人文的溫度」帶入AI技術,在海外又更新並上線了一項最新的人工智慧成果——英語語音輸入功能。
  • 高二物理:狀元手寫筆記(選修3-1可列印)家有高中生,給孩子看
    黑龍江省理科狀元:劉詩澤,有人可能聽說過,高考總分703,理綜294,他在談到物理學習時,多次提到高二一定要注重筆記,書上知識點很亂,筆記能第一時間幫助我們梳理清晰,這對高二學習非常重要。為了幫助高二的同學們學習,我給大家整理了物理選修3-1《狀元物理手寫筆記》整個高二上學期的筆記都在這。家長可以給孩子列印學習。
  • GO輸入法國際版中文手寫插件
    本插件只支持中文(包括繁簡體) 中文手寫插件介紹 1. 手寫支持簡體中文、繁體中文、字母、數字與標點的輸入 2. 手寫支持筆觸粗細設置、顏色的自定義 開啟G0輸入法手寫 1. 下載後安裝中文手寫插件,進入GO輸入法 2.
  • 科大訊飛摘得ICFHR 2020數學公式識別挑戰賽冠軍
    離線手寫數學公式識別(外源數據)榜單備註:「Correct」表示公式識別的句正確率,「」和分別表示整條公式中允許出現1處和2處錯誤的識別的句正確率技術頂天,掌握圖文識別「金字塔」級別難題「相比於常規的圖文識別,對數學公式的識別難度和技術挑戰往往更高。
  • 印象筆記攜全新智能滑鼠(EverMOUSE)亮相2020世界網際網路大會
    在「世界網際網路大會·網際網路之光博覽會」上,印象筆記帶來了最新發布的智能硬體產品——印象智能滑鼠(EverMOUSE)和印象掃譯筆專業版(EverSCAN Pro),讓參會觀眾感受到了更智能化的信息輸入體驗。印象筆記作為全球領先的知識管理平臺,始終堅持探索前沿科技,在不斷升級優化產品功能與體驗的同時,致力於記錄方式的創新拓展,以滿足用戶在不同場景下的信息輸入需求。
  • 百度輸入法上線「滑行輸入」功能,這是要一邊滑行一邊打字?
    手指只要在你要輸入的字符之間遊走一下,文字就很快地被打出來了。這種感覺真的還蠻神奇的。體驗了一會兒發現自己習慣於全拼雙指輸入,而這種「滑行輸入」的方式需要單指在各個字母間遊走。比如要從A走到L再走到W,路程太長時。打字效率就沒有雙指輸入那麼高。
  • iPhone如何添加輸入法?蘋果手機怎樣添加手寫輸入?
    蘋果手機用戶到今天來說還是有很多的。對於輸入法的選擇,有人喜歡九宮格,有人喜歡26鍵,也有喜歡手寫輸入,也有些喜歡筆畫輸入、五筆輸入法的。你喜歡哪種輸入法呢?你知道怎樣添加蘋果手機的輸入法嗎?如何快速切換輸入法?如果你不知道,下面就帶你解開這些疑惑。