CRNN+CTCLoss中文手寫漢字識別

2021-12-30 機器學習AI算法工程


向AI轉型的程式設計師都關注了這個號👇👇👇

人工智慧大數據與深度學習  公眾號:datayx

現在各種手寫輸入法很容易就能識別出各種各樣的,潦草的字體。而OCR則還停留在對列印字體的識別上。為什麼不能把手寫輸入法的算法用在OCR上呢。

手寫識別和OCR是有一定區別的。

1. 手寫識別通常包涵更多的信息(這裡指的是在線識別,我接觸到的高識別率手寫識別都是在線識別), 如筆畫順序, 連筆等。 這些細節看似簡單, 卻在無形之中給識別提供了不少的特徵, 有助於識別率的提升。

2. 手寫識別的樣本預處理比較容易。 與OCR相比,手寫輸入的文字需要的預處理步驟較少。 通常手寫是一個字符一個字符錄入,位置比較固定,不會有太大的旋轉角度。 而OCR, 你是無法預知文字排布的。 OCR的樣本通常來自於掃描,拍照,樣本在解析度上顯然不如手寫識別, 而且會有很多噪聲。 特徵提取一般都是像素級別的, 因此這些噪聲對於識別來說是一個很大的挑戰, 尤其是對於中文這種字符集龐大且複雜的語言。

3. 手寫識別還有一個特性是它的識別過程是人為幹預的。當輸入一個字符時,識別引擎會根據輸入給出若干的識別結果,得分最高的為默認結果。如果這個結果不是你想要的,你仍然可以在若干個候選結果中選擇。而OCR,一個輸入對應一個輸出,最終你看到的只是分類得分最高的結果不能對識別進行實時的控制。


CRNN+CTCLoss中文手寫漢字識別

代碼獲取方式

關注微信公眾號 datayx  然後回復 手寫  即可獲取。

AI項目體驗地址 https://loveai.tech

閱讀過本文的人還看了以下:

分享《深度學習入門:基於Python的理論與實現》高清中文版PDF+原始碼

《21個項目玩轉深度學習:基於TensorFlow的實踐詳解》完整版PDF+附書代碼

《深度學習之pytorch》pdf+附書源碼

將機器學習模型部署為REST API

FashionAI服裝屬性標籤圖像識別Top1-5方案分享

重要開源!CNN-RNN-CTC 實現手寫漢字識別

yolo3 檢測出圖像中的不規則漢字

同樣是機器學習算法工程師,你的面試為什麼過不了?

前海徵信大數據算法:風險概率預測

【Keras】完整實現『交通標誌』分類、『票據』分類兩個項目,讓你掌握深度學習圖像分類

VGG16遷移學習,實現醫學圖像識別分類工程項目

特徵工程(一)

特徵工程(二) :文本數據的展開、過濾和分塊

特徵工程(三):特徵縮放,從詞袋到 TF-IDF

特徵工程(四): 類別特徵

特徵工程(五): PCA 降維

特徵工程(六): 非線性特徵提取和模型堆疊

特徵工程(七):圖像特徵提取和深度學習

如何利用全新的決策樹集成級聯結構gcForest做特徵工程並打分?

Machine Learning Yearning 中文翻譯稿

螞蟻金服2018秋招-算法工程師(共四面)通過

全球AI挑戰-場景分類的比賽源碼(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(列印收藏)

python+flask搭建CNN在線識別手寫中文網站

中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學習與特徵工程

不斷更新資源

深度學習、機器學習、數據分析、python

 搜索公眾號添加: datayx  

長按圖片,識別二維碼,點關注

AI項目體驗

https://loveai.tech

相關焦點

  • TensorFlow 2.0 中文手寫字識別(漢字OCR)
    不如來嘗試一下類別多大3000+的漢字手寫識別吧!!雖然以前有一些文章教大家如何操作,但是大多比較古老,這篇文章將用全新的TensorFlow 2.0 來教大家如何搭建一個中文OCR系統!讓我們來看一下,相比於簡單minist識別,漢字識別具有哪些難點:搜索空間空前巨大,我們使用的數據集1.0版本漢字就多大3755個,如果加上1.1版本一起,總共漢字可以分為多達7599+個類別!這比10個阿拉伯字母識別難度大很多!
  • CRNN:端到端不定長文字識別算法
    https://github.com/meijieru/crnn.pytorch  https://github.com/bai-shang/crnn_ctc_ocr_tf❞這是2015年就發表的一篇基於深度學習的OCR文章,且不用文字切割、可以處理任意長度的端到端文字識別方法。
  • python+flask搭建CNN在線識別手寫中文網站
    ,並經過圖片裁剪處理之後傳入CNN手寫中文識別的模型中進行識別,最後通過PIL將識別結果生成圖片,最後異步回傳給web端進行識別結果展示。中文總共50,000多漢字,常用的有3,755個。這裡主要對常見的3755個漢字進行識別。代碼獲取:關注微信公眾號 datayx  然後回復 手寫識別 即可獲取。
  • TensorFlow與中文手寫漢字識別
    Train,Validation到Inference,是一個比較基本的Example, 從一個基本的任務學習如果在TensorFlow下做高效地圖像讀取,基本的圖像處理,整個項目很簡單,但其中有一些trick,在實際項目當中有很大的好處, 比如絕對不要一次讀入所有的 的數據到內存(儘管在Mnist這類級別的例子上經常出現)…最開始看到是這篇blog裡面的TensorFlow練習22: 手寫漢字識別
  • 蘋果iPhone有望提供實時手寫識別技術 支持漢字
    蘋果似乎正在積極研發一套手寫識別系統,這意味著一旦這套系統完工,未來用戶將可直接通過手寫的方式在iPhone或iPad屏幕上輸入文字,而不是只能依賴於使用虛擬鍵盤,並且還可能原生支持中國中文漢字的輸入。
  • TensorFlow 與中文手寫漢字識別
    Train,Validation到Inference,是一個比較基本的Example, 從一個基本的任務學習如果在TensorFlow下做高效地圖像讀取,基本的圖像處理,整個項目很簡單,但其中有一些trick,在實際項目當中有很大的好處, 比如絕對不要一次讀入所有的 的數據到內存(儘管在Mnist這類級別的例子上經常出現)…最開始看到是這篇blog裡面的TensorFlow練習22: 手寫漢字識別
  • OCR文字識別——手寫漢字識別(一)
    OCR文字識別主要分為對於「印刷體字符」和「手寫體字符」,其中「手寫體字符」更不容易識別,想想自己寫的字就知道了(連自己都認不出來)  好了,下面讓我們開始吧~~~~~~~~~~~~  主要流程如下:二、準備工作  在做OCR手寫漢字識別之前,需要準備手寫漢字數據集,目前免費公開的數據集有中科院的「CASIA-HWDB脫機手寫漢字數據集」以及北京郵電大學的「HCL2000漢字資料庫」,下載地址如下:https://pan.baidu.com/s/1ZmQP8hx8DYiYG5i5dr0aGg
  • python+flask搭建CNN在線識別手寫中文網站!簡直太屌了!
    使用python+flask搭建的一個網站,然後從網頁的寫字板上獲取滑鼠手寫的漢字經過轉碼後傳回後臺,並經過圖片裁剪處理之後傳入CNN手寫中文識別的模型中進行識別
  • addleHub一鍵OCR中文識別(超輕量8.1M模型,火爆)
    name=chinese_ocr_db_crnn_server&en_category=TextRecognition該 Module 用於識別圖片當中的漢字、數字、字母。如果僅需要檢測,也可單獨使用chinese_text_detection_db_server或者chinese_text_detection_db_mobile得到檢測結果的文本框開發者可以基於PaddleHub提供的OCR中文識別Module,實現一鍵文字識別,適用於常見的OCR應用場景中。
  • 手寫漢字更具獨特魅力
    中文輸入和顯示治標不治本    信息化中漢字問題的關鍵在於漢字的輸入,如果連輸入都解決不了,更無法解決顯示和輸出的問題了。20世紀90年代初出現了很多中文輸入法,如中文之星、智能ABC等,在中文輸入方面做出了有益嘗試,對電腦普及起到了很大作用。    然而這些輸入法也具有局限性。
  • GitHub 熱榜:文字識別神器,超輕量級中文 OCR!一個超級厲害的開源庫
    光學字符識別(OCR)技術已經得到了廣泛應用。比如發票上用來識別關鍵字樣,搜題 App 用來識別書本上的試題。
  • 超輕量級中文OCR,支持豎排文字識別、ncnn推理,總模型僅17M
    整理 | AI科技大本營光學字符識別(OCR)技術已經得到了廣泛應用。比如發票上用來識別關鍵字樣,搜題App用來識別書本上的試題。近期,這個叫做chineseocr_lite的OCR項目開源了,這是一個超輕量級中文ocr,支持豎排文字識別,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 總模型僅17M。目前,這個開源項目已在GitHub上標星2400+。
  • ...開發日記:如何設計能在Apple Watch上實時運行的中文手寫識別...
    近日蘋果在上面就放出了一篇關於識別手寫中文的文章,介紹了自己對這個功能的思考和實現過程。雖然文章中沒有什麼全新的技術,但也不失為一篇有誠意的開發經驗分享。雷鋒網(公眾號:雷鋒網) AI 科技評論把文章編譯如下。
  • SMART發布中文手寫體識別軟體
    【2月27日太平洋電腦網北京訊】近期,全球頂尖的電子白板生產商SMART發布了其最新研製的中文手寫體識別軟體,這是SMART產品首次實現中文直接輸入。此次增加中文識別後,SMART軟體支持的語言文字將達到34種,基本涵蓋了全球主流的文字,充分體現出了SMART產品全球性的特徵。
  • 用手寫打開中文輸入新視野,搜狗輸入法開啟高效手寫模式
    漢字是世界上最古老的文字之一,因其蘊含的結構美、音調美、內涵美而被贊為世上最美好的文字。漢字總共有多少字?到目前為止,恐怕沒人能夠答得出非常精確的數字。隨著信息化時代的迅猛發展,人們熱衷於在鍵盤上敲打漢字,習慣於方便快捷的輸入方式,印刷版文字隨處可見。提筆忘字、會讀不會寫的情況屢見不鮮。低效率的手寫註定會被淘汰,或者說手寫文化真的落伍了嗎?
  • 提筆忘字:書寫對漢字識別及閱讀的影響
    越多使用電子設備,人們就越少手寫漢字。延續數千年的漢字正面臨著巨大的「威脅」。提筆忘字,只知其音不知其形、只知其形不知其音的現象非常常見。漢字書寫頻率的降低影響了人們對漢字加工過程中的識字、閱讀等能力。  漢字的結構複雜,分為整字、聲旁,形旁、部件、筆畫等不同的結構水平。
  • 蘋果推出高精度手寫識別系統,可準確識別3萬字符集
    但這並非易事,拿漢字來說,讓行動裝置識別大量手寫漢字字符還是個挑戰。量子位將這篇博客中的要點翻譯整理,與大家分享——簡介手寫識別能夠提高用戶在行動裝置上的體驗,尤其適用於漢字這種相對複雜文字的使用者。由於漢字數量和書寫樣式多,手寫識別確實是個大挑戰。字母類的語言也就涉及到100多個字母的排列順序,但在中國國家標準GB 18030-2005《信息技術中文編碼字符集》中就收錄了27533個字符。
  • 論文推薦|[PR 2020]基於HDE編碼的零樣本手寫漢字識別
    論文主要是提出了一種HDE編碼方法,即將漢字的分解序列映射到一個Embedding空間,然後進行手寫漢字的零樣本識別。零樣本識別簡單來說就是測試集的類別沒有在訓練集中出現。由於漢字龐大的類別數、不常用漢字的樣本十分稀缺、數據標註的成本很高等原因,使得傳統的讓測試集類別出現在訓練集的識別策略會有很多的困難。如果可以做到零樣本識別,就可以一定程度上解決這些問題。
  • 靈雲手寫識別平臺 讓手寫輸入行雲流水
    靈雲智能手寫識別平臺是提供單一技術能力的靈雲全智能能力平臺系列產品之一,該平臺採用了捷通華聲打磨16年之久的iWrite手寫識別引擎,支持中文行寫、疊寫,以及西文連筆手寫,識別準確率高達99%,讓手寫輸入行雲流水,一氣呵成。
  • Win7增強Tablet PC功能 支持中文手寫
    微軟在筆觸操作和手寫輸入方面並不算太差,例如Tablet PC就取得了不錯的口碑。不過微軟似乎並不滿足現有的成果,並希望在Windows 7系統中加強這部分能力。根據微軟在MSDN上發表的博客文章顯示,微軟在東亞語言輸入、識別方面取得了一定的成功,並加入了支持多點觸摸的軟鍵盤功能。