向AI轉型的程式設計師都關注了這個號👇👇👇
人工智慧大數據與深度學習 公眾號:datayx
現在各種手寫輸入法很容易就能識別出各種各樣的,潦草的字體。而OCR則還停留在對列印字體的識別上。為什麼不能把手寫輸入法的算法用在OCR上呢。
手寫識別和OCR是有一定區別的。
1. 手寫識別通常包涵更多的信息(這裡指的是在線識別,我接觸到的高識別率手寫識別都是在線識別), 如筆畫順序, 連筆等。 這些細節看似簡單, 卻在無形之中給識別提供了不少的特徵, 有助於識別率的提升。
2. 手寫識別的樣本預處理比較容易。 與OCR相比,手寫輸入的文字需要的預處理步驟較少。 通常手寫是一個字符一個字符錄入,位置比較固定,不會有太大的旋轉角度。 而OCR, 你是無法預知文字排布的。 OCR的樣本通常來自於掃描,拍照,樣本在解析度上顯然不如手寫識別, 而且會有很多噪聲。 特徵提取一般都是像素級別的, 因此這些噪聲對於識別來說是一個很大的挑戰, 尤其是對於中文這種字符集龐大且複雜的語言。
3. 手寫識別還有一個特性是它的識別過程是人為幹預的。當輸入一個字符時,識別引擎會根據輸入給出若干的識別結果,得分最高的為默認結果。如果這個結果不是你想要的,你仍然可以在若干個候選結果中選擇。而OCR,一個輸入對應一個輸出,最終你看到的只是分類得分最高的結果不能對識別進行實時的控制。
CRNN+CTCLoss中文手寫漢字識別
代碼獲取方式
關注微信公眾號 datayx 然後回復 手寫 即可獲取。
AI項目體驗地址 https://loveai.tech
閱讀過本文的人還看了以下:
分享《深度學習入門:基於Python的理論與實現》高清中文版PDF+原始碼
《21個項目玩轉深度學習:基於TensorFlow的實踐詳解》完整版PDF+附書代碼
《深度學習之pytorch》pdf+附書源碼
將機器學習模型部署為REST API
FashionAI服裝屬性標籤圖像識別Top1-5方案分享
重要開源!CNN-RNN-CTC 實現手寫漢字識別
yolo3 檢測出圖像中的不規則漢字
同樣是機器學習算法工程師,你的面試為什麼過不了?
前海徵信大數據算法:風險概率預測
【Keras】完整實現『交通標誌』分類、『票據』分類兩個項目,讓你掌握深度學習圖像分類
VGG16遷移學習,實現醫學圖像識別分類工程項目
特徵工程(一)
特徵工程(二) :文本數據的展開、過濾和分塊
特徵工程(三):特徵縮放,從詞袋到 TF-IDF
特徵工程(四): 類別特徵
特徵工程(五): PCA 降維
特徵工程(六): 非線性特徵提取和模型堆疊
特徵工程(七):圖像特徵提取和深度學習
如何利用全新的決策樹集成級聯結構gcForest做特徵工程並打分?
Machine Learning Yearning 中文翻譯稿
螞蟻金服2018秋招-算法工程師(共四面)通過
全球AI挑戰-場景分類的比賽源碼(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(列印收藏)
python+flask搭建CNN在線識別手寫中文網站
中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學習與特徵工程
不斷更新資源
深度學習、機器學習、數據分析、python
搜索公眾號添加: datayx
長按圖片,識別二維碼,點關注
AI項目體驗
https://loveai.tech