python人工智慧-圖像識別

2022-02-03 偉大程序猿的誕生
首先我們需要安裝PIL和pytesseract庫。

PIL:(Python Imaging Library)是Python平臺上的圖像處理標準庫,功能非常強大。
pytesseract:圖像識別庫。

我這裡使用的是python3.6,PIL不支持python3所以使用如下命令

pip install pytesseract
pip install pillow

如果是python2,則在命令行執行如下命令:

pip install pytesseract
pip install PIL

這時候我們去運行上面的代碼會發現如下錯誤:

錯誤提示的很明顯:
No such file or directory :"tesseract"

這是因為我們沒有安裝tesseract-ocr引擎

光學字符識別(OCR,Optical Character Recognition)是指對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面信息的過程。OCR技術非常專業,一般多是印刷、列印行業的從業人員使用,可以快速的將紙質資料轉換為電子資料。關於中文OCR,目前國內水平較高的有清華文通、漢王、尚書,其產品各有千秋,價格不菲。國外OCR發展較早,像一些大公司,如IBM、微軟、HP等,即使沒有推出單獨的OCR產品,但是他們的研發團隊早已掌握核心技術,將OCR功能植入了自身的軟體系統。對於我們程式設計師來說,一般用不到那麼高級的,主要在開發中能夠集成基本的OCR功能就可以了。這兩天我查找了很多免費OCR軟體、類庫,特地整理一下,今天首先來談談Tesseract,下一次將討論下Onenote 2010中的OCR API實現。可以在這裡查看OCR技術的發展簡史。
Tesseract的OCR引擎最先由HP實驗室於1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。
數年以後,HP意識到,與其將Tesseract束之高閣,不如貢獻給開源軟體業,讓其重煥新生--2005年,Tesseract由美國內華達州信息技術研究所獲得,並求諸於Google對Tesseract進行改進、消除Bug、優化工作。

brew install tesseract

然後我們通過tesseract -v看一下是否安裝成成功

tesseract 3.05.01
leptonica-1.75.0
libjpeg 9b : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

這時候我們運行上面代碼會出現亂碼

這是因為tesseract默認只有語言包中沒有中文包,如下圖:

我們去GitHub下載我們需要的語言包,這裡我只下載了chi_tra.traineddata和chi_sim.traineddata
github:tesseract-ocr/tessdata
然後放到/usr/local/Cellar/tesseract/3.05.01/share/tessdata路徑下面。

可以通過tesseract --list-langs查看本地語言包:

可以通過tesseract --help-psm 查看psm

0:定向腳本監測(OSD)
1: 使用OSD自動分頁
2 :自動分頁,但是不使用OSD或OCR(Optical Character Recognition,光學字符識別)
3 :全自動分頁,但是沒有使用OSD(默認)
4 :假設可變大小的一個文本列。
5 :假設垂直對齊文本的單個統一塊。
6 :假設一個統一的文本塊。
7 :將圖像視為單個文本行。
8 :將圖像視為單個詞。
9 :將圖像視為圓中的單個詞。
10 :將圖像視為單個字符。

為什麼這裡要強調語言包和psm,因為我們在使用中會用到,
比如多個語言包組合併且視為統一的文本塊將使用如下參數:
pytesseract.image_to_string(image,lang="chi_sim+eng",config="-psm 6")
這裡我們通過+來合併使用多個語言包。

接下來我們看一下配置好一切的正確結果。

import pytesseract
from PIL import Image
image = Image.open("../pic/c.png")
code = pytesseract.image_to_string(image,lang="chi_sim",config="-psm 6")
print(code)



此時大公告成。

歡迎長按下圖 -> 識別圖中二維碼

或者 掃一掃 關注公眾號

⬇️

相關焦點

  • 第85講 Python深度學習之圖像識別
    前面有幾講也是關於機器學習在圖像識別中的應用。今天再來講一個關於運用google的深度學習框架tensorflow和keras進行訓練深度神經網絡,並對未知圖像進行預測。導入python模塊導入圖像數據
  • 用 Python 進行 OCR 圖像識別
    用python就可以實現,採用現在流行的OCR圖像識別。主要思路是使用機器學習模式,通過已有圖片手動訓練出一個圖像識別模型,具體步驟如下:一、將圖片預處理,更方便計算機識別(一)把圖像灰化使用open-cv庫對圖片進行處理。
  • 人工智慧簡史
    三、數據1、無四、典型應用1、智能問答:1966年,美國軍方委託麻省理工學院的人工智慧學院編寫了ELIZA智能問答系統。這是自然語言對話技術的開端。2、視覺識別和聽覺識別應用於機器人:1967年,日本早稻田大學發明WABOT-1機器人原型,有攝像頭視覺和麥克風聽覺裝置。這是視覺識別和聽覺識別的開端。
  • Python 也能實現圖像姿態識別溺水行為了!
    眾所周知隨著人工智慧智能的發展,人工智慧的落地項目也在變得越來越多,
  • python圖像識別---------圖片相似度計算
    從機器學習的的角度來說,首先要提取圖片的特徵,將這些特徵進行分類處理,訓練並建立模型,然後在進行識別。但是讓計算機去區分這些圖片分別是哪一類是很不容易的,不過計算機可以知道圖像的像素值的,因此,在圖像識別過程中,通過顏色特徵來識別是相似圖片是我們常用的(當然還有其特徵還有紋理特徵、形狀特徵和空間關係特徵等,這些有分為直方圖,顏色集,顏色局,聚合向量,相關圖等來計算顏色特徵),為了得到兩張相似的圖片,在這裡通過以下幾種簡單的計算方式來計算圖片的相似度
  • 圖像識別技術的應用及發展趨勢
    在這個環境下,計算機的圖像識別技術就顯得尤為重要。圖像識別是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。識別過程包括圖像預處理、圖像分割、特徵提取和判斷匹配。簡單來說,圖像識別就是計算機如何像人一樣讀懂圖片的內容。藉助圖像識別技術,我們不僅可以通過圖片搜索更快的獲取信息,還可以產生一種新的與外部世界交互的方式,甚至會讓外部世界更加智能的運行。
  • AI圖像識別技術的原理解析
    這項技術的計算機實現基本上類似於人類圖像識別的基本原理,但計算機不會受到人類感知和視覺中任何因素的影響。人類不僅要將存儲在大腦中的圖像記憶結合起來進行識別,還要利用圖像特徵對圖像進行分類,然後利用分類特徵對圖像進行識別。計算機還採用相同的圖像識別原理,利用重要圖像特徵的分類和提取,有效地消除無用的冗餘特徵,從而實現圖像識別。
  • EAIDK 人工智慧套件介紹--ROS無人駕駛教學與實踐套件
    EAIDK 功耗低,算力強,開發友好,部署方便,接口豐富,支持視覺處理與分析、語音識別、語義分析、SLAM等主流開源算法。地圖構建、自動導航避障、自動跟隨,還可以通過智能語音處理與計算機視覺等人工智慧技術,實現語音控制無人車動作,以及模擬交通信號識別等功能。
  • 如何使用Python進行人臉識別?
    與上篇文章一樣,這篇文章將會講解的比較細緻(手把手教你完成人臉識別)。本篇文章中主要講解code的編寫,算法的含義我們會在之後講解。提示:本文章分為:opencv、環境配置、face_detect、程序報錯。
  • 用 Python 實現溺水識別
    眾所周知隨著人工智慧智能的發展,人工智慧的落地項目也在變得越來越多,尤其是計算機視覺方面。所以今天我們也是做一個計算機視覺方面的訓練,用python來判斷用戶溺水行為,結合姿態識別和圖像識別得到結果。其中包括姿態識別和圖像分類。
  • 手把手教你用Python實現人臉識別
    安裝 git 、cmake 、 python-pip# 安裝 git$ sudo apt-get install -y git# 安裝 cmake$ sudo apt-get install -y cmake# 安裝 python-pip$ sudo
  • 【乾貨】快速上手圖像識別:用TensorFlow API實現圖像分類實例
    作者通過TensorFlow API快捷地實現一個命令行圖像分類例子,詳細介紹了如何按步驟下載模型、加載圖像、執行圖像識別命令。你不需要GPU,只要有一臺筆記本就可以按照作者的步驟進行操作,並最終完成圖像識別任務。教程非常方便快捷,讀完本文之後相信你能秒秒鐘實現一個圖像分類任務。專知內容組編輯整理。
  • OpenCV Python + Tesseract-OCR輕鬆實現中文識別
    安裝opencv-python開發包pip install opencv-python安裝Tesseract-OCR Python SDK支持下載Tesseract-OCR 5.0.0-alpha.20201127安裝包並安裝!
  • [資源]最強圖像放大神器:waifu2x v1.1.8,號稱採用人工智慧技術!像素驚人!
    waifu2x是一款來自日本的圖像放大軟體,號稱可以無損放大圖片,當然無損是不可能的,雖然標題寫無損放大會比較吸引人,但我不想騙人,但這個軟體在圖像放大絕對是一個神器
  • 使用OpenCV+Python進行人臉識別
    在本文的最後,你將能夠開發一個人臉識別程序來識別圖像中的人臉!目錄人臉檢測概述如果機器能夠在沒有人工幹預的情況下自動檢測圖像中的物體會怎樣?讓我們看看:人臉檢測是我們在圖像中檢測人臉的問題。人臉可能略有不同,但可以肯定地說,所有人臉都有特定的特徵。存在各種人臉檢測算法, Viola-Jones算法是現在也在使用的最古老的方法。
  • python || 識別紅外圖像
    工業領域大多都通過紅外成像設備來檢測設備狀態,但採集到的大規模紅外圖像如何快速識別異常並告警?1、首先,介紹一下HSV色值區間= 0 : loc1.append(j+10) loc2.append(i+10)print('異常部位中心坐標:',np.mean(loc1),np.mean(loc2))可以看出,最後輸出的坐標剛好對應圖像發熱位置。
  • 【CV】基於python和OpenCV構建智能停車系統
    根據複雜性和效率的不同,任何問題都具有一個或多個解決方案。目前智能停車系統的解決方案,主要包括基於深度學習實現,以及基於重量傳感器、光傳感器實現等。本期我們將一起通過使用攝像頭和少量代碼來實現最簡單的智能停車系統。該解決方案所使用的概念非常簡單。
  • 模板識別:使用OpenCV實現基於特徵的圖像對齊
    特徵點檢測器有兩個部分(1) 定位器識別圖像上在圖像變換下穩定不變的點,如平移(移位),縮放(增大/減小)和旋轉。定位器找到這些點的x,y坐標。ORB檢測器使用的定位器稱為FAST。理想情況下,兩個圖像中的相同物理點應具有相同的特徵描述。ORB使用名為BRISK的特徵描述子。詳細信息見:https://www.robots.ox.ac.uk/~vgg/rg/papers/brisk.pdf定位器和特徵描述子應用很廣泛。計算機視覺的許多應用中,我們分兩步解決識別問題a)定位;2)識別。
  • 用Python進行人臉識別「包括原始碼」
    關於Python人臉識別在這個python項目中,我們將構建一個機器學習模型,該模型從圖像中識別人pip install numpy opencv-python要安裝FaceRecognition,首先安裝dlib包。
  • 用python和Tesseract實現光學字符識別(OCR)
    本教程結束之後,您將能夠將圖像中的文本轉換為Python字符串數據類型。使用Tesseract-OCR和python本文分成以下三個部分:    1、學習安裝pythesseract軟體包,以便我們可以通過Python程式語言訪問Tesseract。