python人工智慧-圖像識別

2021-01-21 偉大程序猿的誕生
首先我們需要安裝PIL和pytesseract庫。

PIL:(Python Imaging Library)是Python平臺上的圖像處理標準庫,功能非常強大。
pytesseract:圖像識別庫。

我這裡使用的是python3.6,PIL不支持python3所以使用如下命令

pip install pytesseract
pip install pillow

如果是python2,則在命令行執行如下命令:

pip install pytesseract
pip install PIL

這時候我們去運行上面的代碼會發現如下錯誤:

錯誤提示的很明顯:
No such file or directory :"tesseract"

這是因為我們沒有安裝tesseract-ocr引擎

光學字符識別(OCR,Optical Character Recognition)是指對文本資料進行掃描,然後對圖像文件進行分析處理,獲取文字及版面信息的過程。OCR技術非常專業,一般多是印刷、列印行業的從業人員使用,可以快速的將紙質資料轉換為電子資料。關於中文OCR,目前國內水平較高的有清華文通、漢王、尚書,其產品各有千秋,價格不菲。國外OCR發展較早,像一些大公司,如IBM、微軟、HP等,即使沒有推出單獨的OCR產品,但是他們的研發團隊早已掌握核心技術,將OCR功能植入了自身的軟體系統。對於我們程式設計師來說,一般用不到那麼高級的,主要在開發中能夠集成基本的OCR功能就可以了。這兩天我查找了很多免費OCR軟體、類庫,特地整理一下,今天首先來談談Tesseract,下一次將討論下Onenote 2010中的OCR API實現。可以在這裡查看OCR技術的發展簡史。
Tesseract的OCR引擎最先由HP實驗室於1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。
數年以後,HP意識到,與其將Tesseract束之高閣,不如貢獻給開源軟體業,讓其重煥新生--2005年,Tesseract由美國內華達州信息技術研究所獲得,並求諸於Google對Tesseract進行改進、消除Bug、優化工作。


brew install tesseract

然後我們通過tesseract -v看一下是否安裝成成功

tesseract 3.05.01
leptonica-1.75.0
libjpeg 9b : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

這時候我們運行上面代碼會出現亂碼

這是因為tesseract默認只有語言包中沒有中文包,如下圖:

我們去GitHub下載我們需要的語言包,這裡我只下載了chi_tra.traineddata和chi_sim.traineddata
github:tesseract-ocr/tessdata
然後放到/usr/local/Cellar/tesseract/3.05.01/share/tessdata路徑下面。

可以通過tesseract --list-langs查看本地語言包:

可以通過tesseract --help-psm 查看psm

0:定向腳本監測(OSD)
1: 使用OSD自動分頁
2 :自動分頁,但是不使用OSD或OCR(Optical Character Recognition,光學字符識別)
3 :全自動分頁,但是沒有使用OSD(默認)
4 :假設可變大小的一個文本列。
5 :假設垂直對齊文本的單個統一塊。
6 :假設一個統一的文本塊。
7 :將圖像視為單個文本行。
8 :將圖像視為單個詞。
9 :將圖像視為圓中的單個詞。
10 :將圖像視為單個字符。

為什麼這裡要強調語言包和psm,因為我們在使用中會用到,
比如多個語言包組合併且視為統一的文本塊將使用如下參數:
pytesseract.image_to_string(image,lang="chi_sim+eng",config="-psm 6")
這裡我們通過+來合併使用多個語言包。

接下來我們看一下配置好一切的正確結果。

import pytesseract
from PIL import Image
image = Image.open("../pic/c.png")
code = pytesseract.image_to_string(image,lang="chi_sim",config="-psm 6")
print(code)



此時大公告成。

歡迎長按下圖 -> 識別圖中二維碼

或者 掃一掃 關注公眾號

⬇️


相關焦點

  • AI入門|人工智慧第2講:圖像識別(Python實現)
    圖像識別技術以及非常廣泛地應用於生活和生產之中,例如一些手機軟體可以識別出各種植物、花草等,再譬如人臉識別,也是一種特別的圖像識別技術
  • Python深度學習之圖像識別
    前面有幾講也是關於機器學習在圖像識別中的應用。今天再來講一個關於運用google的深度學習框架tensorflow和keras進行訓練深度神經網絡,並對未知圖像進行預測。導入python模塊導入圖像數據合併列表數據將圖片數據轉化為數組顯示一張圖片訓練神經網絡我們可以看到測試集的準確率達到99.67%
  • python|圖像識別
    影響力之大和最吸引人的技術就是圖像識別,圖像識別技術是人工智慧的一個重要領域,它是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術。今天以女神宋慧喬的兩張不同照片為例,利用python識別其相似度,從而判定是否是同一人,同時讓我們對圖像識別有個初步的了解,什麼?照片可以換蒼老師和波老師嗎?我懷疑你們在開車,可是我沒有證據!
  • 第85講 Python深度學習之圖像識別
    前面有幾講也是關於機器學習在圖像識別中的應用。今天再來講一個關於運用google的深度學習框架tensorflow和keras進行訓練深度神經網絡,並對未知圖像進行預測。導入python模塊導入圖像數據
  • 乾貨:Python+百度圖像識別進行圖像審查
    圖像識別在做平臺類應用的時候,我們經常要對用戶上傳的內容進行審核,包括圖片、視頻的內容中是否涉黃、暴力、血腥等等不合格內容的審核,過去這類工作只能靠人工審查。隨著人工智慧技術的發展,圖像識別技術的日趨完善,系統基本上可以代替人來去做這項工作,下面讓我們使用百度圖像審查API實現一段圖像審核功能,具體看截圖。
  • 驗證碼識別實例,python簡單圖像處理和實現
    基本識別原理概述:1、每一幅圖像在構成上,都是由一個個像素組成的矩陣,每一個像素為單元格。2、 彩色圖像的像素的由三原色(紅,綠,藍)構成元組,灰度圖像的像素是一個單值,每個像素的值範圍為(0,255)。
  • Python驗證碼識別:利用pytesser識別簡單圖形驗證碼
    常見工具為:支持向量機(SVM)OpenCV圖像處理軟體(Photoshop,Gimp…)Python Image Library二、PIL安裝PIL: Python Imaging Library, 是Python平臺的圖像處理標準庫,功能非常強大。
  • Agora新增支持Python:視頻通話中也可做圖像識別了
    Python 擁有很活躍的社區和豐富的第三方庫,Web 框架、爬蟲框架、數據分析框架、機器學習框架等,開發者無需重複造輪子,可以用 Python 進行 Web 編程、網絡編程,開發多媒體應用,進行數據分析,或實現圖像識別等應用。其中圖像識別是最熱門的應用場景之一,也是與實時音視頻契合度最高的應用場景之一。
  • 如何通過人工神經網絡實現圖像識別?
    人工神經網絡(Artificial Neural Networks)(簡稱ANN)系統從20 世紀40 年代末誕生至今僅短短半個多世紀,但由於他具有信息的分布存儲模式識別、智能控制及系統建模等領域得到越來越廣泛的應用。
  • mac使用python識別圖形驗證碼!
    在網上查了很多版本的圖形驗證碼識別,目前看到最多的兩個模塊是pytesseract和tesserocr,但是因為我這裡安裝tesserocr的時候各種出錯,所以最終我鎖定了使用pytesseract。那麼接下來,就記錄下安裝以及使用過程。這裡的系統環境是mac os 10.14.
  • [21NCN]楊弋:腦出血血腫擴大的影像學徵象及人工智慧識別
    ➤ 計算機視覺:應用於醫學圖像分析;無人駕駛;無人安防;人臉識別;➤ 語音識別:應用於醫療聽寫;語音書寫;電話客服;➤ 自然語言處理:應用於智能軟體;智能家居;諮詢顧問;➤ 機器人:應用於醫療機器人;工業;安防;危險區域作業
  • 基於python+OpenCV模塊的人臉識別定位技術
    本文將基於OpenCV模塊,在windows作業系統上,利用python語言,進行人臉識別技術的研究。當然OpenCV的應用領域很廣,除了人臉識別之外,它還支持圖像分割、動作識別、視頻處理等技術。其中frame是讀取的每一幀圖像。第7行表示將彩色圖像轉變為灰度圖像。第8行是對灰度圖像中的人臉進行識別定位,返回值為坐標信息。第10行畫出矩形框。第11行展示出圖像。第12行表示按鍵盤上的「q」鍵退出while true循環。14行和15行釋放攝像機,關閉窗口。
  • 用python識別驗證碼
    今天,我們就簡單的說下,怎麼用python來處理驗證碼。(注意:我所有的python相關的文章用的都是python3。)準備工作1、tesseract-ocr軟體Tesseract的OCR引擎最先由HP實驗室於1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。
  • Serverless 架構下 Python 輕鬆搞定圖像分類
    它利用計算機對圖像進行定量分析,把圖像或圖像中的每個像元或區域劃歸為若干個類別中的某一種,以代替人的視覺判讀。圖像分類在實際生產生活中也是經常遇到的,而且針對不同領域或者需求有著很強的針對性。例如通過拍攝花朵識別花朵信息、通過人臉比對人物信息等。
  • 利用Python來識別並提取圖片中文字
    文字識別是利用計算機自動識別字符的技術,是模式識別應用的一個重要領域。文字識別一般包括文字信息的採集、信息的分析與處理、信息的分類判別等幾個部分。隨著我國信息化建設的全面開展,OCR文字識別技術誕生20餘年來,經歷從實驗室技術到產品的轉變,已經進入行業應用開發的成熟階段。相比發達國家的廣泛應用情況,OCR文字識別技術在國內各行各業的應用還有著廣闊的空間。隨著國家信息化建設進入內容建設階段,為OCR文字識別技術開創了一個全新的行業應用局面。文通,雲脈技術、漢王等中國文字識別的領軍企業將會更加深入到信息化建設的各個領域。
  • 騰訊推微信智能開放平臺 開放圖像識別語音控制
    4月8日,微信宣布推出微信智能開放平臺(http://pr.weixin.qq.com/),該平臺包括圖像開放平臺和此前上線的語音開放平臺。  目前開發者已可登錄微信智能開放平臺官網,下載SDK包進行試用,或者也可以將相應智能技術服務接入到自己App。
  • 如何用Python和深度神經網絡識別圖像?
    沒有機器對圖像的辨識,能做到嗎?你的好友可能(不止一次)給你演示如何用新買的iPhone X做面部識別解鎖了吧?沒有機器對圖像的辨識,能做到嗎?conda create -n turi python=2.7 anaconda然後,我們激活turi虛擬環境。source activate turi在這個環境中,我們安裝最新版的TuriCreate。
  • 全球首款人工智慧模式仿生手、智能識別X光機在滬亮相
    原標題:超級義肢、智能X光機驚豔亮相  據《勞動報》報導,2019年全國大眾創業萬眾創新活動周將於6月13日至19日舉辦。昨日,記者在全國雙創周上海分會場探營看到,啟動儀式現場的各項工作已基本準備就緒,部分參展商已完成展區布展。全球首款人工智慧模式仿生手、智能識別X光機驚豔亮相。
  • 常用的十大 python 圖像處理工具
    作者 | Parul Pandey翻譯 | 安其羅喬爾、JimmyHua 編輯 | 王立魚原文連結:https://towardsdatascience.com/image-manipulation-tools-for-python-6eb0908ed61f
  • 使用Python和Tesseract來識別圖形驗證碼
    解壓縮之後,在主目錄下執行python setup.py install即可。識別的流程簡單來說如下:1. 用Image加載圖像,轉為RGBA格式,然後獲取像素數據;2. 將RGBA格式的像素數據轉換為0和1的字節串(其實就是二值化處理);3.