Python人工智慧之圖片識別,Python3一行代碼實現圖片文字識別

2022-01-10 python教程

我們以識別詩詞為例 
下面是我們要識別的圖片

先看下效果圖

我們運行代碼後識別的結果,有幾個字沒有正確識別,但是大多數字都能識別出來。

一行代碼就能識別圖片,我們背後要做些準備工作的下面就來講講這幾個庫的安裝,因為只有這幾個庫安裝好以後Python才能實現一行代碼實現圖片文字識別一,pytesseract和PIL的安裝

安裝這兩個包可以藉助pip 
- 1,命令行安裝 
pip install PIL 
pip install pytesseract 
- 2,如果你用的pycharm編輯器,就可以直接藉助pycharm實現快速安裝。 
在pycharm的Settings設置頁按照下面步驟操作 

這樣就能成功安裝pytesseract,安裝PIL只需要在上面第三步裡搜索PIL並點擊安裝即可 這時我們安轉好了庫,運行下面代碼

會報下面錯誤,錯誤原因是:沒有安裝識別引擎tesseract-ocr

二,安裝識別引擎tesseract-ocr

http://download.csdn.net/download/qiushi_1990/9987023

解壓安裝tesseract-ocr後做如下操作,就可以支持中文識別了。因為tesseract-ocr默認不支持中文識別。 

也可以通過pycharm快速打開pytesseract.py

至此我們所有的配置就完成了,運行下面代碼就可以把杜甫的登高這首圖片詩解析成文字了

ps:推薦一下我建的python學習交流扣扣qun:937667509,群裡有免費的視頻教程,開發工具、電子書籍、項目源碼分享。學習python web、python爬蟲、數據分析、大數據,人工智慧等技術有不懂的可以加入一起交流學習,一起進步!

長按下面二維碼關注我

微信公眾號:python教程

相關焦點

  • Python程序識別圖片和PDF上的文字(1)
    接下來的帖子介紹一種識別PDF非英文文字的方法:先引進第三方模塊Wand把PDF文件轉成圖片,再引進第三方模塊PyOCR或Pytesseract把圖片上的文字識別出來。Wand、PyOCR或Pytesseract為python可以引入的第三方模塊,是外面的包裝,包裹的內核是圖片處理的軟體包Imagemagick和光學字符識別OCR(Optical Character Recognistion)軟體包,比如Tesseract。這個帖子介紹如何安裝Tesseract。字符識別OCR把圖片上的文字自動識別出來,轉換成我們能處理的字符串。
  • 小叮噹Python人工智慧篇:一句代碼搞定圖文識別!
    」中已為大家介紹了如何安裝下載圖文識別開源引擎以及所需的安裝包的配置。在tesseract4.0引擎及語言包已配置好的前提下,我們就用一句代碼通過python來實現人工智慧中的圖文識別。同樣在python中也是這樣,想要一句代碼實現圖文識別,想要一勞永逸,我們得把準備工作給做充分。僅僅安裝好圖文識別tesseract4.0引擎及相應的語言包是還不夠的。我們還需安裝兩個庫pytesseract和PIL。
  • 如何實現一個文字圖片識別程序
    ,覺得甚是有趣,花費半日也做了個在線圖片識別程序,完成了兩個技術方案的選擇,一是 tesseract + Python flask的方案實現,二是 tesseract + Spring web 的技術解決方案,並簡作論述,與君共勉。
  • 基於Tesseract實現圖片文字識別!
    配置環境變量:四.python代碼實現1 2 """ 3 Spyder Editor 4 5 This is a temporary script file.可知對中文的識別一塌糊塗,因此建議還是使用版本4進行識別!
  • Python文字識別OCR案例:搞定PDF掃描件和圖片文字內容(原始碼)
    文字識別OCR技術目前已經是一種常見的Data Entry實現方式,自動識別PDF掃描件和圖片上的文字,然後用於數位化和自動化系統,實現Saving和工作效率和質量上的提高,這是一種技術趨勢。但是,目前OCR技術幾乎實現不了100%文字識別正確率。那麼,原因何在呢?我認為最主要的原因有兩點:第一、PDF文件和圖片的清晰度質量問題清晰度和對比度直接影響了文字識別OCR的正確率,很多時候清晰度不夠高,人眼都無法識別,更不要說AI了。
  • 圖片文字識別
    直接截取圖片上的文字,不僅不清楚,而且不能編輯。使用者反應效果差。直到有了圖片文字識別工具。圖片文字識別依據的是文字識別的原理,通過對文字的亮、暗檢測,判斷到底是哪個文字,與字符庫對比,輸出文字。圖片文字識別技術趨於完美。將一張圖片放置在圖片文字識別軟體中,通過ocr技術識別出其中包含的文字。圖片文字識別軟體,能夠識別。
  • Python實現圖片滑動式驗證識別
    由於研究的實驗對象實在是太簡單,所以本文涉及的一些圖像學的知識也不難,基本上python的初級選手就可以跑通本程序。僅供大家學習學習。3 研究對象某小站點上由小廠商提供的"滑動式驗證":使用python寫一個簡單的爬蟲自動化腳本,將此網站上的驗證碼資源多請求幾次,並保存到本地,觀查圖片特點。
  • 利用Python來識別並提取圖片中文字
    文字識別是利用計算機自動識別字符的技術,是模式識別應用的一個重要領域。文字識別一般包括文字信息的採集、信息的分析與處理、信息的分類判別等幾個部分。隨著我國信息化建設的全面開展,OCR文字識別技術誕生20餘年來,經歷從實驗室技術到產品的轉變,已經進入行業應用開發的成熟階段。相比發達國家的廣泛應用情況,OCR文字識別技術在國內各行各業的應用還有著廣闊的空間。隨著國家信息化建設進入內容建設階段,為OCR文字識別技術開創了一個全新的行業應用局面。文通,雲脈技術、漢王等中國文字識別的領軍企業將會更加深入到信息化建設的各個領域。
  • 圖片文字識別軟體 – 在線圖片文字識別
    圖片文字識別軟體 – 在線圖片文字識別圖片文字識別軟體 – 在線圖片文字識別。
  • Python程序圖片和pdf上文字識別實例一二
    實例一:先減少背景雜音,再做圖片文字識別 為了提高識別率,先用opencv-python對掃描的圖片做預處理(減少背景雜音),然後調用pytesseract
  • 通過Python寫一個OCR圖片識別小程序
    在我們的日常辦公中,經常有識別圖片中的大段文字的需求。
  • 使用Python製作一個簡易的OCR圖片文字識別工具
    今天帶領大家使用Python製作一個簡易的OCR圖片文字識別工具,來解決這類問題。,英文全稱是Optical Character Recognition,說白了就是從電子設備中顯示的圖片上面查找我們需要的字符,通過檢測、識別將字符翻譯成計算機文字的過程。
  • 拍照可以識別圖片嗎?什麼文字識別工具可以識別圖片?
    很多人在日常生活中都需要用到提取圖片文字,但是這是讓人非常煩惱的事情,很多人看到此時就覺得頭疼,但是又必須要去做。以前大家採取的方法就是掃描截圖然後打出來保存資料,非常浪費時間,隨著科技的發展,現在已經不用這麼麻煩。我們今天就來學習拍照可以識別圖片嗎?
  • 自動化測試實踐之Python識別驗證碼
    ,涉及到計算機圖形學,機器學習,機器視覺,人工智慧等等高深領域……簡單地說,計算機圖形學的主要研究內容就是研究如何在計算機中表示圖形、以及利用計算機進行圖形的計算、處理和顯示的相關原理與算法。三、一般思路驗證碼識別的一般思路為:1、圖片降噪2、圖片切割3、圖像文本輸出3.1 圖片降噪所謂降噪就是把不需要的信息通通去除,比如背景,幹擾線,幹擾像素等等,只剩下需要識別的文字,讓圖片變成2進位點陣最好。
  • Python不超過10行代碼就可實現人臉識別,教你辨別真假
    OpenCV的Python環境簡單驗證一行代碼驗證OpenCV的Python環境是否成功:$python -c 「import cv2; print dir(cv2)」如果輸出了很多cv2 的屬性和函數名的字典,就表示成功;否則的話,還需要繼續填坑。
  • 使用QQ輕鬆識別圖片中的文字
    在日常中,有時侯需要將一張圖片上的文字提取出來,這個時候怎麼辦呢?如果文字較少的話手動打一下就行了,但是如果文字較多,打字速度又不是很快,這個時候就需要文字識別功能,現在文字識別軟體比較多。但是其實使用某迅的QQ也是可以識別圖片文字的。
  • 在線圖片識別文字方法,圖片識別文字網站有哪些?
    今天,朋友出來和誠誠約飯,一臉的焦急,似乎有什麼急事兒一樣,詢問之下才知道,原來他手頭有很多「簡單粗暴」的工作,需要將很多圖片中的信息打出來,然後整理好。誠誠當時聽完就無語了,難道這個年代了,要識別圖片中的文字,有人還在用傳統的碼字的方法嗎?
  • Python調用百度AI製作簡易OCR圖片文字識別工具(完結篇)
    前兩篇,我們使用百度AI調用製作了一個OCR圖片文字識別工具。今天,我們對這個工具進行進一步完善。通過tkinter相關技術實現窗口拆分,在此基礎上增加圖片大小調整的功能,並對前兩篇進行梳理,提供程序的全部原始碼,方便大家使用。
  • 用Python寫了一個圖像文字識別OCR工具
    在之前的文章裡,我們多次嘗試用Python實現文本OCR識別!點擊藍字查看歷史文章👉OCR識別的花樣使用、5行Python實現驗證碼識別、3行Python代碼識別圖片文字。不過今天我們要搞一個升級版:直接寫一個圖像文字識別OCR工具!引言最近在技術交流群裡聊到一個關於圖像文字識別的需求,在工作、生活中常常會用到,比如票據、漫畫、掃描件、照片的文本提取。
  • OpenCV對圖片做識別前的預處理
    識別前用OpenCV預處理圖片以減少背景噪音對文字的幹擾可以提高圖片文字的識別率和正確率。OpenCV的話題自己可以成一本書,這裡我們只是最淺層地使用它的功能函數。第三方模塊opencv-python幫助我們在python程序中應用openCV,老規矩:先安裝(opencv-python)後引進(import cv2)。