小叮噹Python人工智慧篇:一句代碼搞定圖文識別!

2020-12-16 IT小叮噹

在前幾篇文章「小叮噹Python人工智慧篇:圖文識別tesseract4.0引擎的安裝」、「小叮噹Python人工智慧篇:tesseract4.0引擎語言包的配置!」中已為大家介紹了如何安裝下載圖文識別開源引擎以及所需的安裝包的配置。

在tesseract4.0引擎及語言包已配置好的前提下,我們就用一句代碼通過python來實現人工智慧中的圖文識別

國產西遊記動畫,不僅承載著我們美好的童年記憶,而且蘊涵著簡單而有深刻的人生哲理。看過西遊記的人,想必都熟悉這句話,「西天取經不容易,容易幹不成大業績~」。

同樣在python中也是這樣,想要一句代碼實現圖文識別,想要一勞永逸,我們得把準備工作給做充分。僅僅安裝好圖文識別tesseract4.0引擎及相應的語言包是還不夠的。

我們還需安裝兩個庫pytesseractPIL

pytesseract庫的安裝

Step1.使用pip命令安裝:pip install pytesseract

Step2.配置pytesseract.py關聯安裝好的tesseract4.0引擎

以pycharm為例,我們新建一個python文件,名為ocr表示識別。

我們用import導入pytesseract,編寫代碼「text=pytesseract.image_tor_string()」將滑鼠定位在"image_to_string( )"字樣處,用「ctrl+左鍵」進入pytesseract.py文件。

進入pytesseract.py後我們發現,此時光標定位在了image_to_string( )函數定義。

我們滑動右側的滑動條,至pytesseract.py的開頭部分第26行,找到「tesseract_cmd」字樣。

將「tesseract_cmd」的值改為我們的tesseract引擎執行路徑「D:\Program Files (x86)\Tesseract-OCR\tesseract.exe」。

當我們修改值時會出現,編輯提示界面,我們在默認選項下點擊確定即可。

點擊確定後,即可看到tesseract_cmd的值已經被我們成功修改。

PIL庫的安裝

PIL庫的安裝較為簡單,我們直接使用命令:pip install pillow 即可安裝。

雖然小叮噹這裡網速不太好,但只要有耐心,稍等一會兒也是可以看到成功的曙光的~

一句代碼實現圖文識別

Step1.首先我們先準備好一張帶字的測試的圖片。如下圖「態度決定一切,成事在於認真」。

Step2.一句代碼實現

可見,除了庫導入和列印語句以外,我們就自己寫了一句代碼(如上圖紅框所示),便實現了對圖片中文字的識別。是不是很開心呀~

相關焦點

  • 小叮噹python人工智慧篇:輕鬆獲得英語課本電子版
    小叮噹這就為大家分享,利用人工智慧,輕鬆獲得英語課本電子版,方便大家對英語的學習與交流。正如孫子兵法所云:「知己知彼,方能百戰不殆!」要想獲得英語課本電子版,我們首先得了解英語課本!還記得「小叮噹Python人工智慧篇:一句代碼搞定圖文識別!」嗎?在那篇文章中,小叮噹已經為大家分享了如何使用一句代碼進行圖文識別。我們先利用截圖,將每個課文下的網址圖片保存下來。
  • 小叮噹python人工智慧篇:英文課文寫入word中
    在「小叮噹python人工智慧篇:輕鬆獲得英語課本電子版」中,已為大家分享通過人工智慧的圖文識別方法拿到英語課本的電子版。其思路是:通過課後網址--->拍照到電腦--->人工智慧圖文識別--->獲得大體正確的網址--->人工對比修正--->獲得正確網址--->訪問網址--->將內容複製粘貼到本地--->獲得課文電子版但是,這種方法仍需要我們通過網址訪問後,進行手工粘貼複製內容到本地
  • 小叮噹python人工智慧篇:讓Google為我們自動翻譯英語課文!
    在「小叮噹python人工智慧篇:英文課文寫入word中」,已為大家分享拿到word版的英文課文的方法。今天,小叮噹就為大家分享如何通過人工智慧使用python讓谷歌為我們自動翻譯出英文課文!在人工智慧「AI+」的新時代,機器翻譯的水平越來越高,雖然有些翻譯結果不盡人意,Google翻譯總體來說還是可以令人接受的。
  • python爬蟲實戰-爬取微信公眾號所有歷史文章 - (03) python結合tesseract-ocr做圖文識別
    這篇文章我們講講對一副圖片的特定區域做截取,並利用開源庫做圖紋識別。要實現這個步驟的原因是,最初想實現爬取微信公眾號歷史文章這個功能時,一番沒有抓包爬蟲經驗,於是為了獲取歷史文章的標題用於pdf列印時的命名,一番想到截圖後對圖片做圖文識別,然後點擊文章標題,進入到文章閱讀界面然後結合目標圖片識別「複製連結」來獲取到文章的連結。
  • Python和人工智慧有什麼關係?Python 和人工智慧的區別是什麼?
    人工智慧人工智慧是一個大的概念,在人工智慧下有計算機視覺,語音識別,自然語言處理等不同的技術領域,這些技術領域中在Github上又有許多開源的代碼可以直接用來開發,而這些代碼往往需要或者只支持人工智慧是一個大的範疇,包括很多方面的應用,比如機器學習,在機器學習中的回歸算法,它們是通過統計分析所有數據來建立多因式,然後求解式子,而在這個過程中程式語言起到的作用是清洗數據、處理數據、建立關係求解結果的作用,python適用於數據清洗且學習成本低,所以在一定程度上,好一部分人傾向於將python應用於人工智慧應用領域。
  • Python與人工智慧的關係原來是這樣的...
    ,如今,你要是不懂點AI、機器學習和python都不好意思說你是現代人,那麼python究竟和人工智慧什麼關係,為什麼人工智慧把python也給帶火了,今天就給大家簡單介紹下python和人工智慧的關係及應用,以及想要學人工智慧的你,究竟需要學些什麼python的知識,先來上兩張圖人工智慧和python的圖。
  • 「人工智慧師資班」(Python機器學習,圖像識別與深度學習,深度學習與NLP,知識圖譜,強化學習)
    ,加強國內各高等院校同行間的交流,培養國內的師資力量,將人工智慧最新實訓內容帶入課堂,特舉辦「人工智慧系列課程理論與實踐」培訓班。 3、用python演示鐵達尼號生存預測、二手車特徵選擇和識別以及紅酒分類
  • 乾貨 | 人臉識別的簡要介紹(附實例、Python代碼)
    本文將介紹人臉識別的基本思路和對代碼進行簡要分析。介紹你是否意識到,每當你上傳照片到Facebook上,平臺都會用人臉識別算法來識別圖片中的人物?目前還有一些政府在用人臉識別技術來識別和抓捕罪犯。此外,最常見的應用就是通過自己的臉部解鎖手機。
  • Python驗證碼識別:利用pytesser識別簡單圖形驗證碼
    ,涉及到計算機圖形學,機器學習,機器視覺,人工智慧等等高深領域……簡單地說,計算機圖形學的主要研究內容就是研究如何在計算機中表示圖形、以及利用計算機進行圖形的計算、處理和顯示的相關原理與算法。可以不用切割,有關圖片切割的方法參見這篇博客:http://www.cnblogs.com/apexchu/p/4231041.html四、利用pytesser模塊實現識別pytesser是谷歌OCR開源項目的一個模塊,在python中導入這個模塊即可將圖片中的文字轉換成文本。
  • 2020年流行的Python開發庫(人工智慧篇)
    本篇將從人工智慧應用的Python庫來繼續下面的介紹。初學Python的讀者也可以閱讀,都是從每種庫的功能和用處來描述的,不會用代碼和公式加深晦澀和艱深。 本篇將從人工智慧應用的Python庫來繼續下面的介紹。對AI有興趣的可以選擇如下教程入門機器學習。6.
  • Python不超過10行代碼就可實現人臉識別,教你辨別真假
    人臉識別技術大致由人臉檢測和人臉識別兩個環節組成。之所以要有人臉檢測,不光是為了檢測出照片上是否有人臉,更重要的是把照片中人臉無關的部分刪掉,否則整張照片的像素都傳給f(x)識別函數肯定就不可用了。人臉檢測不一定會使用深度學習技術,因為這裡的技術要求相對低一些,只需要知道有沒有人臉以及人臉在照片中的大致位置即可。
  • 自動化測試實踐之Python識別驗證碼
    ,涉及到計算機圖形學,機器學習,機器視覺,人工智慧等等高深領域……簡單地說,計算機圖形學的主要研究內容就是研究如何在計算機中表示圖形、以及利用計算機進行圖形的計算、處理和顯示的相關原理與算法。不過google的驗證碼基本上人類也只有30%的識別率。本文使用的驗證碼例子比較容易識別。
  • 2020Python+人工智慧學習路線圖,內附完整自學路線+視頻+工具經驗+面試篇
    2.知識點1)shell運維、腳本與變量運維簡介、shell簡介、腳本執行方法、開發規範2)shell常見命令進階表達式、linux常見符號、常見命令詳解3)shell流程控制選擇語句、循環語句、函數4)代碼發布與環境部署掌握代碼發布流程與環境部署5)手工代碼與腳本代碼發布掌握手工代碼發布與腳本代碼發布
  • Python系列之三——人臉檢測、人臉識別
    之前有利用C++和OpenCv寫過人臉識別的系列文章,對於人臉識別的基本理解和步驟流程等基本知識不做反覆敘述。比詹小白還要白的童鞋可以查看往期文章進行了解噢1.人臉識別(一)——從零說起2.人臉識別(二)——訓練分類器3.人臉識別(二)——訓練分類器的補充說明4.人臉識別(三)——源碼放送一、人臉檢測      python版人臉檢測基本上可以參照C++版本的程序,根據語法不同進行改寫即可。
  • Serverless 實戰:用 20 行 Python 代碼輕鬆搞定圖像分類和預測
    圖像分類是人工智慧領域的一個熱門話題,通俗來講,就是根據各自在圖像信息中反映的不同特徵,把不同類別的目標區分開。圖像分類利用計算機對圖像進行定量分析,把圖像或圖像中的每個像元或區域劃歸為若干個類別中的某一種,代替人的視覺判讀。
  • Python程序識別圖片和PDF上的文字(1)
    Wand、PyOCR或Pytesseract為python可以引入的第三方模塊,是外面的包裝,包裹的內核是圖片處理的軟體包Imagemagick和光學字符識別OCR(Optical Character Recognistion)軟體包,比如Tesseract。這個帖子介紹如何安裝Tesseract。字符識別OCR把圖片上的文字自動識別出來,轉換成我們能處理的字符串。
  • 開發一個文章簡繁體轉化的小工具(附python代碼)
    如果老闆給你一百篇文章,甚至給你一千篇文章,需要簡繁體轉化,該怎麼做?會編程的人參照以往項目的風格,大家一定會知道,可以用編程實現批量處理。哪怕是一百萬篇文章,只要一份代碼就能輕鬆鬆搞定。我們來看看用到的核心python包,hanziconv安裝命令: pip install hanziconv調用示例:是的,三句命令,就能實現簡繁體互轉,非常簡單。
  • 寫給醫生的人工智慧體驗課(六):零代碼!10分鐘帶你做出自己的AI識別醫學圖像
    (一):作為醫生,怎麼跟進人工智慧不落伍?2、寫給醫生的人工智慧體驗課(二):用比喻的方式形象講解神經網絡3、寫給醫生的人工智慧體驗課(三):利用SPSS、R、python建立簡單的神經網絡4、寫給醫生的人工智慧體驗課(四):基於scikit-learn識別導入的圖像5、寫給醫生的人工智慧體驗課(五):基於TensorFlow識別MNIST手寫數字今天我們講解
  • CVPR 2020文本圖像檢測與識別論文/代碼
    方向包括:1)場景文本檢測(Scene Text Detection),從街景等場景文本中檢測文本的位置,2 篇文獻均為不規則任意形狀文本的檢測;2)場景文本識別(Scene Text Recognition),對場景文本檢測得到的結果進行識別,共 4 篇文章;3)手寫文本識別(Handwritten Text Recognition),2 篇文章
  • 用Python進行圖文識別(OCR)
    它可以通過訓練識別出任何字體(只要這些字體的風格保持不變就可以),也可以識別出任何Unicode 字符。Tesseract的安裝與使用  Tesseract的Windows安裝包下載地址為:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe ,下載後雙擊直接安裝即可。