實用:使用Python+百度圖片識別提取營業執照信息

2020-12-03 愛語桐說

營業執照樣本

在很多應用場景中,會得到客戶營業執照圖片,如何將營業執照裡面的信息保存到系統,在過去主要靠人工錄入,既浪費時間、浪費人力,準確率也不是很好,人工智慧時代,利用百度圖片識別技術,很容易解決這一難題,Python示例如下:

天哪,很簡單,有木有,有木有?簡單的幾行代碼就搞定了,人工智慧技術極大的提高了工作效率,當然需要我們不斷學習的內容也越來越多,以下是代碼,隨意Copy,拿走不謝o(* ̄︶ ̄*)o

# -*- coding:utf-8 -*-

from aip import AipOcr

""" 你的 APPID AK SK """

#APP_ID = '你的 App ID'

#API_KEY = '你的 Api Key'

#SECRET_KEY = '你的 Secret Key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 讀取營業執照圖片

def get_file_content(filePath):

with open(filePath, 'rb') as fp:

return fp.read()

image = get_file_content('E://work//baiduaudio//zhizhao.jpg')

# 調用營業執照識別

result = client.businessLicense(image)

# 獲取返回識別結果

if isinstance(result, dict):

print result

print '#############'

words = result['words_result']

# 列印營業執照信息

for k, v in words.items():

print(u'{k}:{v}'.format(k=k, v=v['words']))

結果如下截圖,如果想將識別的內容存到excel或者資料庫,可以自行實現相應的功能。

營業執照識別結果

最後,吐槽一下,百家號就不能支持markdown嗎,程序代碼的顯示實在太難看了。

相關焦點

  • 使用Python+百度OCR文字識別提取圖片內容
    百度文字識別 工作中,我們常常會將圖片中的文字整理成word文檔,過去主要依靠人工識別,費時費力,隨著人工智慧技術的發展,OCR文字識別的準確度越來越高,此項工作完全可以交給系統來完成了,下面是一段Python版的文字識別代碼,使用了百度的「百度文字識別接口」。
  • 利用Python來識別並提取圖片中文字
    文字識別是利用計算機自動識別字符的技術,是模式識別應用的一個重要領域。文字識別一般包括文字信息的採集、信息的分析與處理、信息的分類判別等幾個部分。在文字識別中,許多應用軟體可以幫我們忙,那麼強大的python可以實現圖片中的文字識別嗎?    在學習python的圖像識別中,我們了解到關於中文的識別,效果比較好而且開源的應該就是Tesseract-OCR了,python裡面也有一個包去使用Tesseract-OCR,這個包叫pytesseract。
  • Python調用百度AI製作簡易OCR圖片文字識別工具(完結篇)
    前兩篇,我們使用百度AI調用製作了一個OCR圖片文字識別工具。今天,我們對這個工具進行進一步完善。通過tkinter相關技術實現窗口拆分,在此基礎上增加圖片大小調整的功能,並對前兩篇進行梳理,提供程序的全部原始碼,方便大家使用。
  • 怎麼用工具識別圖片文字?超實用的圖片文字識別方法
    怎麼用工具識別圖片文字?有關圖片識別文字的問題相信很多小夥伴都遇到過,例如當我們看上網頁上的文本內容不能直接提取時,就可以將其製作成圖片的形式然後再用工具識別其中的文字信息達到提取效果。接下來分享一個超實用的圖片文字識別方法,有需要的小夥伴可以學習一下喲!
  • 使用Python製作一個簡易的OCR圖片文字識別工具
    今天帶領大家使用Python製作一個簡易的OCR圖片文字識別工具,來解決這類問題。,英文全稱是Optical Character Recognition,說白了就是從電子設備中顯示的圖片上面查找我們需要的字符,通過檢測、識別將字符翻譯成計算機文字的過程。
  • 關於啟用新版營業執照有關問題的通知
    照面按照《新版營業執照印製標準》(見附件1)印製國徽、邊框、標題(營業執照)、企業信用信息公示系統網址、登記機關公章、年月日、中華人民共和國國家工商行政管理總局監製等內容。按照《新版營業執照列印標準》(見附件2)列印註冊號及號碼、記載事項名稱及內容、二維碼等內容。二、新版營業執照對原版執照記載事項名稱進行調整,並將執照記載事項相同的歸併為一種格式。
  • Python實現識別圖片中的所有人臉並顯示出來
    使用Python3實現識別圖片中的所有人臉並顯示出來,代碼如下:
  • mac使用python識別圖形驗證碼!
    在網上查了很多版本的圖形驗證碼識別,目前看到最多的兩個模塊是pytesseract和tesserocr,但是因為我這裡安裝tesserocr的時候各種出錯,所以最終我鎖定了使用pytesseract。那麼接下來,就記錄下安裝以及使用過程。這裡的系統環境是mac os 10.14.
  • 如何 提取圖片中的文字?這款Python 庫 4行代碼搞定!
    所以說,OCR作用是對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息。OCR的全稱叫作「Optical Character Recognition」,即光學字符識別。這算是生活裡最常見、最有用的AI應用技術之一。
  • 使用Python和Tesseract來識別圖形驗證碼
    一、關於圖形驗證碼識別與tesseractOCR儘管多數圖型驗證碼只有區區幾個數字或字母,但你可能聽說了,在進行機器識別的過程中,你要收集樣本,對圖片去噪、二值化、提取字符、計算特徵,甚至還要祭出神經網絡去訓練數據進行機器學習……還沒開幹,退堂鼓早打響三遍了。
  • 徐工取得工程機械研究院營業執照公告
    2010年5月10日,江蘇省徐州工商行政管理局頒發了該公司的營業執照。核准的公司名稱為「徐工集團工程機械股份有限公司江蘇徐州工程機械研究院」,核准的經營範圍為「許可經營項目:無。一般經營項目:工程機械、建築工程機械、礦山機械、環衛機械、專用汽車及零部件研究、開發、試驗、自研產品及配件銷售;技術服務。」
  • 用python識別驗證碼
    今天,我們就簡單的說下,怎麼用python來處理驗證碼。(注意:我所有的python相關的文章用的都是python3。)準備工作1、tesseract-ocr軟體Tesseract的OCR引擎最先由HP實驗室於1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。
  • 煙臺頒發首張新版營業執照 二維碼與公示系統精準聯接
    昨天上午,煙臺市行政審批服務局頒發出煙臺市第一張新版營業執照。從2019年3月1日開始,全國啟用新版營業執照和新的企業登記提交材料規範。新版營業執照不僅形狀發生了變化,還增加了許多新功能。相比舊版營業執照,新版營業執照除了版式上更加優化,由豎版改為橫版,實現了二維碼與國家企業信用信息公示系統上公示的企業信息精準聯接。
  • 使用python3+opencv3實現的識別答題卡的例子(01)
    由於工作需要,最近在研究關於如何通過程序識別答題卡的客觀題的答案,之前雖然接觸過python,但對於計算機視覺這一塊卻完全是一個陌生的領域,經過各種調研
  • 提取紙質文字的魔法!手機掃描文字識別 OCR 應用推薦
    白描 (iOS + Android)白描 - 文字識別OCR,閱讀筆記摘錄。採用百度人工智慧技術的圖片OCR識別轉換文字應用。白描可以將圖片 OCR 識別轉成文字。沒有廣告,效率快、準確度非常高、支持批量識別、表格識別,而且價格便宜。APP 不限制識別次數,可自由複製分享識別結果。現已支持 iOS 和 Android 平臺。
  • 手把手教你使用百度大腦地址識別API
    一、 百度大腦地址識別的功能和亮點通過百度大腦地址識別產品頁面上的介紹,筆者羅列了這個接口的一些功能點和亮點:1.針對快遞、電商行業客戶在線提交的大量非結構化地址單據,該接口可以幫助提取單據中的姓名、電話、地址信息;2.
  • 基於python+OpenCV模塊的人臉識別定位技術
    本文將基於OpenCV模塊,在windows作業系統上,利用python語言,進行人臉識別技術的研究。當然OpenCV的應用領域很廣,除了人臉識別之外,它還支持圖像分割、動作識別、視頻處理等技術。第8行是對灰度圖像中的人臉進行識別定位,返回值為坐標信息。第10行畫出矩形框。第11行展示出圖像。第12行表示按鍵盤上的「q」鍵退出while true循環。14行和15行釋放攝像機,關閉窗口。其實代碼最核心的一句就是第8行,對人臉進行識別定位,但是這一步,我們通過直接調用別人已經訓練好的資料庫,一步完成了。
  • 在線文字圖片識別工具
    騰訊優圖,提供圖片整體文字的檢測和識別服務,返回文字框位置與文字內容。支持多場景、任意版面下整圖文字的識別,以及中英文、字母、數字、常見字符的識別。百度文字識別,支持多場景下的文字檢測識別。OCRMaker,提供在線文字識別,文字提取等服務。
  • Python驗證碼識別:利用pytesser識別簡單圖形驗證碼
    在Debian/Ubantu Linux下直接通過apt安裝:$sudo apt-get install python-imagingMax和其他版本的Linux可以直接使用easy_install或pip安裝,安裝前需要把編譯環境裝好:$ sudo easy_install PIL
  • 江津發出首張「跨省通辦」營業執照
    江津發出首張「跨省通辦」營業執照 11月30日,江津區首張「跨省通辦」營業執照在區行政服務大廳發出