Python技術:截圖文字識別工具

2020-12-03 源碼時代

#01

截圖文字識別工具

有時候在海報上面,圖片上面,或者PDF文檔中,經常出現一些唯美的文字。這個時候想要複製下來才發現不能複製。因為有的是圖片,有的是PDF。

可以使用Python製作一個小工具,來識別圖片上的文字。但是保存圖片等又太麻煩,如果能截圖一鍵識別就好了。我們用Python來實現。

#02

實現截圖

第一步,先要實現能截圖,並將圖片保存起來以供識別。截圖我們就使用常見的截圖工具就好(如果另外安裝截圖軟體或者指定特殊截圖軟體也是不方便的)。

常見的截圖工具是微信截圖(Alt+A截圖)QQ截圖(Alt+Ctrl+A截圖),我使用Snipaste截圖工具(F1截圖)。

有了截圖工具,就需要按鍵盤的按鍵進行截圖,所以使用Python模塊來監控鍵盤事件就好了,這樣就知道了什麼時候進行截圖,什麼時候截圖結束。新建py文件名為screenShot,代碼及注釋如下:

keyboard.wait` 知道按壓f1才會執行下一行

im = ImageGrab.grabclipboard()` 讀取剪切板中的圖片

使用keyboard.wait監控鍵盤事件,當點擊某個指定的按鍵以後才會執行下一行。我的截圖工具採用ctrl+c結束,這也是結束的標誌。

其他截圖工具也可以使用這種方式,比如QQ截圖是Alt+Ctrl+A開始截圖,enter鍵結束截圖,並將截圖的數據保存在了剪切板了。只需從剪切板讀取數據,保存在本地等待識別即可。

注意:程序中有一行sleep(0.01)也就是程序會在此等待一下,目的是為了防止圖片還沒有保存在剪切板程序就從剪切板讀取圖片。

#03

圖片識別

上一步將圖片保存在了本地等待識別,這一步採用百度雲提供的接口來識別圖片。具體的識別方式可以查看百度雲官網的文字識別模塊。新建py文件名為baidu,代碼內容如下:

程序的核心功能是使用百度雲提供的`basicGeneral`方法來識別圖片。在識別圖片之前,要進行工單的配置。工單的配置需要登錄百度雲帳號,並且建立一個可用的工單。官網有提供具體方法。

#04

工單配置

在xxx處填寫你的信息

#05

各文件調用

使用screenShot文件調用baidu文件:

直接運行該文件即可

相關焦點

  • 用python識別驗證碼
    今天,我們就簡單的說下,怎麼用python來處理驗證碼。(注意:我所有的python相關的文章用的都是python3。)準備工作1、tesseract-ocr軟體Tesseract的OCR引擎最先由HP實驗室於1985年開始研發,至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而,HP不久便決定放棄OCR業務,Tesseract也從此塵封。
  • 使用Python製作一個簡易的OCR圖片文字識別工具
    今天帶領大家使用Python製作一個簡易的OCR圖片文字識別工具,來解決這類問題。OCR:中文叫光學字符識別,英文全稱是Optical Character Recognition,說白了就是從電子設備中顯示的圖片上面查找我們需要的字符,通過檢測、識別將字符翻譯成計算機文字的過程。
  • Python程序圖片和pdf上文字識別實例一二
    實例一:先減少背景雜音,再做圖片文字識別 為了提高識別率,先用opencv-python對掃描的圖片做預處理(減少背景雜音),然後調用pytesseract
  • 提取紙質文字的魔法!手機掃描文字識別 OCR 應用推薦
    那些好用值得推薦的手機掃描文字識別 OCR 應用如果你的工作生活中經常出現紙質文檔文稿轉換成可編輯的文字的需求,那麼就真的應該好好利用這類圖片識別文字的應用了。除了之前推薦過的「主流」掃描 APP 如:Scanner Pro、掃描全能王、Abbyy TextGrabber、Office Lens、OneNote 之外,今天本文的這些工具同樣有著自己的特色。
  • 在線文字圖片識別工具
    騰訊優圖,提供圖片整體文字的檢測和識別服務,返回文字框位置與文字內容。支持多場景、任意版面下整圖文字的識別,以及中英文、字母、數字、常見字符的識別。百度文字識別,支持多場景下的文字檢測識別。OCRMaker,提供在線文字識別,文字提取等服務。
  • 怎麼用工具識別圖片文字?超實用的圖片文字識別方法
    怎麼用工具識別圖片文字?有關圖片識別文字的問題相信很多小夥伴都遇到過,例如當我們看上網頁上的文本內容不能直接提取時,就可以將其製作成圖片的形式然後再用工具識別其中的文字信息達到提取效果。接下來分享一個超實用的圖片文字識別方法,有需要的小夥伴可以學習一下喲!
  • Python調用百度AI製作簡易OCR圖片文字識別工具(完結篇)
    前兩篇,我們使用百度AI調用製作了一個OCR圖片文字識別工具。今天,我們對這個工具進行進一步完善。通過tkinter相關技術實現窗口拆分,在此基礎上增加圖片大小調整的功能,並對前兩篇進行梳理,提供程序的全部原始碼,方便大家使用。
  • 利用Python來識別並提取圖片中文字
    文字識別是利用計算機自動識別字符的技術,是模式識別應用的一個重要領域。文字識別一般包括文字信息的採集、信息的分析與處理、信息的分類判別等幾個部分。隨著我國信息化建設的全面開展,OCR文字識別技術誕生20餘年來,經歷從實驗室技術到產品的轉變,已經進入行業應用開發的成熟階段。相比發達國家的廣泛應用情況,OCR文字識別技術在國內各行各業的應用還有著廣闊的空間。隨著國家信息化建設進入內容建設階段,為OCR文字識別技術開創了一個全新的行業應用局面。文通,雲脈技術、漢王等中國文字識別的領軍企業將會更加深入到信息化建設的各個領域。
  • Python驗證碼識別:利用pytesser識別簡單圖形驗證碼
    常見工具為:支持向量機(SVM)OpenCV圖像處理軟體(Photoshop,Gimp…)Python Image Library二、PIL安裝PIL: Python Imaging Library, 是Python平臺的圖像處理標準庫,功能非常強大。
  • 用Python 實現手機自動答題,這下百萬答題遊戲誰也玩不過我
    這一項目中主要用到了文字識別和瀏覽器操作,其中文字識別是利用計算機自動識別字符的技術,是模式識別應用的一個重要領域。人們在生產和生活中,要處理大量的文字、報表和文本。為了減輕人們的勞動,提高處理效率,50年代開始探討一般文字識別方法,並研製出光學字符識別器。60年代出現了採用磁性墨水和特殊字體的實用機器。60年代後期,出現了多種字體和手寫體文字識別機,其識別精度和機器性能都基本上能滿足要求。如用於信函分揀的手寫體數字識別機和印刷體英文數字識別機。
  • 基於python+OpenCV模塊的人臉識別定位技術
    本文將基於OpenCV模塊,在windows作業系統上,利用python語言,進行人臉識別技術的研究。當然OpenCV的應用領域很廣,除了人臉識別之外,它還支持圖像分割、動作識別、視頻處理等技術。第8行是對灰度圖像中的人臉進行識別定位,返回值為坐標信息。第10行畫出矩形框。第11行展示出圖像。第12行表示按鍵盤上的「q」鍵退出while true循環。14行和15行釋放攝像機,關閉窗口。其實代碼最核心的一句就是第8行,對人臉進行識別定位,但是這一步,我們通過直接調用別人已經訓練好的資料庫,一步完成了。
  • 用Python 實現手機自動答題,這下百萬答題遊戲誰也玩不過我!
    這一項目中主要用到了文字識別和瀏覽器操作,其中文字識別是利用計算機自動識別字符的技術,70年代主要研究文字識別的基本理論和研製高性能的文字識別機,並著重於漢字識別的研究。然後藉助ADB實現對手機的調控,包括點觸、滑動、截圖等等功能。2、 讓電腦能夠看懂文字,必然需要對手機屏幕截圖,然後對截圖中的文字識別即可3、 讓電腦操控瀏覽器搜題,用python的庫即可實現了解了整體思路後,下面開始我們的實驗。
  • python人工智慧-圖像識別
    pytesseract:圖像識別庫。我這裡使用的是python3.6,PIL不支持python3所以使用如下命令pip install pytesseractpip install pillow如果是python2,則在命令行執行如下命令:pip install pytesseractpip install PIL這時候我們去運行上面的代碼會發現如下錯誤
  • 全能精準的OCR識別工具,漢化翻譯,永久免費!
    前言不管是生活中還是工作中,圖片識別成文字都是很常見的,網上也有很多這樣的工具,但是免費的很少,有那麼兩個免費的都不好用,或者滿足不了需求。今天盤哥分享一個功能強大,能夠滿足一切需求的免費OCR識別工具。
  • 可以在線拍照、翻譯成文字嗎?(ocr文字識別技術)
    只讓學員記筆記,至於課件,那是一張截圖都不給的!這不,小北也是被逼得沒辦法了,只能悄悄地坐在角落,老師翻一頁就拍一張照片,也得虧現在的手機相機功能強大了,要不然,坐那麼遠的地方,還真不一定拍得下來!課件的內容是拍下來了,接下來要解決的,便是如何將這些內容整理出來了,那麼拍下來的照片可以翻譯成文字嗎?具體怎麼翻譯?接下來,大家不妨看看小北是如何操作的吧!
  • python|圖像識別
    影響力之大和最吸引人的技術就是圖像識別,圖像識別技術是人工智慧的一個重要領域,它是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術。今天以女神宋慧喬的兩張不同照片為例,利用python識別其相似度,從而判定是否是同一人,同時讓我們對圖像識別有個初步的了解,什麼?照片可以換蒼老師和波老師嗎?我懷疑你們在開車,可是我沒有證據!
  • 使用Python+百度OCR文字識別提取圖片內容
    百度文字識別 工作中,我們常常會將圖片中的文字整理成word文檔,過去主要依靠人工識別,費時費力,隨著人工智慧技術的發展,OCR文字識別的準確度越來越高,此項工作完全可以交給系統來完成了,下面是一段Python版的文字識別代碼,使用了百度的「百度文字識別接口」。
  • Python圖像處理之圖片文字識別(OCR)
    OCR與Tesseract介紹   將圖片翻譯成文字一般被稱為光學文字識別(Optical Character Recognition,
  • windows上python開發環境的搭建
    首先來下載python解釋器,在python官網下載即可,連結如下https://www.python.org/downloads/當前最新版本為v3.8.2默認安裝和自定義安裝任選一種即可,安裝過程截圖如下
  • ocr文字識別是什麼意思?可以識別圖片文字嗎?
    OCR文字識別是什麼意思?它是將前端攝像頭獲取的圖像進行轉換,比如識別紙質資料、各類證件、圖片的文字信息,並轉換成可編輯的電子版文件。這樣我們就不用像以前那樣手動錄入信息了,是不是大大提高了工作效率?下面筆者給大家介紹一款迅捷OCR文字識別軟體。