【實驗】OpenCV/Python/dlib眨眼檢測

2021-02-20 七月在線實驗室

今日課程:《量化交易策略實戰》今晚8點開課,文末「閱讀原文」進入

摘要: 圖像識別的新思路:眼睛縱橫比,看看大牛如果用這種思路玩轉識別眨眼動作!

今天我們來使用面部標誌和OpenCV 檢測和計算視頻流中的眨眼次數。為了構建我們的眨眼檢測器,我們將計算一個稱為眼睛縱橫比(EAR)的指標,由Soukupová和Čech在其2016年的論文「使用面部標誌實時眼睛眨眼檢測」中介紹。

今天介紹的這個方法與傳統的計算眨眼圖像處理方法是不同的,使用眼睛的長寬比是更為簡潔的解決方案,它涉及到基於眼睛的面部標誌之間的距離比例是一個非常簡單的計算。

用OpenCV,Python和dlib進行眼睛眨眼檢測

我們的眨眼檢測實驗分為四個部分:

第一步,我們將討論眼睛的縱橫比以及如何用它來確定一個人是否在給定的視頻幀中閃爍。

第二步,我們將編寫Python,OpenCV和dlib代碼來執行面部標誌檢測和檢測視頻流中的眨眼。

第三步,基於代碼,我們將應用我們的方法來檢測示例攝像頭流中的眨眼以及視頻文件。

最後,我將通過討論改進我們的眨眼檢測器的方法來結束。

1.了解「眼睛縱橫比」(EAR)

我們可以應用面部標誌檢測來定位臉部的重要區域,包括眼睛,眉毛,鼻子,耳朵和嘴巴:

這也意味著我們可以通過了解特定臉部的索引來提取特定的臉部結構:

在眨眼檢測方面,我們眼睛結構感興趣。

每隻眼睛由6個(x,y)坐標表示,從眼睛的左角開始,然後圍繞該區域的其餘部分順時針顯示:

基於這個描述,我們應該抓住重點:這些坐標的寬度和高度之間有一個關係。

Soukupová和Čech在其2016年的論文「使用面部標誌實時眼睛眨眼檢測」的工作,我們可以推導出反映這種關係的方程,稱為眼睛縱橫比(EAR):

其中p1,...,p6是2D面部地標位置。

這個方程的分子是計算垂直眼睛標誌之間的距離,而分母是計算水平眼睛標誌之間的距離,因為只有一組水平點,但是有兩組垂直點,所以進行加權分母。

為什麼這個方程如此有趣?

我們將會發現,眼睛的長寬比在眼睛張開的時候大致是恆定的,但是在發生眨眼時會迅速下降到零。

使用這個簡單的方程,我們可以避免使用圖像處理技術,簡單地依靠眼睛地標距離的比例來確定一個人是否眨眼。

為了更清楚地說明,看下面的圖:

在底部圖中繪出了眼縱橫比隨時間的視頻剪輯的曲線圖。正如我們所看到的,眼睛縱橫比是恆定的,然後迅速下降到接近零,然後再增加,表明一個單一的眨眼已經發生。

2.用面部標誌和OpenCV檢測眨眼(代碼篇)

請打開一個新文件並將其命名為detect_blinks.py。插入以下代碼:

要訪問磁碟上的視頻文件(FileVideoStream)或內置的網絡攝像頭/ USB攝像頭/Raspberry Pi攝像頭模塊(VideoStream),我們需要使用imutils庫,它可以使OpenCV更容易工作。

如果您的系統上沒有安裝 imutils,請確保使用以下命令安裝/升級:

pip install --upgrade imutils

注意:如果您正在使用Python虛擬環境,請確保使用 workon命令首先訪問您的虛擬環境,然後安裝/升級 imutils。

例外的是dlib庫,如果您的系統上沒有安裝dlib,請按照我的dlib安裝教程配置您的機器。

接下來,我們將定義eye_aspect_ratio函數:

def eye_aspect_ratio(eye): # compute the euclidean distances between the two sets of # vertical eye landmarks (x, y)-coordinates A = dist.euclidean(eye[1], eye[5]) B = dist.euclidean(eye[2], eye[4]) # compute the euclidean distance between the horizontal # eye landmark (x, y)-coordinates C = dist.euclidean(eye[0], eye[3]) # compute the eye aspect ratio ear = (A + B) / (2.0 * C) # return the eye aspect ratio return ear

這個函數接受單一的參數,即給定的眼睛面部標誌的(x,y)坐標  。

A,B是計算兩組垂直眼睛標誌之間的距離,而C是計算水平眼睛標誌之間的距離。

最後,將分子和分母相結合,得出最終的眼睛縱橫比。然後將眼圖長寬比返回給調用函數。

讓我們繼續解析我們的命令行參數:

detect_blinks.py腳本需要一個命令行參數,然後第二個是可選的參數:

1.--shape-predictor:這是dlib的預訓練面部標誌檢測器的路徑。

2.--video:它控制駐留在磁碟上的輸入視頻文件的路徑。如果您想要使用實時視頻流,則需在執行腳本時省略此開關。

我們現在需要設置兩個重要的常量,您可能需要調整實現,並初始化其他兩個重要的變量。

當確定視頻流中是否發生眨眼時,我們需要計算眼睛的長寬比。

如果眼睛長寬比低於一定的閾值,然後超過閾值,那麼我們將記錄一個「眨眼」 -EYE_AR_THRESH是這個閾值,我們默認它的值為 0.3,您也可以為自己的應用程式調整它。另外,我們有一個重要的常量,EYE_AR_CONSEC_FRAME,這個值被設置為 3,表明眼睛長寬比小於3時,接著三個連續的幀一定發生眨眼動作。

同樣,取決於視頻的幀處理吞吐率,您可能需要提高或降低此數字以供您自己實施。

接著初始化兩個計數器,COUNTER是眼圖長寬比小於EYE_AR_THRESH的連續幀的總數,而 TOTAL則是腳本運行時發生的眨眼的總次數。

現在我們的輸入,命令行參數和常量都已經寫好了,接著可以初始化dlib的人臉檢測器和面部標誌檢測器:

dlib庫使用一個預先訓練的人臉檢測器,該檢測器基於對用於對象檢測的定向梯度直方圖+線性SVM方法的修改。然後,我們初始化的實際面部標誌預測值predictor。

您可以在本博客文章中了解更多關於dlib的面部標誌性探測器(即它是如何工作的,它在哪些數據集上進行了訓練等)。

由dlib生成的面部標記遵循可索引列表,正如我所描述的那樣:

因此,我們可以確定為下面的左眼和右眼提取(x,y)坐標的起始和結束數組切片索引值:

使用這些索引,我們將能夠毫不費力地提取眼部區域。

接下來,我們需要決定是否使用基於文件的視頻流或實時USB/網絡攝像頭/ Raspberry Pi攝像頭視頻流:

如果您使用的是文件視頻流,請保持原樣。

如果您想使用內置攝像頭或USB攝像頭,取消注釋:# vs = VideoStream(src=0).start()。

Raspberry Pi相機模塊,取消注釋:# vs = VideoStream(usePiCamera=True).start()。

如果您未注釋上述兩個,你可以取消注釋# fileStream = False以及以表明你是不是從磁碟讀取視頻文件。

最後,我們已經完成了我們腳本的主要循環:

# loop over frames from the video streamwhile True: # if this is a file video stream, then we need to check if # there any more frames left in the buffer to process if fileStream and not vs.more(): break # grab the frame from the threaded video file stream, resize # it, and convert it to grayscale # channels) frame = vs.read() frame = imutils.resize(frame, width=450) gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # detect faces in the grayscale frame rects = detector(gray, 0)

在while處我們開始從視頻流循環幀。

如果我們正在訪問視頻文件流,並且視頻中沒有剩餘的幀,我們從循環中斷。

從我們的視頻流中讀取下一幀,然後調整大小並將其轉換為灰度。然後,我們通過dlib內置的人臉檢測器檢測灰度幀中的人臉。

我們現在需要遍歷幀中的每個面,然後對其中的每個面應用面部標誌檢測:

# loop over the face detectionsfor rect in rects: # determine the facial landmarks for the face region, then # convert the facial landmark (x, y)-coordinates to a NumPy # array shape = predictor(gray, rect) shape = face_utils.shape_to_np(shape) # extract the left and right eye coordinates, then use the # coordinates to compute the eye aspect ratio for both eyes leftEye = shape[lStart:lEnd] rightEye = shape[rStart:rEnd] leftEAR = eye_aspect_ratio(leftEye) rightEAR = eye_aspect_ratio(rightEye) # average the eye aspect ratio together for both eyes ear = (leftEAR + rightEAR) / 2.0

shape確定面部區域的面部標誌,接著將這些(x,y)坐標轉換成NumPy陣列。

使用我們之前在這個腳本中的數組切片技術,我們可以分別為左眼left eye和右眼提取(x,y)坐標,然後我們計算每隻眼睛的眼睛長寬比  。

下一個代碼塊簡單地處理可視化眼部區域的面部標誌:

# compute the convex hull for the left and right eye, then# visualize each of the eyesleftEyeHull = cv2.convexHull(leftEye)rightEyeHull = cv2.convexHull(rightEye)cv2.drawContours(frame, [leftEyeHull], -1, (0, 255, 0), 1)cv2.drawContours(frame, [rightEyeHull], -1, (0, 255, 0), 1)

我們已經計算了我們的(平均的)眼睛長寬比,但是我們並沒有真正確定是否發生了眨眼,這在下一部分中將得到關注:

# check to see if the eye aspect ratio is below the blink# threshold, and if so, increment the blink frame counterif ear < EYE_AR_THRESH:  COUNTER += 1# otherwise, the eye aspect ratio is not below the blink# thresholdelse:# if the eyes were closed for a sufficient number of# then increment the total number of blinksif COUNTER >= EYE_AR_CONSEC_FRAMES:  TOTAL += 1# reset the eye frame counterCOUNTER = 0

第一步檢查眼睛縱橫比是否低於我們的眨眼閾值,如果是,我們遞增指示正在發生眨眼的連續幀數。否則,我們將處理眼高寬比不低於眨眼閾值的情況,我們對其進行檢查,看看是否有足夠數量的連續幀包含低於我們預先定義的閾值的眨眼率。如果檢查通過,我們增加總的閃爍次數。然後我們重新設置連續閃爍次數 COUNTER。

我們的最終代碼塊只是簡單地處理在輸出幀上繪製閃爍的次數,以及顯示當前的眼圖高寬比:

3.眨眼檢測結果

在執行之前,請務必使用本指南「下載」原始碼+示例視頻+預訓練的dlib面部標記預測器。

要將我們的眨眼檢測器應用於示例視頻,只需執行以下命令:

$python detect_blinks.py \

 --shape-predictor shape_predictor_68_face_landmarks.dat \

 --video blink_detection_demo.mp4

後來,在旅館裡,我記錄下了眨眼檢測器的實時流,並將其變成了屏幕錄像。

要訪問我的內置攝像頭,我執行了下面的命令(注意取消注釋正確的VideoStream類,如上所述):

4.改進我們的眨眼檢測器

我們只關注眼睛縱橫比作為定量指標,以確定一個人是否在視頻流中眨了眨眼睛。

為了使我們的眨眼檢測器更加強大的顯示中可能挑戰,Soukupová和Čech建議:為了改善我們的眨眼檢測器,Soukupová和Čech建議構建眼長寬比(第N幀,第  N-6 幀和第  N + 6幀)的13維特徵向量,然後將該特徵向量饋送到線性SVM分類。

★推薦閱讀

量化交易入門(精華必讀版)

【286頁乾貨】一天搞懂深度學習

好文 | 基於深度學習的目標檢測技術演進

小白到大神,Python 密集知識點匯總

AI 經典書單 | 人工智慧學習該讀哪些書

各領域機器學習數據集匯總(附下載地址)

相關焦點

  • OpenCV中的快速直線檢測
    本文範例運行環境FastLineDetectors運行必要條件FastLineDetectors屬於opencv-contrib中的模塊,需要安裝opencv-contrib-python。在python的opencv相關的安裝包中,opencv-python 包含主要模塊,opencv-contrib-python 包含主要模塊以及一些擴展模塊。但這兩個模塊並不兼容,如果已經安裝過opencv-python,需要先卸載,再安裝opencv-contrib-python。
  • 使用OpenCV和Python構建自己的車輛檢測模型
    utm_source=blog&utm_medium=vehicle-detection-opencv-python)目錄視頻中運動目標檢測的思想視頻中目標檢測的真實世界用例視頻目標檢測的基本概念 幀差分 圖像閾值 檢測輪廓 圖像膨脹利用OpenCV構建車輛檢測系統視頻中運動目標檢測的思想目標檢測是計算機視覺中一個引人入勝的領域。
  • 如何快速簡單的安裝opencv-python
    這樣就會從清華鏡像安裝opencv-contrib-python庫。目前opencv最新版本為4.1.1 ----2019-8-28在opencv-contrib-python 版本中含有額外模塊( Extra modules ),而 opencv-python 版本中只含有基礎模塊。
  • opencv-python獲取圖像:面向對象與面向過程
    這裡需要注意以下,opencv讀取圖片默認通道為BGR的格式,當在其他UI用戶界面顯示圖像時注意轉換一下通道順序,例如BGR轉換成RGB:Image1=cv2.cvtColor(image, cv2.COLOR_BGR2RGB)下面讀取一張圖片並顯示
  • 基於TensorFlow 、OpenCV 和 Docker 的實時視頻目標檢測
    我將使用 python 的 multiprocessing 庫,增加處理網絡攝像頭時的 FPS。為了進一步提高可移植性,我將項目集成到 Docker 容器中。不過處理進出容器的視頻流可能會有一點麻煩。此外,在次項目我還添加了一個視頻後處理功能,同樣使用 multiprocessing 庫來減少處理時間(使用 Tensorflow 原始目標檢測 API 處理時間會非常長)。
  • 「python opencv視覺零基礎」十四、直方圖反向投影
    前文提醒:博主正在參加博客之星評比,成功入選Top200,現在暫居第九歡迎各位點擊了解更多幫我投票,非常感謝~目錄「python opencv 計算機視覺零基礎實戰」 第一節「python opencv視覺入門到實戰」二、格式與攝像頭「python opencv 視覺入門到實戰」 三、圖像編輯「python
  • 「python opencv視覺零基礎」十、圖片效果毛玻璃
    一、學習目標了解高斯模糊的使用方法了解毛玻璃的圖片效果添加了解如何自己做一個噪聲圖片目錄「python opencv 計算機視覺零基礎實戰」 第一節「python opencv視覺入門到實戰」二、格式與攝像頭「python opencv 視覺入門到實戰」 三、圖像編輯「python opencv視覺入門到實戰
  • 「python opencv視覺零基礎實戰」七邏輯運算應用
    一、學習目標了解opencv中圖像的邏輯運算了解opencv中邏輯運算的應用如有錯誤歡迎指出~目錄「python opencv 計算機視覺零基礎實戰」 第一節「python opencv視覺入門到實戰」二、格式與攝像頭「python opencv 視覺入門到實戰」 三、圖像編輯「python
  • 「python opencv計算機視覺零基礎到實戰」九模糊
    一、學習目標了解什麼是卷積了解模糊的使用方法與應用目錄「python opencv 計算機視覺零基礎實戰」 第一節「python opencv視覺入門到實戰」二、格式與攝像頭「python opencv 視覺入門到實戰」 三、圖像編輯「python opencv視覺入門到實戰」 第四節色彩空間
  • 超越Dlib!81個特徵點覆蓋全臉,面部特徵點檢測更精準(附代碼)
    Reddit一位網友便在此基礎上做了進一步研究,能夠檢測出81個面部特徵點,使得準確度有所提高。  或許,這就是你需要的人臉特徵點檢測方法。  人臉特徵點檢測(Facial landmark detection)是人臉檢測過程中的一個重要環節。是在人臉檢測的基礎上進行的,對人臉上的特徵點例如嘴角、眼角等進行定位。
  • opencv-python圖像預處理-濾波
    圖像濾波(模糊)濾波也叫模糊,下面是opencv中常見的五種濾波方法,先看一下濾波前後的效果。# -*- coding: utf-8 -*-"""運行環境 python==3.6 opencv-contrib-python== 4.1 win10系統第一行 「 # -*- coding: utf-8 -*- 」 告訴Python解釋器,按照UTF-8編碼讀取原始碼"""dir1="lena.jpg"
  • 「python opencv視覺零到實戰」八、圖片選區操作
    一、學習目標了解什麼是ROI了解floodFill的使用方法如有錯誤歡迎指出~目錄「python opencv 計算機視覺零基礎實戰」 第一節「python opencv視覺入門到實戰」二、格式與攝像頭「python opencv 視覺入門到實戰」 三、圖像編輯「python opencv視覺入門到實戰
  • 基於opencv 的圖像處理入門教程
    >顏色檢測去噪檢測圖片的輪廓移除圖片的背景原文地址:https://likegeeks.com/python-image-processing/代碼和樣例圖片的地址安裝OpenCV 的安裝還是比較簡單的,直接用 pip 命令在命令行安裝即可,輸入以下命令:pip install opencv-python驗證是否安裝成功,可以運行 python 命令,然後分別輸入以下命令:import cv2
  • 資料| Practical Python and OpenCV 一周時間帶你入門CV
  • Python中如何利用Opencv打開視頻或圖像並用PyQt控制項顯示
    一、python中opencv打開圖像方法:import cv2filename='dog.jpg'img=cv2.imread(filename)cv2.imshow('Main Window',img)cv2.waitKey() #任意鍵退出cv2.destroyAllWindows()二、python中用opencv打開視頻頭的方法:
  • Python中的簡單人臉檢測(建議收藏)
    如何使用OpenCV庫檢測圖像中的人臉在本文中,將展示如何使用Python構建簡單的面部檢測器。建立一個可以檢測人臉的程序是一個很好的項目,可以開始使用計算機視覺。從名稱可以理解,我們將編寫一個程序來檢測圖像中的面部。當我說「程序」時,您可以將其理解為教機器做什麼。我喜歡使用教學而不是編程,因為這實際上是我們正在做的事情。
  • 【OpenCV+Python】輪廓特徵中階
    現在我們可以來一個實戰部分,用橢圓擬合來進行人眼識別之後標註出來,首先我們需要安裝dlib庫,這種一個人臉特徵檢測庫,接下來我們設置特徵檢測器,dlib有已經訓練的好的需要下載,也可以自己根據需要訓練:下載連結
  • 基於python+OpenCV模塊的人臉識別定位技術
    本文將基於OpenCV模塊,在windows作業系統上,利用python語言,進行人臉識別技術的研究。當然OpenCV的應用領域很廣,除了人臉識別之外,它還支持圖像分割、動作識別、視頻處理等技術。代碼第1行導入opencv模塊。代碼的第3行(以上圖為準,空行也算一行),導入別人已經訓練好的臉部識別資料庫。這裡用到的數據是在github上開源的已經訓練好的分類器,如圖所示:需要將對應的數據文件(.xml文件)下載到指定目錄(代碼中的示例,展示的是與.py文件同一目錄下)。
  • 目標檢測必須要OpenCV?10行Python代碼也能實現,親測好用!
    目標檢測是藉助於計算機和軟體系統在圖像/場景中,定位目標並識別出每個目標的類別的技術。目前已廣泛用於人臉檢測、車輛檢測、行人計數、網絡圖像、安全系統和無人駕駛汽車等領域。隨著計算機技術不斷發展和軟體開發人員的不懈努力,未來目標檢測技術將更廣泛的普及開來。在應用程式和系統中使用先進的目標檢測方法,以及基於這些方法構建新的應用程式並不容易。
  • 世界上最好的語言PHP:OpenCV與計算機視覺已在我掌控之下
    本文從實踐的角度介紹了如何使用 PHP 與 OpenCV 構建人臉檢測、人臉識別、超解析度與目標檢測等系統,因此 PHP 的各位擁躉們,可以盡情使用 OpenCV 探索計算機視覺了。本文首發於公眾號機器之心(ID:almosthuman2014),部分代碼格式有誤可參閱原文章。