目標檢測與行為跟蹤 智能分析三大應用

2021-01-15 中關村在線

1目標檢測技術

  傳統視頻監控系統只提供視頻的捕獲、保存、傳輸、顯示畫面等功能,而視頻內容的分析識別等需要人工實現,工作量巨大且容易出錯。智能監控系統是指在特定的監控區域內實時監控場景內的永久或是臨時的物體,通過對視頻傳感器獲取的信息進行智能分析來實現自動的場景理解、預測被觀察目標的行為以及交互性行為。本文就視頻智能分析技術的原理和現狀進行介紹。

  引言

  在傳統視頻監控系統中,視頻內容的分析識別等需要人工實現,由於勞動強度高,工作量巨大且容易出錯,因此視頻監控系統正朝著智能化的方向發展。新一代的智能化監控系統採用了智能視頻分析技術,克服了傳統監控系統人眼識別的缺陷,具備實時對監控範圍內的運動目標進行檢測跟蹤的功能;並且把行為識別等技術引入到監控系統中,形成新的能夠完全替代人為監控的智能型監控系統。

  智能視頻分析技術涉及到模式識別、機器視覺、人工智慧、網絡通信以及海量數據管理等技術。視頻智能分析通常可以分為幾部分:運動目標的識別、目標跟蹤與行為理解。

  智能分析技術原理

  一般情況下,視頻智能化分析的基本過程是從給定的視頻中讀取每幀圖像,並對輸入圖像進行預處理,如濾波、灰度轉換等,然後判斷輸入圖像中是否有運動目標,接下來判斷運動目標是否為監控目標,最後對該目標根據需求進行監控、跟蹤或是行為理解等分析。

  1、 目標檢測技術

  運動檢測(Motion Detection)。運動檢測是把視頻中變化的區域與背景圖像精確分離出來,即正確分割出運動目標區域或輪廓,這是任何系統設計實現首先要考慮的問題,它的效果好壞或成敗與否直接影響後續的跟蹤和行為理解等後期處理效果。

  目標檢測是從圖像序列中將變化區域從背景圖像中提取出來,從而檢測出運動的目標,目標檢測十分重要,它將影響目標對象的分類、行為識別等後期處理。目標檢測分析多個差圖像中區域之間的關係,並在原圖像中驗證,得到運動的目標和其運動軌跡。比如,如果已經知道3個不同時刻的二值差圖像,若存在一個運動目標的話,該目標在這3個差圖像中的大小基本不變,其運動方向和運動速度基本不變,在3個差圖像對應的原圖像中的區域,有基本相同的灰度分布等等。幾種常用的動態視頻目標檢測方法簡介如下:

  背景減除,背景減除(Background Subtraction)方法是目前運動檢測中最常用的一種方法,它是利用當前圖像與背景圖像的差分來檢測出運動目標的一種技術。它一般能夠提供相對來說比較全面的運動目標的特徵數據,但對於動態場景的變化,如光線照射情況和外來無關事件的幹擾等也特別敏感。由於該模型是固定的,一旦建立之後,對於該場景圖像所發生的任何變化都比較敏感,比如陽光照射方向,影子,樹葉隨風搖動等。

  時間差分,時間差分(Temporal Difference 又稱相鄰幀差)方法充分利用了視頻圖像的特徵,從連續得到的視頻流中提取所需要的動態目標信息。在一般情況下採集的視頻圖像,若仔細對比相鄰兩幀,可以發現其中大部分的背景像素均保持不變。只有在有前景移動目標的部分相鄰幀的像素差異比較大。時間差分方法就是利用相鄰幀圖像的相減來提取出前景移動目標的信息的。

  但在目標運動緩慢時,差分後的運動目標區域內會產生空洞,從而不能完全提取出所有相關的特徵像素點,一般不能夠完整地分割運動對像,不利於進行相關分析,因此差分法很少被單獨使用。

  光流,基於光流方法(Optical Flow)的運動檢測採用了運動目標隨時間變化的光流特性,如Meyer 等通過計算位移向量光流場來初始化基於輪廓的跟蹤算法,從而有效地提取和跟蹤運動目標。該方法的優點是在所攝場所運動存在的前提下也能檢測出獨立的運動目標。然而大多數的光流計算方法相當複雜,且抗噪性能差,如果沒有特別的硬體裝置則不能被應用於全幀視頻流的實時處理。

2目標跟蹤技術與行為識別

  2、目標跟蹤技術

  目標跟蹤(Object Tracking)就是通過對攝像頭採集到的圖象序列進行計算分析,計算出目標在每幀圖像上的二維位置坐標,並根據不同的特徵值,將圖像序列中不同幀中同一運動目標關聯起來,得到各個運動目標完整的運動軌跡,也就是在連續的視頻序列建立運動目標的對應關係。

  可採用Mean Shift算法和Particle Filter算法實現目標跟蹤。

  Mean Shift算法本質上是最優化理論中的最速下降法(亦稱梯度下降法,牛頓法等),即沿著梯度下降方法尋找目標函數的極值。在跟蹤中,就是為了尋找到相似度值最大的候選目標位置。

  Mean Shift方法就是沿著概率密度的梯度方向進行迭代移動,最終達到密度分布的最值位置。其迭代過程本質上是最速下降法,下降方向為一階梯度方向,步長為固定值。但是,Mean Shift沒有直接求取下降方向和步長,它通過模型的相似度匹配函數的一階Talor展開式進行近似,直接推到迭代的下一個位置。由此,沿著梯度方向不斷迭代收斂到目標相似度概率目標分布的局部極大值。

  Mean Shift算法在目標運動過快或背景過於複雜時,迭代尋找的局部極值並不是目標在下一幀中的最佳匹配位置。另外,Mean Shift作為最速下降法的一種,它的收斂速度並不快,且在接近最優值時,存在鋸齒現象。

  Particle Filter算法本質上是蒙特卡羅仿真,即通過採樣粒子來近似描述概率密度分布。跟蹤中,不可能求取下一幀中所有位置的相似度,即無法獲取相似度概率密度分布。而Particle Filter就是通過粒子採樣來近似描述這樣的分布,有了該分布就可以獲取目標的相似度最大位置。一般是根據粒子自身的匹配程度來確定概率密度的最值。Particle Filter沒有迭代過程,它通過播散大量的粒子,通過這些粒子來獲取最值位置。另外,因為粒子採樣是遍布整個相似度概率密度空間的,故其具有全局最優性。

  還可以使用如基於塔型結構的匹配跟蹤、多子模板匹配、Kalman 濾波器、光流法等方法實現目標跟蹤。

  3、行為識別技術

  行為識別(Behavior Understanding)是近年來被廣泛關注的研究熱點,它是指對目標的運動模式進行分析和識別,並用自然語言等加以描述。同目標識別與跟蹤技術相比,行為動作識別技術是監控領域的較高研究層次,在計算機視覺中是一個極具有吸引力及挑戰性的課題。是近年來計算機視覺領域和智能監控領域研究的熱點也是難點,但仍處於未成熟的初級階段。目前的視頻智能監控系統中,儘管對於一些動作細節還不能做到準確識別,但是已經能夠識別出物體的整體行為,比如可以識別物體的形狀、顏色、體積、運動軌跡、運動速度、速度變化等,對這些數據進行進一步挖掘和分析就能夠實現監控領域的一些特定需求,可以應用在禁區報警、數量統計、醫療監護以及環境檢測等領域。

  在視頻行為動作識別中,通常是預先規定好若干動作類型(此過程由目標資料庫所決定),然後,利用資料庫的訓練樣本對各種動作類型進行特徵建模,在必要的時候還要加入訓練的部分,構成一個動作模型庫。也可以使用自然語言描述人的行為,實現對行為的識別和理解,近幾年,更多研究者傾向於使用語義描述來分析人體動作行為,此方面的研究得到了一定的進展。自然語言描述的核心思想是:模仿人類語言的表達方式,通過有限的詞彙的不同組合來表示具有不同意義的句子、段落與文章。在行為分析與理解領域中,可以把某個的圖像看成是一個視覺詞彙,或叫做視覺單詞,把視覺詞彙進行組合就可以得到視頻的自然語言描述,由於不同行為有不同的描述,因此可以通過不同描述來區分不同的行為。

  行為理解的推理中廣泛採用了基於圖像模型的推理方法,如隱馬爾科夫模型(HMM) ,動態貝葉斯網絡(DBN) ,條件隨機場(CRF)等;也有的研究採用其他的推理方法,如使用基於規則的決策樹來對一系列表示動作及對象的三元表達式進行分類;採用模板匹配的方法,將檢測到的運動特徵與訓練好的樣本逐個匹配,匹配的結果即為對行為識別的結果;還可以使用有限狀態自動機,每個狀態表示當前人體的位置,來對人的軌跡進行分類,識別異常事件。

相關焦點

  • 智能視頻分析功能分類與應用發展方向
    3、行為類智能分析。該項技術側重於對動態場景的分析處理。典型的功能有:車輛逆行及相關交通違章檢測、防區入侵檢測、圍牆翻越檢測、絆線穿越檢測、物品偷盜檢測、佔道經營檢測和客流統計等。移動偵測(VMD)是該類智能分析中的「早期智能」,VMD依據視頻畫面中像素塊的運動變化來進行判別,缺點明顯:基於二維的分析,誤報太高,無法識別移動的像素塊是幹擾還是目標。
  • 目標檢測與跟蹤概述
    隨著信息技術的發展,基於視覺的運動目標的檢測與跟蹤已逐漸滲透到人們生活的方方面面,其重要性日益突出,吸引著越來越多的國內外學者和研究機構參與在這個領域的研究。目前,基於視覺的運動目標檢測與跟蹤已廣泛應用於視頻監控、虛擬實境、人機互動、行星探測、行為理解等領域。
  • 基於Nios II的視頻運動目標檢測跟蹤系統設計
    實驗結果表明,該系統可達到運動目標檢測跟蹤的理想結果。本文引用地址:http://www.eepw.com.cn/article/249784.htm  0 引言  運動目標檢測跟蹤就是將運動的目標從視頻圖像序列中檢測出來,對其進行跟蹤。
  • 智能視頻監控系統及其在Blackfin處理器上的應用
    Object Video, Hisign,3VR等公司率先實現了智能視頻監控的工業應用。在國內,中科院自動化所,清華大學電子工程系和自動化系等處於研究的前列。  2.智能視頻監控系統的技術背景簡介  智能視頻監控的核心內容之一是對特定目標的自動跟蹤。
  • 智能視頻分析系統:功能分類與發展方向
    在對車的識別分析應用上主要是車牌識別技術。該技術經過多年的發展與應用,目前已十分成熟。模糊車牌還原和識別技術的出現使得該項技術不再局限高清,開始向標清領域普及。車牌識別技術被廣泛應用於各停車場出入口、高速公路收費站等地,近些年更是發展迅速:配合交通電子卡口系統,車牌識別技術被大量用於車輛交通違章的抓拍,有效降低了車輛交通違章數量,大大減少了交通事故的發生。   3、行為類智能分析。
  • 以點代物,同時執行目標檢測和跟蹤,這個新方法破解目標跟蹤難題
    如今,跟蹤的主流方式是先執行目標檢測再進行時序關聯,也叫做檢測-跟蹤法(tracking-by-detection)。但是這種方法也有缺點,近日來自德克薩斯奧斯汀分校和英特爾研究院的研究人員提出一種同時檢測與跟蹤的方法,該方法比當前最優技術更加簡單、快速、準確。研究者將其跟蹤器命名為 CenterTrack,該方法對一對圖像應用檢測模型,並利用前一幀的檢測結果。
  • 智能交通監控系統的組成及應用方案分析
    智能交通監控系統的組成及應用方案分析 佚名 發表於 2020-11-23 10:37:51 城市交通領域三個難題: 城市經濟高速增長、城市化進程加快,
  • 基於FPGA的移動目標實時定位跟蹤系統
    基於實時物體移動的靜態圖像背景中移動目標檢測是計算機視覺領域的研究熱點,在安防、監控、智能交通、機器智慧、以及軍事領域等社會生活和軍事防禦等諸多領域都有較大的實用價值。移動目標檢測的實質是從實時圖像序列中將圖像的變化區域從整體圖像中分割提取出來。
  • 大華推出新一代網絡自動跟蹤智能球機DH-SD6582-HNI
    責任編輯: luoshui 收藏本文 大華DH-SD6982-NI高清網絡自動跟蹤高速智能球是一款集高速智能球與自動跟蹤為一體的新一代自動跟蹤智能球機,具備兩百萬像素的圖像清晰度,配合業界領先的智能檢測、自動跟蹤功能完全滿足用戶對高清晰智能視頻監控的需求
  • BVS智能視頻分析技術
    智能視頻分析技術的行業應用智能分析技術是智能視頻技術的核心,其特點是需要與行業應用業務進行深入的結合,依託於軟體系統而使用。不同的行業用戶,在系統規模、建設方式、應用場景、檢測目標、性能要求、數據後臺處理等方面,都有很大的不同。
  • 使用PyTorch實現目標檢測與跟蹤
    本文將展示如何使用預訓練的分類器檢測圖像中的多個對象,並在視頻中跟蹤它們。 圖像中的目標檢測 目標檢測的算法有很多,YOLO跟SSD是現下最流行的算法。在本文中,我們將使用YOLOv3。
  • 深蘭獲ACM MM 2020冠軍,視頻目標檢測挑戰劇烈抖動、消失重現等難點
    此次獲獎方案均對現實應用場景有著實際意義,將有效提升自動駕駛、安防監控等領域的安全性。視頻目標檢測(Video Object Detection)作為競賽任務,要求參與者開發魯棒的目標檢測器,在每個視頻幀中使用檢測框定位目標,並將指示同一目標實體的檢測框連結到軌跡中,這將幫助機器在視頻級別上理解目標實體的身份和動態,還可以使需要細粒度視頻理解的許多應用程式受益(舉例),還包括自動駕駛場景中對車身周圍動態目標的有效檢測,可提高駕駛安全性。
  • 智能圖像處理 讓機器視覺及其應用更智能高效
    本文引用地址:http://www.eepw.com.cn/article/201806/381668.htm  智能圖像處理是指一類基於計算機的自適應於各種應用場合的圖像處理和分析技術,本身是一個獨立的理論和技術領域,但同時又是機器視覺中的一項十分重要的技術支撐。
  • 融合視頻目標檢測與單目標、多目標跟蹤,港中文開源視頻感知平臺
    該框架基於 PyTorch 寫成,支持單目標跟蹤、多目標跟蹤與視頻目標檢測,目前已開源。GitHub 地址:https://github.com/open-mmlab/mmtrackingMMTracking 效果展示。據介紹,MMTracking 具備以下主要特性:1.
  • 人工智慧製造業應用場景
    3、認知智能 相較於計算智能和感知智能,認知智能更為複雜,是指機器像人一樣,有理解能力、歸納能力、推理能力,有運用知識的能力。目前認知智能技術還在研究探索階段,如在公共安全領域,對犯罪者的微觀行為和宏觀行為的特徵提取和模式分析,開發犯罪預測、資金穿透、城市犯罪演化模擬等人工智慧模型和系統;在金融行業,用於識別可疑交易、預測宏觀經濟波動等。
  • 智能視頻監控分析技術的概念及原理
    智能視頻分析是計算機圖像視覺技術在安防領域應用的一個分支,是一種基於目標行為的智能監控技術。區別於傳統的移動偵測(VMD-VideoMotionDetection)技術,智能視頻分析首先將場景中背景和目標分離,識別出真正的目標,去除背景幹擾(如樹葉抖動、水面波浪、燈光變化),進而分析並追蹤在攝像機場景內出現的目標行為。
  • 吳博:目標檢測集成框架在醫學圖像 AI 輔助分析中的應用 | AI 研習...
    醫學圖像分析中目標檢測任務的普遍性,使得開發目標檢測集成框架顯得必要。近日,在雷鋒網 AI 研習社公開課上,深圳市宜遠智能科技有限公司負責人吳博剖析了目標檢測已有的框架,重點分享如何對目標檢測框架進行改造,以便在醫學圖像分析中產生更好的效果。公開課回放視頻網址:http://www.mooc.ai/open/course/559?
  • 教你30分鐘實現基於Python的路況目標跟蹤系統...
    目標跟蹤是對攝像頭視頻中的移動目標進行定位的過程,而目標跟蹤技術是智慧交通的核心技術之一,有著非常廣泛的應用。許多計算機視覺應用基於目標跟蹤技術做監控、用戶感知,增強現實、視頻壓縮以及輔助駕駛,為生活和工作帶來很大便利。  那麼目標跟蹤測系統是怎樣應用於無人駕駛、醫院中的健康和安全監控、零售中的自助檢驗和分析、製造廠中的組件缺陷檢測的呢?
  • 智能安防產品有哪些_智能安防的結構及應用分析
    物聯網技術的普及應用,使得城市的安防從過去簡單的安全防護系統向城市綜合化體系演變,城市的安防項目涵蓋眾多的領域,有街道社區、樓宇建築、銀行郵局、道路監控、機動車輛、警務人員、移動物體、船隻等。特別是針對重要場所,如:機場、碼頭、水電氣廠、橋梁大壩、河道、地鐵等場所,引入物聯網技術後可以通過無線移動、跟蹤定位等手段建立全方位的立體防護。
  • 深蘭ACM MM 2020視頻目標檢測挑戰賽冠軍 助機器理解視頻級別目標身份和動態
    該數據集包含10,000個從YFCC100M[2]數據集中篩選的視頻(98.6小時),80個類別的目標(例如成人、狗、玩具)和50個類別的關係(例如旁邊、觀看、保持)標註;同時舉辦Video Relation Understanding[1]競賽,該競賽同時是ACM Multimedia 2020 Grand Challenge中的競賽任務。