「專利解密」華為如何實現物體檢測在大規模場景中的應用 助力智慧...

2020-12-03 愛集微APP

【嘉德點評】華為發明的物體檢測方法,通過構建跨域知識圖譜,可以捕捉到不同待檢測物體間的內在關係,從而更加精確的進行物體識別,在智能安防等複雜場景中有著極其重要的應用。

集微網消息,2020年10月,由華為技術有限公司主辦、成都優普誠科技有限公司協辦的「普惠AI,破浪前行」2020華為好望秋季品鑑會在成都首座萬豪酒店成功舉辦,該會就機器視覺、智慧安防等領域展開了交流討論。

其中華為的機器視覺技術尤其適合應用在智慧安防等領域,尤其是在AI技術的加持下,可以讓安防變得更加的省心且智能。例如,物體檢測就是一項基本的計算機視覺任務,它可以識別圖像中物體的位置和類別。在實際應用中,研究員和工程師們會根據應用場景與實際任務需求的不同創建針對不同具體問題的數據集,用於訓練高度定製化和獨特的自動物體檢測器。

而在智慧安防領域,物體檢測也是非常重要的一個環節,在進行很多任務之前,首要的就是將待檢測物體定位並進行類別識別。為此,華為在20年1月21日申請了一項名為「一種物體檢測方法、裝置以及存儲介質」的發明專利(申請號:202010072238.0),申請人為華為技術有限公司。

該專利中發明的系統可以應用在大規模物體檢測場景中,例如手機人臉識別、手機識別萬物、無人車的感知系統、安防攝像頭、社交網站照片物體識別、智慧機器人等等。同時,由於這種物體檢測方法在對物體進行檢測時結合了跨域知識圖譜,因此其物體檢測效果會更好。

根據該專利目前公開的資料,讓我們一起來看看這項物體檢測方法吧。

如上圖,為該專利中發明的系統架構的結構示意圖,該架構中包括執行設備110、訓練設備12、資料庫130、客戶設備140、數據存儲系統150以及數據採集設備160。數據採集設備可以採集訓練數據,並將數據存入資料庫中,但是這種用於人工智慧訓練的數據需要進行人工標註。

訓練設備可以根據訓練數據訓練出目標檢測模型,當其他未知的圖片由用戶傳遞到計算模塊時,就可以由目標模型來進行識別,從而得到物體的類別信息,並將物體的檢測結果通過I/O接口呈現給客戶設備。

如上圖,為這種晶片的硬體結構圖解,該晶片主要包括神經網絡處理器,主CPU和外部存儲器分別用於提供控制指令以及數據。配合系統架構圖可知,這種晶片就是訓練設備120中所使用的,可以完成訓練設備的訓練任務並輸出物體的類型信息。

神經網絡處理器NPU作為協處理器掛載到主中央處理器上,由主CPU分配任務,NPU的核心部分為運算電路303,控制器304控制運算電路提取存儲器中的數據並進行運算。

我們知道在神經網絡的計算中是需要大量的矩陣乘加運算的。舉例來說,假設有輸入矩陣A,權重矩陣B,輸出矩陣C,運算電路從權重存儲器中取矩陣B相應的數據,並緩存在運算電路中每一個PE上。運算電路從輸入存儲器中取矩陣A數據與矩陣B進行矩陣運算,得到的矩陣的部分結果或最終結果,保存在累加器中。

向量計算單元可以對運算電路的輸出做進一步處理,如:向量乘、加、指數運算、對數運算以及大小比較等等,例如向量計算單元可以用於神經網絡中非卷積的網絡計算(池化、批歸一化),這些結構則正是進行AI運算的基礎。

如上圖,為該專利中申請的物體檢測方法的識別步驟的流程圖,首先系統會獲取待檢測的圖像,圖像可以通過攝像頭拍攝從街景等場合提取。接著確定待檢測圖像中的待檢測物體的初始圖像特徵,這個步驟中,可以對整個圖像進行卷積運算以得到整個圖像的圖像特徵,然後再從整個圖像的特徵圖中獲取物體的初始圖像特徵。

接著根據跨域知識圖譜信息來確定待檢測物體的增強圖像特徵,這個跨域知識圖譜信息包括不同域中待檢測物體對應的物體類別之間的關聯關係,增強圖像特徵指示不同域中與待檢測物體相關聯的其他物體對應的物體類別的語義信息,這種對應關係如下圖所示。

從上圖可以看到,這種對應關係即:兩個類別在同一個圖像中同時出現的概率越大,則認為兩個類別之間有關聯關係。上圖的第一個域中的物體類別包括男人、女人、男孩、女孩和馬路;街道第二個域中的物體類別包括人、手提包、書包、汽車和卡車。

我們認為第一個域中的男人、女人、男孩以及女孩與第二個域中的人之間具有關聯關係,第一個域中的女人和女孩與第二個域中的手提包具有關聯關係。這些關聯信息是通過常識來推理出來的,這樣的語義信息可以輔助進行圖像檢測的高級別信息。例如,待檢測物體為女人,待檢測圖像中與女人相關聯的其他物體包括手提包,那麼,待檢測物體的增強圖像特徵指示的可以是手提包的語義信息。

最後,我們再來看看這種物體檢測方法的整體流程圖,待檢測圖像可以先通過傳統的物體檢測器進行處理(例如Faster-RCNN網絡結構),再提取初始候選區域的初始圖像特徵以及分類層的參數,並構建域內的區域圖。

通過構建域內的區域圖,利用域間圖卷積網絡傳播節點上不同域下待檢測物體的高級語義表示,得到經過推理推斷後的融合了不同域下待檢測物體高級語義表示的特徵。最後將域內圖卷積、域間圖卷積經過推理推斷後得到的特徵投影到相應的待檢測物體的高級語義表示中,並進行分類和回歸,由此來得到待檢測物體的位置信息以及類別信息。

以上就是華為發明的物體檢測方法,通過構建跨域知識圖譜,可以捕捉到不同待檢測物體間的內在關係,由此來提高物體檢測方法的效果。這種方法可以應用在複雜場景下,例如在商場以及商業街等區域,可以輔助安保人員對該區域的行人、物體進行檢測,例如可以幫助尋找遺失物品以及進行可以物體檢測等,有效提高城市安防能力!

關於嘉德

深圳市嘉德智慧財產權服務有限公司由曾在華為等世界500強企業工作多年的智慧財產權專家、律師、專利代理人組成,熟悉中歐美智慧財產權法律理論和實務,在全球智慧財產權申請、布局、訴訟、許可談判、交易、運營、標準專利協同創造、專利池建設、展會智慧財產權、跨境電商智慧財產權、智慧財產權海關保護等方面擁有豐富的經驗。

(校對/holly)

相關焦點

  • 華為如何實現物體檢測在大規模場景中的應用 助力智慧安防
    【嘉德點評】華為發明的物體檢測方法,通過構建跨域知識圖譜,可以捕捉到不同待檢測物體間的內在關係,從而更加精確的進行物體識別,在智能安防等複雜場景中有著極其重要的應用其中華為的機器視覺技術尤其適合應用在智慧安防等領域,尤其是在AI技術的加持下,可以讓安防變得更加的省心且智能。例如,物體檢測就是一項基本的計算機視覺任務,它可以識別圖像中物體的位置和類別。
  • 聚焦技術轉移賽道,「智慧之源」用「大數據+科技服務」助力技術...
    張媛所在的重慶市智慧之源科技有限公司(以下簡稱「智慧之源」)是國家級高新技術企業、重慶市技術轉移示範機構,承擔了環西南大學創新生態圈智慧財產權運營平臺等重要專項工作,主要負責科技轉移轉化、智慧財產權運營和大數據應用工具開發。
  • 「專利解密」海伯森基於深度相機的三維物體輪廓提取方案
    【嘉德點評】海伯森發明的基於深度相機的三維物體輪廓快速提取方法,解決了傳統方案中輪廓提取方法計算量大、算法複雜的問題,極大的改善了輪廓提取速度,並且實現難度小、提取效果好,因此可以很好的集成到運算能力有限的嵌入式系統中。
  • 「專利解密」華為如何利用可見光實現雙向數據傳輸?
    集微網消息,前不久我國研發的全球首款商品級超寬帶可見光通信專用晶片在中國國際智能產業博覽會上正式發布, 可支持每秒G比特量級的高速傳輸, 為室內綠色超寬帶信息網絡、基於虛擬實境功能的家庭智慧服務、高速無線數據傳輸等領域的可見光通信應用提供晶片級的產品。
  • 「專利解密」華為室內場景下的毫米波傳輸系統
    【嘉德點評】華為的毫米波信號傳輸系統發明專利,其第一裝置用於傳輸第一中頻信號,第二裝置對中頻信號進行上變頻處理,得到毫米波信號並進行發射,配合基帶的信號處理可實現完整的毫米波通信過程在2019年的華為開發者大會上,華為展示了其5G終端,在毫米波頻段與基站成功通信並在線播放4K高清視頻。
  • 「專家分享」《騰訊雲AI在智慧城市的應用》
    騰訊雲珠海技術總監胡楠楠帶來了《騰訊雲AI在智慧城市的應用》的分享,介紹了騰訊雲的多種落地應用場景和具體架等內容。(以下發言內容為秘書處根據現場分享自行整理,如有不足之處請行業專家指導糾正)感謝各位領導、嘉賓,大家下午好!我是騰訊政企雲的胡楠楠。我今天將從騰訊雲以及產業的視角介紹騰訊雲AI如何在各行各業方面的應用。
  • 「專利解密」小米如何實現LCD屏下指紋解鎖?
    現有的指紋識別技術主要有電容式指紋識別、光學式屏幕指紋識別和超聲波式指紋識別這三種,關於光學式屏幕指紋識別和超聲波式指紋識別在之前的專利解密系列中有過介紹。但是目前這些技術都只在OLED屏上所使用,為何LCD屏無法完成現有的指紋識別技術呢?
  • 除了雲計算和5G,未來之城還缺哪個「基礎設施」?
    很多人會認為北鬥主要應用就是導航,但其實也不盡然。從展會上看,北鬥已經滲透進了生產生活的方方面面。和生活緊密相關的應用包括健康碼、共享單車的精準定位、用於駕駛場景的車道級導航等等,除此之外,在智慧城市、智慧園區、智慧農業等場景,北鬥也在大放異彩。這其中離不開北鬥產業裡的明星企業「千尋位置」對產業鏈的推動。
  • 除了雲計算和5G,未來之城還缺哪個「基礎設施」?
    和生活緊密相關的應用包括健康碼、共享單車的精準定位、用於駕駛場景的車道級導航等等,除此之外,在智慧城市、智慧園區、智慧農業等場景,北鬥也在大放異彩。「時」是納秒級的授時能力,可以記錄下物體位於某個點的精準的時間,「空」是精確到釐米、毫米級別的定位感知。
  • 做客華為全球旗艦店,看智慧辦公新體驗如何實現
    日前,華為消費者 BG 平板與 PC 營銷部部長程磊做客華為全球旗艦店·深圳萬象天地 HUAWEI Community 活動現場,為在場的花粉、消費者及媒體朋友們帶來了主題為「靠近你,開啟智慧辦公新體驗」的分享,向大家展示了如何高效利用華為 PC、平板及手機的「全家桶」組合,開啟不一樣的智慧辦公新體驗。
  • 「智慧商圈」來了!全流程智慧服務打造全場景零售
    全場景智慧商圈方案在購物中心場景中的首個標杆案例,已在深圳萬象天地上線啟動。「 及刻作為數位化服務商,深度參與「智慧商圈」的建設及落地推廣。對於商業運營方以及服務應用開發者而言,智慧商圈方案將通過有效的用戶感知及服務觸達,幫助其延伸消費場景,打通服務鏈條,實現零售數位化升級。
  • 「專利解密」警惕晶片裂痕 三星檢測方案來助力
    集微網消息,自從中美貿易戰開始後,美國開始用晶片掐住中興的脖子,再到後來限制華為,晶片產業成為全民關注的焦點,民眾對國內的晶片產業寄予厚望,期待能夠突破技術封鎖,實現國內的產業結構升級。但是,晶片的生產製造卻難於登天,有人將集成晶片列入20世紀以來最偉大的發明之一,其工藝之複雜令人咂舌。
  • 曠視聯合智源發布全球最大物體檢測數據集,舉辦CVPR DIW2019比賽
    孫劍將微軟 2014 年創建的大規模圖像物體檢測數據集 COCO 作為參照物,將二者進行了對比,「COCO 是目前最大的、全標註數據集,訓練數據大概 12 萬,總共數據大概不超過 20 萬,其中還有很多數據沒有標。我們(Objects365)第一期開放(的)圖片數是 COCO 的 5 倍,標註框超過 COCO 的 11 倍。」
  • 「專利解密」美信電源適配器負載檢測技術助力自動駕駛
    然而當數據引腳122不慎受損時,AC-DC適配器將永不發起正常功率模式,因此考慮使用低阻抗的串聯電阻放置在適配器110與DC負載160之間的Vout路徑中監控負載狀況,並應用敏感性高的讀出電路來檢測壓降變化,從而有效地檢測負載狀況並且適當地啟動正常功率模式。
  • 「研究」從華為HiCar展望人車交互下全場景用戶體驗的打造
    HUAWEI HiCar是華為提供的人-車-家全場景智慧互聯解決方案,HUAWEI HiCar將行動裝置和汽車連接起來,利用汽車和行動裝置的強屬性以及多設備互聯能力,在手機和汽車之間建立管道,把手機的應用和服務延展到汽車,實現以手機為核心的全場景體驗,為用戶創造智慧出行新體驗。
  • 用TensorFlow實現物體檢測的像素級分類
    最近,TensorFlow 的「物體檢測 API」有了一個新功能,它能根據目標對象的像素位置來確定該對象的像素。換句話來說,TensorFlow 的物體檢測從原來的圖像級別成功上升到了像素級別。使用 TensorFlow 的「物體檢測 API」圖片中的物體進行識別,最後的結果是圖片中一個個將不同物體框起來的方框。
  • 「每日瑜伽」榮獲華為HMS全球應用創新大賽「最佳應用獎
    全球最大的線上瑜伽教學和綜合服務平臺「每日瑜伽」在本次大賽中榮獲「最佳應用獎」,獲得由華為提供的創新激勵金。該應用程式可以通過手機攝像頭及時捕捉用戶練習瑜伽時的影像,通過「姿勢判斷」(Pose Estimation)實時檢測人體20處關鍵骨骼特徵。將骨骼特徵檢測所判斷出的姿勢與標準瑜伽體式進行對比,反饋諸如頭部、頸部、左右肩膀,左右肘等關鍵節點的動作信息,並通過語音提示功能提供智能指導,讓練習者感覺好像真的有一位瑜伽老師在時刻監督自己的整個練習過程,從而獲得更好的學習效果。
  • 「專利解密」蘋果LiDAR測距系統
    【嘉德點評】蘋果公司發明的LiDAR系統,通過將雷射脈衝傳輸組合在LiDAR中並包括雙傳輸和接收系統,就可以實現近程和遠程光學系統的測距功能,並且可以動態的修改不同脈衝序列串中的雷射脈衝發射,通過調節雷射脈衝的時間設置,就可以實現不同的掃描模式。
  • 【解密】採埃孚雷射雷達技術如何助力無人駕駛;Surface Pen有望...
    1、【專利解密】採埃孚雷射雷達技術如何助力無人駕駛2、專利顯示微軟Surface Pen有望帶來「零力激活」特性 提升設備壽命3、Galaxy S21的外形設計幾乎與S20一樣 但背面有全新環繞式攝像頭
  • 「專利解密」紫光展銳AiP結構快速波束檢測方法解密
    集微網消息,毫米波是5G通信的重要組成部分,可實現更高的通信傳輸速率、更低的時延,在未來網絡、工業網際網路等領域具有廣闊的應用前景。為對抗毫米波的高路損特性,5G通信系統通常需要在晶片中使用陣列天線與波束賦形技術,實現更窄的波束以聚集能量,與此同時,需要使用波束管理和波束追蹤技術快速準確的實現收發端波束對齊和跟蹤。