文/紐豪斯
來自AI智道的文章
如果說2018年是AI企業的融資年的話,2019年對AI企業來說就是「AI賦能智慧」的落地之年。2018年的寒冬不僅僅是對AI企業而言,各行各業都感同身受,房地產尤為明顯,企業名稱連「房地產」三個字都去掉了,紛紛改名「發展」,就是一個兆頭。
寒冬之後,緊縮的就是投資,資本家也沒有多少錢了。2019年如果AI企業不能再依靠講故事、比賽拿No 1、做演講拿融資的話,如何實現大規模擴展、招人、再發展?企業存在的意義必須有收入、有利潤,那麼2019年必須用Case來說話,用中文說就是業務必須落地,今天紐豪斯(公眾號:AI智道)就是要和大家談這個話題。
AI賦能智慧落地有幾大場景:
作為大安防市場的自媒體,紐豪斯並不像和大家過多的探討其它幾個場景,主要是想和大家聊聊大安防市場。
AI賦能安防場景分析
車牌識別:爛大街的應用,是AI賦能大安防發展最成熟的市場,廣泛應用於卡口、電子警察以及停車場出入口管理,是傳統安防企業的海大天(HDT,海康、大華、天地偉業)、以薩等企業的天下,AI新貴幾無可能2019在這個市場上分得大蛋糕。
車輛大數據:如果是基於卡口、電子警察的車輛大數據,自然是沒有AI企業的份,主要還是HDT、以薩的市場,以及眾多的大安防SI(佳都科技、東方網力、海信網絡、高新興、易華錄)的市場。如果將車輛大數據引入更大的「城市交通大腦」,情況完全不一樣,BAT、高德、滴滴均有布局並在2018年取得了不錯的戰國,尤其是阿里巴巴獨落10個城市級大腦工程。四大AI獨角獸(SKYY,商湯、曠視、依圖、雲從)如果能夠積極布局,相信還有很多機會,畢竟大腦級工程的起步尚未超過2年。
人臉識別:同樣是爛大街的場景。凡號稱安防AI的幾乎沒有那家沒有人臉識別產品或系統的,據報導瑞為公司在嵌入式門禁人臉識別市場份額很高(有待進一步考證),但要說基於全國身份證系統的人臉大庫做Face ID,算法上優秀的當算SKYY、雲天勵飛、海康,以廣東飛識、Huawei VPaaS為例,採用的是多算法融合系統,同時可以支持以上算法。人臉識別在2018年飽受非議,主要涉及隱私、GDPR《通用數據保護條例》,甚至是微軟公司也發布了《使用人臉識別技術應遵循六大原則:公平性、透明性、問責制度、非歧視性、知情同意、合法監視》,尤其是在少數族群識別上識別率差強人意,雖然中國算法公司在這方面做的更好(比如說華雲智能),但還不至於領先太多。
非人臉識別:有兩種情況是AI企業需要考慮的,不是所有的場景都可以採集人臉信息(主要涉及隱私保護/種族等原因),其次是攝像機沒有/不支持採集到人臉。就需要大規模的使用到非人臉識別技術,主要包括ReID(行人再識別)、骨骼檢測分析、圖像二次識別、特徵識別等。
2019,大安防市場落地趨勢分析
大安防市場紐豪斯曾經多次定義,主要包括平安城市、雪亮工程、智感社區、交通大腦、城市大腦、交通管控、智慧交通、智慧警務和視頻雲工程,對於比較成熟的平安城市、交通管控、智慧交通本文並不會細緻展開。2019年以下幾個趨勢是一定要關注的:非人臉識別將大行其道、聚焦垂直行業、聚焦平臺級應用、深入了解客戶的需求、大數據的開放和整合、兩種模式取其一,說的更準確一點紐豪斯更關注公共安全市場(PS,Public Security)。
趨勢一、非人臉識別將大行其道
雖然說人臉識別技術已經爛大街了,但還是有一類人臉應用是值得關注的,那就是人臉聚類。
人臉聚類
人臉聚類將是城市級的PS應用,是一定要關注的,從公開報導來看,商湯和依圖已經在積極布局。
A.商湯人臉聚類
根據商湯科技公眾號報導,香港中文大學-商湯科技聯合實驗室(MMLab)提出一種有監督的Metric用於人臉聚類,來部分解決無標註數據內部結構複雜、依賴特定Metric、缺乏Outlier控制,以及時間複雜度等問題。目前在人臉的公開數據集標到了百萬級別,人臉識別百萬裡挑一的正確率達到99.9%(MegaFace Benchmark)之後,發現再也標不動了。標註員能標出來的數據永遠是簡單樣本,而人臉識別模型是個「深淵」,當你凝視「深淵」的時候,「深淵」並不想看到你。
深度學習時代的人臉聚類,一般採用卷積神經網絡(CNN)中提取出來的特徵。人臉識別的CNN通常把人臉圖片映射(Embedding)到一個高維的向量,然後使用一個線性分類器,加Softmax激活函數和交叉熵損失(Cross Entropy Loss)來訓練。
紫色的向量即為人臉特徵(圖片來自商湯公眾號)
這種方式決定了這些經過映射(Embedding)後的人臉在特徵空間裡分布在不同的錐形(Cone)中(下左圖),因而可以使用餘弦相似度(Cosine Similarity)來度量相似度。或者如果對人臉特徵做二範數(L2)歸一化,那麼人臉特徵則會分布在一個球面上(下右圖),這樣可以使用L2距離來度量。
圖示為2維,實際在高維空間(圖片來自商湯公眾號)
有了特徵和度量標準之後就是如何選擇一個聚類算法了。現成的聚類算法包括K-Means、Spectral、DBSCAN、 Hierarchical Agglomerative Clustering (HAC)、Rank Order等以及它們的變種。利用這些方法聚類之後將每一類中的樣本分配相同的標籤,不同的類分配不同的標籤,就可以用來充當訓練集了。
使用20萬張圖提取特徵之後來測試一下這些聚類算法,K-Means花了10分鐘,HAC花了5.7小時,DBSCAN花了6.9小時, Spectral花了12小時。若使用60萬張圖片提取的特徵來做聚類,K-Means超內存了,HAC花了61小時,DBSCAN花了80小時,Spectral跑到天荒地老之後也甩了一句超內存。當圖片數量增加到140萬的時候,幾乎所有的聚類算法都掛了。
K-Means, Spectral, HAC等傳統聚類方法的問題依然存在各種各樣的問題:聚類算法具有較高的時間複雜度、通常認為數據分布服從某些簡單的假設、通常使用某種特定的Metric、缺乏較好的離群值(Outliers)控制機制。商湯提出了一種有監督的Metric用於人臉聚類,來部分解決無標註數據內部結構複雜、依賴特定Metric、缺乏Outlier控制的問題,順便還解決了一下時間複雜度的問題(CDP做到了線性複雜度),當然性能也提升了一大截。
CDP本質是學習一個Metric,也就是對樣本對(Pairs)進行判斷。如下圖,CDP首先使用多個人臉識別模型構建成一個委員會(Committee), Committee中每個成員對基礎模型中相連的Pairs提供包括關係(是否是Neighbor)、相似度、局部結構等信息,然後使用一個多層感知機(MLP)來整合這些信息並作出預測(即這個Pair是否是同一個人)。
圖片來自商湯公眾號
這個過程可以類比成一個投票的過程,Committee負責考察一個候選人(Pair)的各方面信息,將信息匯總給MLP進行決定。最後將所有的Positive Pairs組成一個新的Graph稱為Consensus-driven Graph。在此Graph上使用簡單的連通域搜索並動態剪枝即可快速得到聚類。由於MLP需要使用一部分有標籤的數據來訓練得到,所以CDP是一種基於有監督的Metric的聚類方法。
在複雜度上,CDP由於只需要探索局部結構,因此除了KNN搜索之外,聚類部分的複雜度是接近線性的。在20萬數據上,不計入KNN搜索(依賴別的庫)的時間的話,CDP單模型的耗時是7.7秒,多模型的耗時是100秒。在140萬數據上,CDP單模型的耗時是48秒,多模型的耗時是585秒。試驗結果上看時間複雜度甚至低於線性(小於7倍)。
商湯在實驗中使用CDP聚類後的數據加入人臉識別模型的訓練之後,可以讓模型達到接近全監督(使用Ground Truth標籤)的結果。如下圖所示:
圖片來自商湯公眾號
在兩個測試集(Benchmark)上,隨著數據的增多,用CDP聚類結果訓練的人臉模型性能的增長接近全監督模型(所有數據都使用Groundtruth標註)。有趣的是在IJB-A上商湯的結果超過了全監督模型,原因可能是訓練集的Ground Truth標籤會有一些噪聲(Noise),例如誤標註,導致全監督模型在IJB-A的某些測試樣例上表現不佳。
聚類後的部分結果如下圖所示:
每一組代表聚完類後屬於同一類(圖片來自商湯公眾號)
CDP屬於一種自下而上(Bottomup)的方法,因此只能感知局部的數據結構。然而感知全局的數據結構對於聚類更為重要,為此,我們最近提出了一種自上而下(Top Down)的有監督聚類方法,能自動學習根據數據的結構進行聚類,更加充分地解決上述傳統聚類的問題。聊得再多就涉及商業機密了,有興趣請關注他們的公眾號。
B.依圖人臉聚類
依圖認為AI有個創新曲線,從2015年的10萬人人臉認證到16年的1000萬人臉大庫識別,2017年發展到20億人臉大庫的識別,這是一個質的飛躍,預期未來能夠實現千億人臉大庫的識別,這是一個美好的未來。那麼再如此之多的人臉庫中找到同一個人,都繞不過人臉聚類這個功能。
依圖把人臉識別分為3個時代:
依圖的觀點「數據智能」已經得到業界的主流認可,無疑「數據」是人工智慧的三要素之一(另外兩個是算法和算力)。PS領域極致的算法能力和大數據分析能力是依圖的兩大當家法寶。儘管如此,依圖公司依然可以克服目前監控中廣泛存在的陰影、模糊、遮擋、低像素、墨鏡等多種情況,通過歸檔技術,實現高難度照片聚類。
紐豪斯了解到依圖的人臉聚類已經在湖南某時落地案例,該項目擁有3000路攝像機、數據保存100天、常口庫+抓拍聚類檔案總數800+萬人、抓拍國人數量2000+萬張,助力刑事案件破獲佔比約35%。
考慮到人臉識別的爭議性,在計算機視覺領域紐豪斯更加關注非人臉識別,典型應用包括:圖像二次識別、ReID和骨骼檢測系統,雖然也有很多其它類型的應用,但最有希望在2019年實現落地的應該集中在這三個方面。
圖像二次識別
AI對人類最大的價值來自於兩個方面:減少人工節約人力和降低成本。如果AI擁有比「人」更加強大的能力,效果更高的話,相信會得到快速的普及。以典型違章數據處理為例,目前的交通違章均需要通過人工進行二次識別,如果能夠採用AI技術進行二次識別,事先將模糊、非違章的照片去除,就可以大大降低人力水平,同樣如果把這些技術也用於行人闖紅燈警示,而可以大大減少交通事故的發生。
ReID行人再識別
之前的公眾號文章我們曾經探討過ReID,後續還會有一篇專題文章來進一步探討。ReID是近2年得到迅速發展的非人臉識別技術,華雲智能、雲從科技和千視通都取得了技術上的突破,並能夠實現商用。對與ReID而言最實用的當屬以圖搜圖功能了,有望在2019年得到較大規模的落地。
ReID(Person Re-identification),也稱為行人重識別、行人再識別、跨鏡追蹤,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術,廣泛被認為是一個圖像檢索的子問題,目前主要應用於安防領域,未來與人臉識別相結合能夠應用於更多更豐富的場景。
ReID的優勢在於實時分析,對攝像機沒有太高的技術要求,我們可以假定一個場景,春運過程中當一位媽媽攜帶一名子女在購買車票的過程中發生小孩走失的情形,警察在接到媽媽的報警後,通過給媽媽拍照採集人臉,通過同行人找到小孩的人臉照片,再通過小孩的照片用ReID技術進行跨鏡追蹤,就可能找到小朋友的軌跡,這具有極大的實用價值,避免報案人口頭描述不清、無法準確掌握小孩外貌/衣服特徵的情況下,尤為管用。
骨骼檢測系統
骨骼檢測技術和ReID技術有異曲同工之妙,差異在骨骼檢測僅檢測「骨骼」和衣服的顏色不相關,就可以大大減少顏色特徵帶來的誤報,通過身高、步態、姿勢來判斷一個人來實現分析,從目前的技術發展來看,已經具備在2019年實現小範圍落地的可能性。
人體骨骼關鍵點對於描述人體姿態,預測人體行為至關重要。因此人體骨骼關鍵點檢測是諸多計算機視覺任務的基礎,例如動作分類,異常行為檢測,以及自動駕駛等等。近年來,隨著深度學習技術的發展,人體骨骼關鍵點檢測效果不斷提升,已經開始廣泛應用於計算機視覺的相關領域。
趨勢二、聚焦垂直行業
主流企業採用矩陣式管理已經非常常見,尤其是在AI圈,既要布局全國市場,設立分公司、辦事處,也要布局垂直市場。紐豪斯曾經在公眾號(AI智道)發布《城市級大安防項目市場分析報告》,典型的垂直市場包括公共安全(PS,Public Security)和交通(涵蓋交通管控和智慧交通),這裡不在贅述,對於AI企業落地大安防市場而言,這兩大市場是必爭之地。
趨勢三、聚焦平臺級應用
紐豪斯多次和讀者探討城市級大安防應用,這是典型的2G市場,而2C和2B的市場相對分散而不成熟。對於SI而言,只有擁有平臺級應用(殺手鐧)才能立於不敗之地,對於AI企業而言,如果不能擁有自己的大安防平臺很難和大型SI擁有討價還價的能力。尤其是漫天蓋地的新聞說,某某城市又建設了一個大腦、一個平臺的時候,發現市場機會又被友商撬走了,心裡確實很著急。
那麼城市級大安防市場的平臺應用有哪些?
平安城市:聯網平臺、運維平臺、一機一檔
雪亮工程:除了平安城市的平臺,再增加一個網格化平臺(一標三實)
智感社區:居民信息登記系統、社區綜合信息查詢系統、社區警務管理服務系統、社區警務管理服務APP、社區綜治平臺、警務平臺、一標三實平臺等,目前BATH、東方網力、佳都科技、科達、商湯、曠視、力維等企業均有積極布局
交通大腦:城市交通大腦平臺,主流廠商包括阿里巴巴、高德、滴滴、方緯科技等
城市大腦:城市大腦平臺,影響力最大的廠商當屬阿里巴巴,大約有10個城市的落地
視頻云:AI賦能安防最高級的應用當屬視頻大數據和視頻雲建設,只有足夠多的數據才能夠產生更多的應用和技戰法,未來的視頻監控當屬於市級甚至是省級的視頻雲平臺,在2018年已經有較多的落地案例,相信在2019年會出現更多的視頻雲和大數據平臺
智慧警務:涉及的平臺最多,也最複雜,各警種都涉及多種平臺,典型應用包括治安、管控、指揮、偵查、監管等
廣東省智慧新警務13847規劃圖
應用參考:阿里城市大腦3.0
來自雷鋒網的報導,城市大腦是技術進步的產物,也是城市發展的產物。綜合來說,雲數物智技術積累、國家政策支持、本地政府配合、後期龐大城市訂單等等因素,促成了天時地利人和的形成。AI、IoT、雲計算、數據挖掘、知識管理、深度學習等技術迅速進入爬坡期,網際網路科技公司、運營商、硬體廠商參與城市建設有了便捷的通道,但由於智慧城市是一個跨系統交互的大系統,是「系統的系統」,不是硬體的堆疊與軟體的重複建設,而是需要有一個中樞神經式的城市指揮系統,這個系統必須具備全面、實時、全量的決策能力——這成為「ET城市大腦」誕生的基礎。
2016年10月,雲棲大會城市大腦首次亮相,由王堅發布;
2017年4月,城市大腦落地蘇州;2017年8月,城市大腦落地澳門;
2017年10月,杭州城市大腦1.0正式發布;
2017年11月,城市大腦入選新一代人工智慧開放創新平臺;
2018年10月,杭州城市大腦2.0正式發布;
2018年12月29日,杭州城市大腦綜合版發布,將進入3.0時代。
雷鋒網注意到,城市大腦1.0版本到2.0版本用了整整一年,而2.0版本到3.0版本只花了不到3個月的時間。2013年,閔萬裡加入阿里任職阿里雲機器智能首席科學家,先後打造了ET城市大腦 、ET工業大腦、ET農業大腦等。加入阿里之前,閔萬裡在Google和IBM工作過,而IBM還是智慧地球的倡導者。
雷鋒網注意到,阿里城市大腦團隊的重點在公共安全、城市管理、交通治理3大領域。在2018年10月,該團隊還在社招一些在自然語言處理(NLP)、知識圖譜、機器學習、深度學習、大規模分布式機器學習領域有3-5年研發經驗的人才。隨著2018年11月阿里雲事業群升級為阿里雲智能事業群。科學家出身的閔萬裡在阿里雲內部繼續承擔著打通各個行業大腦數據的使命,用數據智能推動城市大腦的商用。
此外,在阿里達摩院,北京大學應用數學博士,IEEE Fellow華先勝領導城市大腦實驗室,主抓城市大腦在視覺方面的技術研究。華先勝的職位是阿里巴巴副總裁、達摩院城市大腦實驗室負責人。在城市大腦項目上,閔萬裡和華先勝的團隊緊密合作。
阿里雲想的很明白,做好行業大腦必須把握好3個能力:AI能力、雲計算大數據能力、垂直行業整合能力。在城市大腦背後的技術架構上,分布著4大平臺,涉及與城市交通、醫療、城管、環境、旅遊、城規、平安、民生八大領域有關的計算能力、數據算法、管理模型等。在城市大腦視覺AI的項目組成上(這部分由華先勝團隊主導),目前分為天曜、天鷹、天機、天擎四個部分。前三部分比較偏應用,最後一部分是平臺。
在杭州,杭州城市大腦塑造了經典的案例。作為長江三角洲城市群中心城市之一的杭州,曾經上下班高峰期堵車非常嚴重,而目前,受益於「城市大腦」,杭州交通效率不斷提高。依據公開的城市季度報告,在全國最擁堵城市排行榜上,杭州從2016年的第5名下降到今年第二季度的第57名。2018年9月,杭州雲棲大會上,浙江省公安廳副廳長金志在現場宣布:杭州市「城市數據大腦」交通V2.0正式發布。金志表示,杭州城市大腦2.0將覆蓋主城區、餘杭區、蕭山區共420平方公裡,一年擴大28倍。接管1300個路口信號燈、接入4500路視頻,通過7大生命體徵全面感知城市交通,並通過移動終端直接指揮杭州200餘名交警。
截止到今天,阿里城市大腦已成為全球最大規模的人工智慧公共系統之一,已覆蓋交通、安防、醫療、旅遊、市政建設、城市規劃、工業、環境、政務民生等領域,為阿里也為產業界帶來了巨大的經濟效益。這些場景中,交通、城市治理、政務民生是最具吸引力的場景。
阿里想緊緊抓住的是智慧城市領域的第一波創業者和研究者,而這種想法在其他廠商中間似乎不多見。雷鋒網注意到京東智能城市研究院的成立,引入在計算機、AI、自動化、仿真技術、城鄉規劃、視覺感知等方面的6位中國工程院院士,其城市計算平臺也在逐漸匯聚產業鏈上下遊的垂直企業。同時,阿里雲緊密與專業廠商進行積極合作,對外宣布的包括浙大中控、銀江科技、浙江大華、圖盟科技等公司,以期望能夠將其最新技術注入到傳統廠商的方案當中。
趨勢四、了解客戶的需求才能夠有效落地
只有最切近用戶需求的應用才能夠更有效的落地,任何不落地的AI技術和產品都是沒有辦法產生利潤的。2019年是70周年大慶之年,而2020年正是十三五的收官之年也是十四五的規劃之年,也許十四五的規劃在2019年就要開始了,對趨勢的準確判斷將決定未來7年AI企業的命運,所謂運籌帷幄之中,決勝千裡之外。
最近參加的論壇、演講、聚會、年會很多,也多了一些和用戶面對面的交流機會。以公共安全市場為例,傳統的視頻監控系統解決了人盯人的問題,減少了現場的巡邏人員,解放了一部分警力。之後視頻監控系統越來越智能,逐漸可以解答「車去了哪裡了?」「你是誰?」諸如此類的問題,最早提出來智能應用的起始年應在2013年,大規模進入試用的年份當從2016年開始算起。
雖然人工智慧技術、人臉識別技術最近顯得火熱,但實際上很早已經得到廣泛應用,卡口和電子警察是最早實現智能應用的,第一個解決的就是車牌抓拍(典型的人工智慧)。2011年之後各省市區逐漸建立了人臉靜態大庫,開啟了人臉識別的算法應用,逐漸試水動態人臉識別算法,不過這個時候四大人臉獨角獸企業SKYY還沒有誕生或者剛剛起步,一些人臉識別的先驅企業推動了AI技術的應用,不過比較令人失望的是大部分這些企業並沒有在AI熱浪中崛起,前期的巨額投資在現在看來肯定是要打折扣了。
新的AI企業崛起之後,更多的告訴用戶的是實驗室的數據、識別率,或者是世界大賽又拿了幾個世界第一,過度的宣傳或者鼓吹,造成用戶期望值的巨大落差,為什麼我找了四家、五家世界第一的AI公司還是不能解決我的問題?這是一個誤區,企業說的很好做的很差,2019年建議企業還是務實比較好,儘可能做出來的效果就像說出來的效果那般。其次數據安全、網絡安全也很重要,這個需要進一步的探索和解決,需要重視,尤其是當視頻專網延伸到社區之後,更加需要重視這個問題。
應該怎麼做?用戶有幾個建議。
首先就是平臺異構。現在的企業,老死不相往來,排他性很強,總想獨霸一個市場。其次就是產品軟硬體一體化,把軟體固化在硬體中,列硬體參數控標,這樣導致用戶的機會成本很高,及時第二家公司免費提供產品和服務,客戶依然要付出巨大的代價。尤其是大型項目的預算、決算流程涉及多個部門,這些因素都要考慮,即使是最終用戶也需要被監督、被審核。最好的方法就是實現平臺異構、互相兼容,多算法融合,共榮共生。
其次就是深挖行業深度應用。目前大多數的應用都屬於比較淺層次的、容易被滿足的需求。因地域性、環境、文化多從因素造成客戶的需求千差萬別,及時同一個廠家通過定製開發也會形成多個軟體版本,最終就出現了難共享、難擴容、難兼容的問題,即使採用了共同的國標進行系統設計,但最終的互聯互通只有親身經理才能夠感同身受。基於此很多客戶提出了視頻雲的解決方案,要求引入競爭機制,所有的廠商不管是硬體、算法、算力、數據都放在雲端,每家都分配一定的比例,按照共同的標準建視頻雲,由最終使用者決定用哪家的服務。以算法為例,引入競爭機制,如果平臺同時支持SKYY(商曠依雲)、HDT(海大天)、雲天勵飛的算法,每種算法都給推薦結果(TOP 3),由用戶決定採用哪種算法,久而久之,競爭機制出現,優勝劣汰,也有助於算法廠商提高自己的算法水平,這實際上也是一個平臺異構的問題,也是深挖客戶需要的一個應用場景。
數據共享和開放是趨勢。做過公共安全市場的讀者都知道,現實情況是AI領域應用存在著多個專網(比如視頻專網、政務網)和公網(比如網際網路),每個網中的數據都不同,網和網之間可能是隔離的、有邊界的,故而需要將硬體、軟體、數據實現三解耦,把原先錯綜複雜的數據進行剝離、梳理清楚,之後再推進數據共享,不管現狀如何,相信2-3年內這種共享的障礙必將逐漸消除,對企業而言必須實現規劃好一旦數據打通後的系統架構問題。
通過雲化解決區域發展不均衡的問題。地域經濟發展不均衡是普遍存在的,即使是在廣東省這樣經濟發達省份,也存在粵東西北發展比較落後的情況。按照經驗,城市級安防項目的建設通常由所在的地市區縣財政承擔,那麼如果統一規劃,勢必會有部分區域因為資金問題沒法建設最新的AI系統或引入最新的AI技術,那麼雲化就是一種比較好的解決方案。通過建立數據伺服器集群、GPU群,多個縣、市、區可以供用一個視頻雲,按需申請、按需使用,如果全省、全市一片雲的話,就可以由上級部門統一建設。順便補充說明的是市縣的財政決定視頻系統建設的規模,尤其是AI的投入,畢竟屬地責任在財政。目前來看廣州市、深圳市、杭州市、上海市都走在視頻雲建設的前列。
用戶需求逐漸轉向精細化管控。比如發生群體性事件,有關部門希望能夠通過AI技術來識別到底是誰在表達訴求?是不是本地人?如果不是,背後是誰?第一時間要掌握,也可以同樣適用於醫鬧。另一類的精細化管控需求包括特定外籍人員精細化管控,我們都知道人臉識別技術在對有色人種識別的時候有著比較低的識別率,到底如何解決?造成了落地困難的問題。其它的精細化管控包括城市到底需要安裝多少只AI攝像機?如何布點更有效?安裝高度如何?財政支撐的上限在哪裡?投資的盡頭在哪裡?這些都需要精細化考量。
人防、物防、技防,那個更合適?以發達城市平安建設為例,每路攝像機平均投資7-8萬元,多採用5-6年BT模式建設,算下來1.2+萬元/年/路,1000元/月/路,那麼請一個安保人員一個月按5000元工資計算,那個更划算?按照最新的AI投資測算,僅考慮算法每路視頻監控的投資大約在1萬元,如果建設3萬路視頻監控AI部分就要投資3億,如果同時考慮算法+伺服器+後臺應用,則投資成本可能高度3+萬元/路,這還是在新增深度應用不足的情況下,如果引入更多的AI應用,也許需要更多的錢。
好消息是2019年是PS行業信息化建設的關建年,AI企業還有很大的機會。2019年是視頻雲大規模建設的一年,2018年之前已大量建設了基礎設施,之後就要充分挖掘視頻系統的潛力。
那麼針對用戶的需求,推進AI安防工程化落地有什麼更好的解決方法嗎。合理的控制成本、確保交付的質量、全面整合數據、精細化的深挖客戶的需求。多了解需求的場景,比如重點關注的晝伏夜出、同行人、特定區域/時間的計算等。構建高效的計算框架,提供系統的識別率,了解當前客戶的現狀解決系統的落地,否則都是空話。
趨勢五、大數據的開放和整合
在AI賦能安防的大背景下,主要應用在計算機視覺,那麼毫不誇張的講,未來的格局得攝像機者得天下、得攝像機的得數據,這是對AI而言。我們都知道公共安全領域的有四偵:圖、刑、技、網,四偵合一一直是努力的方向,並向合成作戰方向邁進。制約數據共享和開放的因素一直都存在,故而警務大腦的商機若隱若現,但機會只留給準別好的人。最早看到商機的當屬Huawei安平BG,他們的戰略就是「長期戰略投入,做深做透PS行業」。
城市級的視頻大數據一旦被充分挖掘,再整合多個維度的開放數據,其潛力和前景都是值得提前布局的。
趨勢六、兩種模式取其一
在AI企業如何落地這個問題上,有兩個模式可以參考。
A模式:系統做大了就得做總包,做中標人,這是阿里模式。以城市大腦為例,在2018年多採用單一來源方式招標,系統技術實在是太新了、太複雜了,很難找到第二家供應商。
H模式:自己供設備、軟體和系統,讓生態鏈企業去做,這是Huawei模式。這個前提是企業的產品要足夠好,可以被集成,也將是未來競爭最激烈的、多方博弈的市場。
還有第三種模式嗎?A+H模式,我們期待這樣的企業出現,在傳統安防市場上曾經出現過像Tyco、Siemens、Honeywell、JCI這樣的企業,確實走的A+H模式,但貌似在中國都不太成功。
2019,未來市場預判
2019其實就是為2020年做準備的。未來市場會出現各種的變局,這篇文章裡我們僅探討幾個。
數字視網膜
中國工程院院士、中國計算機學會理事長高文早在2018年(或者更早)就提出了數字視網膜的概念,紐豪斯在雷鋒網舉辦的首屆中國人工智慧安防峰會上聆聽了高文院士的演講,其後在多個場所多次聽到數字視網膜,其獨特的觀點和技術領先性值得深思和參考,而且數字視網膜和鵬程實驗室、深圳龍崗智能視聽研究院也有關聯,這也是紐豪斯感興趣的。
根據雷鋒網的整理報告,數字視網膜分為傳統的高效視頻編碼和實時特徵提取兩部分。高院士認為現在的視頻監控系統,從一開始就面臨數據量太大、存儲量太大,查找數據不易等一系列挑戰,這些挑戰可以歸納成三個問題:難存儲、難檢索、難識別。這種新型的數字視網膜可以被稱為慧眼,這種慧眼不僅能看,還能夠感知。如果整個社會均由這種慧眼構造成,那系統會非常強大,智慧城市和公安公共視頻的處理也會變得更加得心應手。
圖片來自雷鋒網
實際上承載數字視網膜的攝像頭能做兩件事:做好編碼,為後面的識別提取出需要的信息。如果把識別算法直接放在攝像機裡,會存在問題。攝像機做的事應該是提取特徵,把後面可能用到的模式識別的特徵提取出來。當然,也不能用一個攝像機把人臉和汽車等所使用的具體系統的私用特徵全部提取和傳輸,因為這些特徵加在一起可能比原來的一個碼流還大,相當於傳兩個碼流。
如何解決這個問題?用數字視網膜。實際上人的眼睛原理和數字視網膜很相似,我們看東西時傳給大腦的信息,實際上並不是具體地實打實的物體影像,而是視網膜給後腦傳輸了生物特徵,在後腦完成。
圖片來自雷鋒網
數字視網膜與人的眼睛既具有影像重構(精細編碼視覺內容),又具備特徵提取(面向識別理解)的功能。原則上這一部分把高效、監控視頻編碼(視頻特徵的緊湊表達),把這些特徵集合起來變成緊湊地給它表達出來就叫做「緊湊表達」。它用了原來同一個碼流解決了兩件事,但前提是視頻編碼略微會有點損失,但它對識別結果的提升比不用這種方式要高很多倍。
數字視網膜包含了四項核心技術:
圖片來自雷鋒網
當然關於數字視網膜的技術介紹很有很多,大家可以在雷鋒網上查看。
數字視網膜的創新之處就是在傳統的視頻傳輸信號之上疊加了特徵編碼信號,不管企業是否接受,這都是未來不可逆的發展趨勢,數字視網膜的落地需要標準化,而標準化和兩個機構有關:鵬程實驗室、深圳龍崗智能視聽研究院。
2017年12月22日,廣東省正式啟動建設首批4家廣東省實驗室,深圳網絡空間科學與技術廣東省實驗室就是其中之一。2018年1月19日,深圳市舉辦了實驗室籌備工作會議,召集國內相關領域的權威專家院士開始籌建實驗室。3月31日,實驗室啟動大會在深圳市召開,中國工程院院士高文被聘為實驗室主任,鵬城實驗室正式對外公開亮相。實驗室整體規劃土地使用面積134萬平方米(即2000畝),建築面積150萬平方米,一期建設用地規劃在南山區石壁龍片區。建設期間,實驗室啟動過渡場地位於大沙河創新走廊的核心發展片區——留仙洞戰略性新興產業基地萬科雲城一期8棟,建築面積5.3萬平方米。
紐豪斯通過官網了解到,鵬城實驗室以哈爾濱工業大學(深圳)為合作單位,協同北京大學深圳研究生院、清華大學深圳研究生院、南方科技大學、香港中文大學(深圳)、深圳大學、中國科學院深圳先進技術研究院、華為、中興、騰訊、中國電子、國家超級計算深圳中心深圳雲計算中心、中國航天、中國移動、中國電信、中國聯通等十餘家高校、科研院所、企業等優勢單位共建。目前設有網絡通信、先進計算和網絡安全三個研究方向,分別由中國工程院劉韻潔院士、高文院士、方濱興院士任方向責任院士。
高文院士擔任主任,那就很有可能催成數字視網膜在鵬程實驗室的落地。根據最新消息2019 年 1 月 23 日下午,鵬城實驗室人工智慧國際研發中心揭牌儀式在深圳市福田區深港協同創新中心舉行。作為鵬城實驗室參與全球人工智慧研發的橋頭堡,首批3個高水平國際化項目已全面入駐。項目分別涉及智慧金融理論研究(沈向洋負責)、智慧金融應用研究(楊強負責)以及自主健康研究(Ramesh Jain負責)。
在鵬程實驗室成立之前的2017年7月26日,深圳市龍崗區政府與北京大學數字視頻編解碼技術國家工程實驗室、中關村視聽產業技術創新聯盟,在深圳市舉行深圳龍崗智能視聽研究院籤約暨揭牌儀式。北京大學數字視頻編解碼技術國家工程實驗室和中關村視聽產業技術創新聯盟由高文院士牽頭組建,是自主創新的AVS標準的核心推動力量,也是新一代人工智慧規劃的積極參與者之一。而這個試聽實驗室也和高文院士有關。
兩大機構的聯繫人是李革博士,國家特聘專家,北京大學數字視頻編碼技術國家工程實驗室深圳分室負責人、鵬城實驗室人工智慧研究中心主任。美國奧本大學電子工程博士學位、美國加州大學戴維斯分校電子工程博士後。相信在李博士的聯繫下,數字視網膜的標準有可能在兩大機構的助推下實現落地。另據悉深圳龍崗智能視聽研究院投資設立深圳龍崗智能視聽技術有限公司,副院長是安欣賞,領英資料顯示安畢業於大連理工大學,畢業後加入華為公司,服務超過16年。
多維數據融合
數字視網膜解決了視頻流的傳輸和特徵結構化問題,獲取了如此之多的結構化視頻數據之後,就需要將視頻數據和其它數據進行碰撞,也就是多維數據融合。
以人臉識別為例,如果攝像機採集到了一個人臉,但是系統是無法告知「他是誰?」,這需要一個龐大的基礎人臉庫(比如身份證大庫)進行1:N的比對,這個人臉庫就屬於多維數據融合的典型應用。又好比說,系統採集到一個手機的MAC地址需要和一張人臉進行匹配,也是一種數據的融合。又好比將一條門禁刷卡記錄和人臉照片結合起來。
現實的情況將會更為複雜,城市治理的核心就是人的動態,捕捉人動態最好的方法就是利用遍布城市的攝像機。那麼未來如何打破壁壘,將攝像機採集的數據和其它多維數據進行碰撞、融合,就很有必要成立一個大數據協調機構來完成,也可能需要一網多域的管理方式進行管理。
其它落地因素
影響2019年AI項目落地的因素很多,還有幾個因素是需要考慮的。
根據主流觀點,攝像機視頻前端預計1-2年(2019-20)內不會大規模增長,這是財政負擔越來越重,好鋼用在刀刃上,但AI攝像機在整個攝像機中的佔比將會有較大幅度的提升
大規模的建設需要等待視頻監控十四五規劃,相信2021-25期間肯定會有大規模突破
廣大的鄉村和鄉鎮,偷雞摸狗的依然存在,隨著城市化進程的推進,鄉村的空心化、老齡化日趨嚴重,人防越來越難了,而利用AI技術提高鄉村和鄉鎮的安全性已經迫在眉睫
儘管財政負擔很重,2019年AI依然會保持大規模投入
市場整合力度會越來越強,網際網路+停車場、網際網路+門禁、智慧社區的標準都在推進位定中
以上並不全是紐豪斯的觀點,部分觀點也是來自於第三方的溝通。
2019,AI企業一定不會一家獨大、獨佔區域市場,一切才剛剛開始。