臻識科技聯合創始人兼 CEO 任鵬:基於邊緣計算的全智能相機是未來...

2020-12-17 雷鋒網

雷鋒網按:2018 全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網(公眾號:雷鋒網)、香港中文大學(深圳)承辦,得到了深圳市寶安區政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智慧領域最具實力的跨界交流合作平臺。

6月30日,2018 全球人工智慧與機器人峰會(CCF-GAIR)繼續進行。在上午的計算機視覺專場中,臻識科技聯合創始人兼CEO任鵬發展了主題為《邊緣計算賦能智慧城市》的主題演講。

依託自身在嵌入式成像系統設計技術上的優勢經驗以及多年在AI算法的耕耘積累,通過邊緣計算技術的產品轉化(智能相機),臻識科技致力於為智慧城市體系中的各大垂直應用領域:智能交通(ITS)、智能安防(IVS)、智慧商業、智能製造(FA)提供更加智能化的前端成像設備及解決方案。

在演講中,任鵬介紹了臻識科技的智能相機。什麼是全智能相機?任鵬認為,不同行業對於智能相機的要求多種多樣,滿足一個場景應用感知需要的相機才是全智能的相機。為了能夠打造全智能相機,這其中也會遇到很多的困難,任鵬概括為成像、算法、製造三大方面。

在成像方面,任鵬認為,比較難的問題是智能相機的成像評測缺乏標準,但是成像一定要滿足算法的需要,其次再來滿足人的感官需要。

在算法方面,臻識科技的做法是先明確需求,確定數據集、性能指標、成本指標,同時進行嵌入式平臺的方案選型和評估,接下來進行PC的仿真、算法的實現,最後是嵌入式平臺的移植優化以及算法落地。

在製造方面,臻識科技通過視覺和控制的結合,用「智能」製造「智能相機」。現在,臻識科技的相機生產線上已經實現部分自動化,任鵬表示,今後將會在這方面繼續投入精力。

以下為任鵬的現場演講文稿,雷鋒網作了不改變原意的整理和編輯:

任鵬:大家上午好!今天主要跟大家探討我們在做一款智能相機的過程中碰到的困難以及嘗試。

我們的產品很簡單,就是智能相機。可能在座的都用過我們的產品。我們的產品雖然很小,但是分布在整個城市的各個區域,改善了人們停車的體驗,讓整個停車的過程變得更加便捷,這也符合智慧城市的理念,就是以人為本。

但是如何從一個概念變成落地的東西呢?這就需要感知能力的提升,這也就有了雲計算和邊緣計算的概念。前端的智能相機是邊緣計算裡面的一個重要存在。

什麼才是智能相機呢?有一個提法是我們的相機在不同的場景裡都可以用,在我們的理解裡,這可能是理想的狀態,它並不符合整個行業路徑發展的需要。

比如說在智能交通領域,停車場需要的相機是什麼樣的?它可能需要對車輛身份接近99.9%的準確度,因為它涉及到支付,所以對識別率的要求比較高,對車速限制比較高。卡口則相反,對識別率的要求要低一點,而對車速限制比較低。對交通的流量控制、信號燈的規劃等等,這些領域對車輛的識別又有另外的需求。所以單從交通領域,它就已經細分出很多場景。

再比如說安防領域,像平安城市、雪亮工程、社區樓宇、工地、校園、醫院等等場景,其實每一個場景對於相機的需求是不一樣的。所以我們的定義裡面,滿足一個場景應用感知需要的相機才是全智能的相機,這裡的感知主要描述的是它能去達到或者超越人的需求。

這裡有一個金字塔的描述,最底層是像素,中間層是對象,再上一層是行為。

目前在智慧城市領域,大部分的應用都還停留在中間這一層,就是對象層,而且很多場景裡面底層的應用(像素層)問題都還沒有完全解決。以前面幾位嘉賓舉的例子來說,比如說一個人臉前端抓拍、雲端識別的應用,如果我們前端抓到了人臉,它是不清楚的、模糊的,其實對這個系統的識別是非常有壓力的。比如說有的應用是前端的人臉識別,雲端根據識別的結果再來做決策,如果前端的識別老是出問題、有誤報,也會影響整個智慧城市運作的效率以及決策的準確度。

當然要實現這樣一個全智能的相機有很多難點,從我們的經驗出發,從下面三個點展開:成像、算法、製造。

成像方面,比較難的問題是智能相機的成像評測是沒有標準的,如果有標準的話,大家工作的方式就是朝這個標準努力,比如說手機相機有一些專業的評測機構定下了一些標準,安防相機也會有一些指標,比如說解析度、灰階、白平衡等等。但是智能相機的標準是什麼呢?我們的成像什麼樣才算好的?最後我們定出了一個標準,首先我的成像要滿足算法的需要,其次再來滿足人的感官需要。這是一個很主觀的概念。

在做一款相機的時候,我們先要解決它的硬體、結構、熱設計、光學等等問題,當解決完這些之後,相機的ISP是一個核心的問題,普通場景的ISP的核心是拍照或者攝影時,感知這個場景是什麼就可以了,包括最近有一些手機廠家,他們的相機裡加入了一些場景的識別功能。目的就是識別場景之後,能選擇一組更適合這個場景的ISP參數,然後讓成像更好。

但是智能相機的目的是把這個場景裡我所有關注的物體拍清楚,它基於的東西就是物體,所以智能相機的ISP的核心是基於物體的感知。這又變成了一個是先有雞還是先有蛋的問題。一個場景裡只有一個物體還好,但如果有多個物體,對當前很多ISP的架構設計是需要有顛覆性的。

在安防場景下,很多應用需要低快門的實現,因為有運動模糊的出現,我們要拍出更清晰的目標,所以我們的快門限得比較低,很多時候會限定在5毫秒以下,有的場景甚至會採用全局快門的相機。在這種場景下,我們還要面對場景照度比較低,反差的場景比較大。其實這是很困難的,比如說我站在這裡,我看門口,因為有強光打著我,其實我是看不到外面的情況,在相機上也是一樣。

所以我們現在解決這些問題的時候更多地是採用場景的細分、物體的識別,然後再通過經驗上的東西指導ISP的設計,以達到理想的效果,這也是一個階段性平衡的效果。

上面一排是同一個場景,不同的相機不同的ISP調整出來的效果,下面這個是一個寬動態的場景抓拍的效果,這兩個場景快門都是在5毫秒以下,其實是很有挑戰的。

這是一個人臉抓拍的場景,人臉抓拍識別的難度是很大的。當然剛才曠視和雲從都講到了,他們的識別算法很厲害,但是對這種只有20到30像素,不同的光照下、不同姿態的識別是非常有挑戰的,整個系統的識別率其實並不高。這還是在白天,到了晚上,對這個場景的要求會更高一些。

如果我們的人臉抓拍的相機抓拍到的人臉圖片都像一寸標準證件照的圖片,其實這個識別問題會變得比較簡單。

這上面兩幅圖,大家感覺哪幅圖會好識別一些?可能大家認為是左邊的圖好識一些,確實也是這樣,左邊的圖是我們產品的效果,通過我們的努力,我們在很多場景裡面,通過我們相機抓拍的圖片,直接把人臉識別系統的識別率提升了5%到10%。當然我們的相機也是全幀率、全畫幅。

講完了成像,再講講算法。算法不是面對所有場景的不同算法,我今天講的主要是在嵌入式設備上,智能相機的開發過程中算法要解決的一些問題。

首先是一個基本流程,我們在做智能相機的時候,首先會明確需求,確定數據集、性能指標、成本指標,同時我們會做嵌入式平臺的方案選型和評估,接下來我們會做PC的仿真、算法的實現,最後才是做嵌入式平臺的移植優化以及算法落地,基本上都是這樣的套路。

難點有很多,首先是數據,數據上面我們吃過的虧比較多。舉個例子,當時我們在一款相機產品升級換代的時候,因為傳感器停產了,我們進行了升級,傳感器的變更造成了ISP的變更,最後造成成像風格的變化,最後造成整個系統識別率的下降,其實這也可以理解為是網絡過擬合造成的問題。

數據的多樣性、均衡性以及適應場景的能力,以及它和硬體本身傳感器成像的關聯都是非常關鍵的。我們也提出一個論斷,一個公司本身的數據管理水平直接反映了算法水平,也反映了對場景的理解水平。

比如說像學術界的一些測試,數據集是定義清楚的,做起來比較容易,但是現實場景裡面數據集是不確定的,在項目實施過程中它是在不斷變化的,因此也提出了更高的要求。

第二件事是方案選型。我們團隊評測了市面上大概80%的晶片方案,我們對晶片方案的定義做了兩個界定:

一個是要滿足5瓦以下的功耗,功耗太高了不行,它對整個系統的熱設計有很大的挑戰。

第二,我們做的是實時的業務。今年市面上主流的晶片方案的算力大概是50到150GFLOPS,到明年我們預估這個指標會達到200到500G。這和很多晶片廠家宣傳的不太一樣的,我們的研發同事也投訴的會比較多一些,因為晶片廠家宣傳晶片算力很強,但是實際拿過來測試,發現效果並不令人滿意,這裡面確實存在很多問題。

我們在做嵌入式落地的時候常用的套路,當一個算法實現之後,我們要做上板的優化,一般會先做算法的近似,然後做指令集的優化,內存、緩存的優化等等。但是在深度學習這個領域,內存的帶寬瓶頸是一個非常大的問題,如果沒有革命性的突破,晶片的發展還是符合一個摩爾定律規律的,能力不會一年翻10倍、20倍。

晶片廠家其實很難跟上算法廠家的節奏,比如算法廠家在做算法的時候,可能每個月算法都有一些變化,都有一些革新和嘗試,但是晶片是很難的,生產一個晶片的周期到正式量產、成熟的產品化可能需要一年的時間,周期是很長的,所以這是一個長期的瓶頸。

一個產品需要滿足行業普世的需要,它不會專門為你這個產品來做,所以很多獨特的網絡結構上專門做優化,它的性能會提升很多,這種性能提升可能在50%甚至到100%,但是在當前的晶片上要實現這種靈活性的適應是很難的。

有的提法是說數據越來越多,晶片的算力越來越強,是不是產品做起來就越來越容易了?我們的判斷不是這樣。比如說當我們的產品在一個場景落地之後,客戶的需求是在不斷升華、不斷細化的,當然這也比較符合人性。在很長的一段時間內,算力還是不能滿足需求的增長。所以我們就會關注網絡,當然這裡我不具體討論網絡的結構,我只提我們在做這種嵌入式產品時,對網絡的理解。

因為算力不夠,在有限的性能下,我們的假定有兩點:一是更好地學習和充分挖掘性能特徵,並且在一個產品上,我們對這些特徵在不同的環節更好地復用,可以大大降低計算的複雜度;二是非端到端的架構,在產品裡面我們對每一步、每一個環節是可控的,在這個可控的基礎上一步步優化和挖掘網絡性能的邊界。這是在算法上我們的一些嘗試和心得。

第三是如何製造。我們光把這個東西設計出來不行,我們還得把它造出來。

供應鏈是一個比較頭疼的問題,原來我們沒有進行製造,做了之後我們也能深刻理解現在很多手機廠家所謂的飢餓營銷,其實也是身不由己。當解決了一些供應鏈的問題,然後就是如何把產品製造出來。

我們現在通過視覺和控制的結合,用「智能」製造「智能相機」。這是我們現在的相機生產線上的自動化流程,當然整條流水線我們還沒有全部實現自動化,但是這是我們要努力的方向。

最後提一提未來的方向。

我們的判斷是,雙目的視覺會是一個非常重要的方向,這是我們2017年10月份安防展推出的一款用於停車停車場行業的「瞾」系列產品。這款產品的特點是將深度信息和物體的檢測結合,在停車場裡達到了接近百分之百的車輛檢出率,這對行業是有顛覆意義的。

除了深度的應用,當前在安防上,我們也在嘗試通過多個傳感器的融合,來達到在很低照度下實現更好的成像效果,從而突破人的感知能力。

今天我的分享就到這裡,謝謝大家。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 臻識科技用全智能相機,把智慧城市的交通/安防/工業製造做到極致
    無論是交通管理系統(ATMS),還是電子收費系統(ETC)等智慧城市子集系統,都有賴於智能相機提供智能化信息感測,道路泊車H系列也即將亮相;臻識科技強化了邊緣計算、深度學習的技術應用,深刻解讀安防需求,智能提取視頻數據中最核心的事物(人、車、物),並生成可供雲端/數據中心直接進行分析計算的結構化信息數據,不僅滿足「看得清」的基本要求,還具備「看得懂」"看得準"的進階能力。
  • 曠視科技聯合創始人兼CTO唐文斌個人簡歷
    曠視科技聯合創始人兼CTO唐文斌 唐文斌,男,出生於浙江紹興,初中還未畢業就「毛遂自薦」進入紹興一中高中部,先後獲得全國信息學奧林匹克聯賽一等獎、全國信息學奧林匹克競賽金獎等大獎。高二時,被保送清華大學。清華大學計算機系研究生,曠視科技聯合創始人兼CTO 。
  • 深蘭科技與上海聯通聯合發布行業首個5G+AI邊緣計算設備——「五嶽...
    12月22日,深蘭科技與上海聯通在深蘭上海人工智慧大廈舉辦戰略合作籤約儀式,並聯合發布首個5G eSIM to B行業應用產品(AI邊緣計算模塊)。在經濟雙循環的時代背景下,雙方結合自身優勢,尋求人工智慧與基礎通信的有機結合,在5G+AI、AIDC、物聯網等多個領域開展務實合作。
  • 圓心科技聯合創始人兼CMO羅東滔受邀出席動脈網「未來醫療100強...
    北京圓心科技有限公司(簡稱「圓心科技」)受邀出席了此次論壇,並斬獲「中國醫療服務榜TOP100」獎項,圓心科技旗下保險板塊業務圓心惠保榮獲「2019未來醫療100強.中國榜健康險TPA TOP10」,並躋身「中國數字醫療榜TOP100」榜單。
  • 梨享計算(Pear)創始人、CEO莊奇東:標準化的邊緣計算——霧計算...
    本屆大會共設:CDN領袖峰會、邊緣計算論壇、視頻雲論壇、智能網絡論壇、國際論壇、移動&應用分發論壇、電視&媒體分發論壇、版權&安全分發論壇共計8大主題論壇,在4月10日下午舉行的邊緣計算論壇上,深圳梨享計算(Pear)創始人、CEO莊奇東做了題為《標準化的邊緣計算——霧計算時代的應用開發》的主題演講。
  • 邊緣計算:是流行詞還是未來?
    日前,全球邊緣計算大會在北京成功召開,在該領域率先展開布局的阿里雲、百度智能雲、華為等網際網路科技廠商的專家接連出場,大談自家的邊緣計算布局和發展。市場的追捧似乎正如此前聯想集團CTO芮勇博士所介紹的,「在行業智能化新需求的拉動下,『邊緣』正在變得越來越『主流』。」那麼,在風口之下,邊緣計算的未來清晰了嗎?
  • 雲圖睿視CEO孟瑩:邊緣計算如何實現場景定義AI的應用落地|公開課預告
    按照IDC的統計數據,到2020年將有超過500億的終端與設備聯網,未來超過50%的數據需要在網絡邊緣側分析、處理與儲存,未來邊緣計算市場規模巨大。物聯網終端設備種類、應用領域和場景繁多,需求也千差萬別,碎片化特點顯著。
  • 500 Startups聯合創始人兼CEO蔡李成美:全球創業生態
    [億歐導讀] 500 Startups聯合創始人兼CEO蔡李成美女士(Christine Tsai) 蒞臨2020世界創新者年會·【科技創新領袖篇章WIM2020以「科創連動世界」為主題,連接來自亞洲、非洲、歐洲、美洲的全球創新者,分享科技創新成果和認知,共同推進「讓科技更平等」的理念。在世界創新者年會WIM2020的【科技創新領袖篇章】中,500 Startups聯合創始人兼CEO蔡李成美女士(Christine Tsai)圍繞「全球創業生態洞察」這一主題發表演講,探討了疫情對投資組合的影響。
  • 恆昌創始人兼CEO秦洪濤:我們正處於科技創新的戰略機遇期 數位化...
    2020年6月15日,在恆昌「歷『9』彌新,縱情向前」9周年雲慶典直播中,恆昌創始人兼CEO秦洪濤以這樣的開場白道出了2020年恆昌經歷著的非比尋常,而這份非比尋常對其他企業來說同樣適用。在全球疫情蔓延,經濟復甦步履蹣跚背景下,2020年註定充滿特殊底色,經濟與外貿發展的諸多不確定性增加。
  • ZStack十一月刊|榮獲全國信創大賽特等獎、入選邊緣計算Top20...
    50家國家級和省級經濟廣播共同打造的《「報時未來」(全球)企業創新實踐年度峰會》上,雲軸科技的「ZStack雲計算管理平臺」憑藉自主創新的技術優勢,以及簡單、健壯、彈性、智能的產品化優勢,榮獲「2020企業創新實踐大獎」!
  • 食亨聯合創始人 董事長兼CEO王泰舟榮登胡潤Under30s創業領袖榜單
    本網7月15日訊 胡潤百富發布的《2019胡潤Under30s創業領袖》榜單中,來自十大行業343家企業的380位青年才俊榮登該榜,在這些代表中國創新創業領域最具實力、天賦和成就的年輕人中,中國外賣代運營標杆服務商食亨公司的聯合創始人、董事長兼CEO王泰舟實力上榜。
  • 邊緣計算2.0時代來臨,產業未來會這樣發展
    在這個邊緣計算2.0時代,產學研用各個環節如何推動邊緣計算發展?遇到了哪些問題?未來的發展方向是什麼?在2020年12月10日,由邊緣計算產業聯盟(ECC)主辦的2020邊緣計算產業峰會(ECIS2020)上,頂級行業專家、學術帶頭人、協會領袖、行業媒體、分析師以及廣大的產業生態夥伴,對這些問題進行了回答。
  • 自連科技與航天壹亙聯合發布支持5G和多協議的工業級智能邊緣計算...
    提供物聯網整體解決方案的領先科技企業自連電子科技(上海)有限公司(自連科技)與人工智慧及智能製造領域內領先企業上海航天壹亙智能科技有限公司(航天壹亙)今日聯合宣布:雙方攜手推出應用於工業物聯網的邊緣計算產品ALXE10B智能盒子,該產品可用於為各類加工、製造和生產場景快速添加邊緣計算所需的採集
  • 運營商邊緣計算專題論壇:雲網融合,邊緣計算加速5G落地實踐
    基於上述挑戰,鯤鵬+openEuler軟硬協同邊緣計算平臺,從處理器、伺服器和作業系統三個層面,打造適用於邊緣計算的融合統一計算平臺,為邊緣計算應用和創新提供算力支持。軟通智慧科技有限公司CTO楊旭青做題為《基於邊緣計算以及數字孿生技術,建設智能化的城市治理新體系》的報告,報告以新型智慧園區社區為例,以現代城市治理模式,介紹智慧城市模式、數字皮膚建設,以及城市仿真帶來數據智能化的應用。
  • 燧原科技進軍AI邊緣領域,攜手浪潮推出邊緣AI推理伺服器
    2020年12月23日,中國上海——燧原科技繼前日發布首款人工智慧推理產品 「雲燧i10」,又宣布攜手浪潮,共同推出基於雲燧i10的浪潮邊緣計算伺服器「NE5260M5」。標誌燧原科技業務向AI邊緣推理的拓展。該伺服器可根據客戶需求支持2-4張雲燧i10,為邊緣AI推理應用如自動駕駛、智慧交通、ETC識別、精密儀器預測性維護、AI工業質檢等場景提供強大算力支持。
  • 擁抱5G時代,睿至科技集團積極探索邊緣計算領域
    5G時代,各類創新技術飛速發展,其中邊緣計算不僅比雲端計算的數據結構更專業,還能解決網際網路邊緣設備產生的大量數據,同時降低網絡延遲、提高數據傳輸安全性,憑藉眾多優勢,邊緣計算已然成為業界關注的新焦點。據IDC的預測: 2020年全球將有超過500億的終端和設備聯網,我國邊緣計算市場將超325億人民幣。到2025年,全球邊緣側數據量將達到90ZB,邊緣計算的未來前景一片光明,國內各大廠商也陸續加大對邊緣計算領域的研究力度與投入。