AI 算法已趨同?億分之一的人臉識別辨識度意味著什麼?

2021-01-15 新智元

依圖科技聯合創始人、CEO朱瓏

【新智元導讀】主題為「引領人工智慧,創造無限可能」的2018年中國圖靈大會5月19日在上海召開,於1966年由國際計算機協會(ACM)設立的「圖靈獎」,當之無愧是計算機界最負盛名、最崇高的獎項,因而有「計算機界的諾貝爾獎」之稱。今年的中國圖靈大會,更是匯聚了學界、業界的「最強大腦」,嘉賓陣容可謂豪華。在5月19日的論壇上,依圖CEO朱瓏博士給大家帶來了一場深刻而又發人深省的關於AI時代的演講。

在美國學習工作了十年之後,2012年的朱瓏回國創立依圖,也成為這一代AI創業的典型代表。他的履歷上來看有幾段重要的經歷,第一段是在UCLA的博士時期做統計建模和統計學計算,師從艾倫·尤爾,艾倫的博士導師正是著名的理論物理學家霍金;然後在MIT的AI Lab做計算機視覺建模相關領域的博士後研究員;最後一段則是回國前,在深度學習爆發之前的NYU的Yann Lecun實驗室做研究員。

在2012年之前,很少有人會說自己是做AI的,只會說做統計建模、統計學習這些具體的方向。但從2016年AlphaGo登上《自然》雜誌,到美國著名的《經濟學人》雜誌多期報導,AI頻繁登上世界最著名的雜誌成為封面主題,如今已經進入了一個言必稱AI的時代。與AI相關的各種言論,關於機器學習、圖像識別、無人車、健康醫藥等等都逐步成為熱點。而朱瓏一直關注的是未來到底AI能發生一些什麼?

沒有權威的時代讓AI正變得真假難辨

在朱瓏的演講中,他提到目前AI跟過去比較重大的區別:因為AI發展太快,現在技術處於一個很難辨別真假、好壞的時代。以深度學習為代表新的AI技術,因為過去參與的人和實踐不多,全球性研究的大規模以及長時間的積累並不夠。因為太「熱」,使得各方都熱衷參與到AI的討論,交流甚至宣傳當中,AI的觀點就變得非常多,這客觀上使得很多專家真正有見地的意見和其他的言論很難區分開來,這不僅是中國,在美國也是同樣。

另外一個則是:技術到了一個沒有權威的時代。過去不管是從計算機視覺,還是整個人工智慧領域,最好的實驗室幾乎能夠壟斷預測全球百分之七八十的進展,但是現在AI無論是在美國,還是在中國或歐洲,大家的發展是比較跳躍性的,在一兩個實驗室非常難預測主流到底在關注什麼。這是整個時代的特點。

朱瓏的背景是跨越學術界和工業界的創業典型,經歷了中國2012年到2018年這五、 六年非常特殊的階段,正如他在演講中提到的,過去中國沒有成熟的科技創業的情景和市場機制。過去,政府、投資者、媒體這三者可以頻繁交流,在2012年之前,學術界不像今天這樣經常會被政府或一流基金邀請交流。美國則因為市場成熟,這些人經常會在一起交流,甚至都是朋友。中國這幾年開始,各種背景的人在一起交流的越來越多,這是新的形態。

技術突破打開了工業界應用的突破

技術上,2015年,機器識別人臉的水平正式超過人類。人臉識別中機器比人強,最簡單基礎應用就是1:1的比對,證明你就是你,大家熟知的是2017年iPhone推出的刷臉開機;其次是1:N,是通過任一設備裡捕捉到的人臉,從一個省(億級)或一個國家的人像庫(十億級)裡來回答你是誰,這對識別性能的要求提升了一個量級,是千倍萬倍地增長。這意味著識別技術的突破,打開了工業界中的產品的突破。

2012年之前,可以認為人臉識別技術幾乎沒有什麼發展,2017年人臉識別最高水平可識別規模在20億人,大概比2016年可識別千萬提高兩百倍,比2015年提高了數萬倍。那未來的發展到底是什麼樣?會不會再10倍、100倍甚至萬倍地發展?

大家現在也有個討論,技術是不是發展到了瓶頸?各項算法之間有沒有區別?隨著AI熱潮的湧現,各家AI公司都會頻繁參加一些業界的比賽以證明自己的算法實力,以人臉識別算法為例,可以看到各AI公司在LFW等類似的計算機視覺比賽中都取得99.xx%的成績。於是人們會問:AI算法是否已經趨同了?如果算法精度差別不大(只有幾個百分點),是否意味著創業公司的技術已經同質化了,沒有技術創業的核心競爭力了呢?

但實際上,這是典型的認知誤區。我們在朱瓏的演講中看到了一張表,可能更準確的回答了這個問題,這是中國某省1億人像庫的情況下,真實的刑偵案件的破案環境的性能測試對比的表,參與方是知名的幾大人臉識別公司:

我們可以這樣理解這張圖:必須對應場景來談算法精度。不同場景的算法精度不具備任何可比性,甚至不代表有相關性。換句話說在簡單場景下算法精度高,不代表在複雜的高難度場景下有更大的概率可以把算法精度做高,就比如在小學生的考試中拿滿分,不見得可以在大學的考試中也拿滿分。因為很多學術界的比賽使用的都是公開數據集,數據集內多是網際網路照片,類似於難度小的開卷考試,大家很容易把測試成績刷到比較高。但在實際的應用中則會遇到各種高難度場景,包括變形、昏暗、逆光、強光、光照不均、低清、運動模糊、遮擋、跨年齡段比對等,在這種情況下各家的差距迅速拉開了,第二名和第一名的錯誤率都會相差幾倍以上,遠未到趨同的程度。

第二,這些實戰中的技術差距體現在具體產品或應用上,不是簡單的好用和一般好用的差距,而是可用和不可用的差距。實戰中是要以最高效率解決實際問題為目的的。在一個1億級別人像系統中進行1:N的靜態比對時,錯誤率相差幾倍,就導致使用者做事效率下降幾倍,那麼自然而然,即使他使用的是一個多算法平臺,他也只會傾向於使用第一名的算法。

AI幫助探索人類智慧的邊界

AI除了在產業界的實際應用外,更能夠幫助我們理解人類的智慧、人類智慧的邊界。

我們以前是沒辦法了解人類自己識別能力的規模和精度,到底是什麼程度?過去沒法做這個科學實驗,1萬人還是10萬人你辨別不出來。而機器在大規模的情況下,很輕易地識別1億人、10億人,甚至更多的時候,機器識別就相當於提供了一把尺子,根據相似度比例篩選出來給人去測,可以在有效的時間裡面,測出一個人自己「看」這個世界的能力。

這是人類第一次有一個非常穩定且強大的機器,有識別能力看到人和機器智能差別到什麼程度。依圖曾做過一個實驗,在幾千萬量級的身份資料庫上,一個人把他女朋友生活照輸入進去,在機器輸出相似度前十的照片中,他是非常難辨別哪張是他的女朋友。過去機器認識生人的能力比人強,但是今天機器識別熟人臉的能力也超越人了。

今天機器是有了高性能的,比人類大很多倍的這種識別能力,能夠幫助我們回答這些更有趣的問題:在13億中國人中有多少人跟你長的一模一樣?一模一樣我們可以先定義為自己的媽媽辨別不出來誰是誰。經過依圖的實驗,結果是,每1億人當中有一個人跟你長的一樣,所以全中國差不多12個人跟你長的一模一樣的。

這個意味著什麼? 1億人當中有一個人跟你長的像,這又意味著什麼?

人類進化過程中,視覺識別能力在各大感官中的比重越來越大,也可能是人類穿衣服,嗅覺識別家庭成員的能力在哺乳動物中比較低下,主要是看人臉來辨別同類。選擇壓力驅使人類的臉之間的區分度需要儘量的大,這樣保證家庭成員的穩定性得到保障。

而人作為社群動物,需要和大量同類打交道,臉部識別錯誤的代價是失去整個基因組的遺傳繼承。對應的編碼人臉形狀的基因數量需要很大,目前知道有一條染色體的一大塊用於編碼臉部特徵。一億分之一的識別度是一個具有巨大社會學意義的統計數值,背後更多的生物學意義需要更近一步探討。與之對應的一個未經實驗證實的觀察是,動物的臉部特徵區分度不像人類這麼大。比如貓和狗,光看臉,我們很不容易區分出來。

臉部信息對於身份的確認是非常重要的,人類如果不具備辨別能力,出門回來之後你認不出你的小孩、老婆,就會出現社會的騷亂,所以說人臉識別對基因的進化有非常巨大的影響。

相關焦點

  • AI存偏見和歧視?算法讓用戶喜好趨同?科學家給出證據
    &nbsp&nbsp&nbsp&nbspAI存在偏見和歧視,算法讓用戶喜好趨同?不僅如此,在人臉識別領域,算法自帶的歧視和偏見導致的問題,已經引發了諸多爭議。&nbsp&nbsp&nbsp&nbsp近日,來自多所大學學者的研究結果為上述的偏見和歧視提供了證據。他們的研究論文目前已在預印本網站Arxiv上發布。
  • 人臉識別算法精度不斷提高 讓計算機「看人更準」(創新故事)
    依圖科技執行長朱瓏認為,依圖的人臉識別技術能拿到這個創新獎,核心競爭力是其自主研發的人臉識別算法。   人臉識別即計算機視覺處理作為人工智慧的關鍵組成,目前正處在超乎想像的快速發展階段,在安防、金融、醫療等領域已有較為成熟的應用。「我們的算法效率幾乎以每年100倍的速度在提高。現在從幾億量級的面孔中識別出一個人,並不是什麼難事。」
  • 依圖NIST奪冠,解密人臉識別算法原理
    本文引用地址:http://www.eepw.com.cn/article/201806/382456.htm  NIST測試以其評測標準的嚴謹性、一致性和全面性,成為了全球規模最大、標準最嚴、競爭最激烈、最權威的人臉識別算法比賽。
  • 虹膜識別,聲紋識別,指紋識別,人臉識別的優缺點是什麼
    億美元,複合年均增速為15.7%。生物識別市場正處在快速增長當中。 全球生物識別市場結構中,指紋識別份額達到58%,人臉識別的份額為18%,緊隨其後的是新興的虹膜識別,份額為7%,此外還有與指紋識別類似的掌紋識別,以及聲紋識別和靜脈識別等。各個生物特徵識別的優缺點是什麼,在產業化進程中有哪些困難需要克服,以及每類生物特徵的代表性企業有哪些,今天的文章將為大家詳細講述。
  • 「照片脫敏」:新照片隱私技術能擊敗人臉識別AI算法
    一秒鐘之內,人眼只能掃描幾張照片而計算機卻能執行數十億次(人臉識別)計算。隨著社交媒體的爆炸式增長,圖像已成為網際網路上的新社交貨幣。如今,Facebook和Instagram等主流社交媒體都在自動為照片中的用戶添加標籤,而Google Photos可以使用Google自己的圖像識別技術識別照片中的用戶並進行分組。
  • 人臉識別行業分析
    人臉識別與其它生物識別技術相比,優勢在於非接觸性、非侵擾性、硬體基礎完善、可拓展性。本文主要跟大家分析一下人臉識別這個行業,enjoy~一、人臉識別概況生物識別,是指依靠人體的身體特徵來進行身份驗證的識別技術,目前較為主流的識別技術有:人臉識別、指紋識別、虹膜識別、語音識別等四類。
  • 應用層下的人臉識別(三):人臉比對
    人臉算法人臉算法效果決定了人臉識別的上限,也是人臉比對最關鍵的要素。隨著深度學習技術的普及,各大公司的人臉算法效果差距也越來越小。目前主流的人臉識別算法可以分為以下四類:基於人臉特徵點的識別算法基於整幅人臉圖像的識別算法基於模板的識別算法利用神經網絡進行識別的算法2018年11月20日公布的,有工業界黃金標準之稱的全球人臉識別算法測試(FRVT)結果(如下圖):
  • 既要高精度也要高性能,人臉識別主流算法大合集
    在系列文章的第一篇一文看懂人臉識別技術發展脈絡中,回顧了人臉識別算法的發展歷程,介紹了人臉識別算法從傳統機器學習算法到現在的深度學習算法的演進歷程。接下來,我們將詳細介紹一下人臉識別常見的應用方式,以及現在主流的人臉識別算法。1.
  • 人臉識別論文筆記:OGCTL(1903.04752)
    遮擋掩模的作用:沿用DPRFS中遮擋掩模的思路,不過作者分析了DPRFS的兩個挑戰,一是速度,二是難以匹配。為了從這兩個方面對DPRFS進行改進提升,作者提出將遮擋掩模與學習緊湊模板相結合的思路。模板學習中共現信息:為了學習用於目標識別的具有辨識度並且魯棒的特徵表達,在特徵之間進行空間共現的編碼是可以增加最終特徵表達辨識能力的方法。
  • 人臉識別核心算法及技術解析
    1、在檢測到人臉並定位面部關鍵特徵點之後,主要的人臉區域就可以被裁剪出來,經過預處理之後,饋入後端的識別算法。識別算法要完成人臉特徵的提取,並與庫存的已知人臉進行比對,完成最終的分類。我們還進一步提出了融合類均值向量差及KDBFM來構建擴展的決策邊界特徵矩陣(EKDBFM)的方法,並把這兩種方法成功地應用到了人臉識別領域,在FERET和CAS-PEAL資料庫的實驗結果表明該方法比傳統人臉識別算法具有更好的識別性能。
  • 基於小波包變換和壓縮感知的人臉識別算法
    鄭軼、蔡體健[1]針對人臉求解稀疏表示時正交匹配追蹤算法運算度高,提出了一種改進的算法,加快了逆矩陣和大矩陣乘積的求解,但在構成訓練字典時對光照[2]、表情[3]、姿態[4]等考慮較少。Allen Y. Yang[5]等針對壓縮感知基於最小一範數求解最優稀疏表示時算法運算度高,提出了一種凸優化算法,取得了不錯的識別率,但仍然是超完備庫下的稀疏表示。
  • 開箱即用的人臉識別算法大盤點
    有哪些可用的人臉識別算法在上面一節,我們簡要介紹了如何做一個人臉識別系統。可以說,要做好這個系統還是需要很大工作量的。從算法層面,要解決特徵提取模型、活體檢測、人臉圖像質量檢測三塊硬骨頭。此外,還需要考慮如何優化低功耗、高性能等工程化問題。還好,現在有一些AI科技公司開放了成熟的人臉識別算法,可以讓程式設計師很快可以完成部署。
  • 不同的人臉識別算法解析
    導讀 在人臉識別領域,有一些比較經典的算法,例如特徵臉法(Eigenface)、局部二值模式法、Fisherface等,不過在這裡選擇了一個目前應用比較廣泛且流行的方法作為示例
  • 給照片穿上「隱形鬥篷」,讓人臉識別失靈的新AI
    該程序主要使用AI技術,可以神不知鬼不覺地修改你的照片,以欺騙面部識別系統。下面伊莉莎白女王的兩張照片就充分展現了福克斯化腐朽為神奇的力量。如果告訴你其實這不是「一個人」,普通人很難看出有什麼區別,但對於人臉識別系統來說,這就是天壤之別。
  • 紅外人臉識別和3D結構光人臉識別有什麼區別
    導讀 人臉識別技術有靜態和動態人臉識別之分,也有2D和3D人臉識別之分,還有可見光和紅外光人臉識別之分。其中紅外人臉識別和3D人臉識別的結構光人臉識別的媒介是紅外光。
  • 人臉識別:AI產品經理需要了解的CV通識
    一、技術流程詳解技術流程:1、人臉採集人臉採集主要關注以下因素——1)圖像大小:人臉圖像過小會影響識別效果,人臉圖像過大會影響識別速度而在實際場景中,很多人臉都會被帽子、眼鏡、口罩等遮擋物遮擋,這部分數據需要根據算法要求決定是否留用訓練。6)採集角度:人臉相對於攝像頭角度為正臉最佳。但實際場景中往往很難抓拍正臉。因此算法模型需訓練包含左右側人臉、上下側人臉的數據。工業施工上攝像頭安置的角度,需滿足人臉與攝像頭構成的角度在算法識別範圍內的要求。
  • 人臉識別技術原理與工程實踐(10個月人臉識別領域實戰總結)
    前兩年,很多機場安檢都開始用上了人臉驗證;今年4月,很多一、二線城市的火車站也開通了「刷臉進站」的功能;北京的一些酒店開始使用人臉識別技術來做身份驗證。2 人臉識別應用場景(識別)我們再來看看幾個場景。第一個是刷臉的自動售貨機。當我第一次看到這個機器的時候就有個疑問:」現在人臉識別算法已經做到萬無一失了嗎,認錯人,扣錯錢怎麼辦?」
  • 在人臉識別的「統治」陰影之下……
    而如今,這一技術難題的解決把其他的重要問題推到了我們面前,個人隱私、歧視與種族主義,這些都是近來引發巨大關注的話題。在許多國家,高精度人臉識別技術的濫用已引發不少法律問題。其他一些算法會對一組面部圖像進行歸一化處理,由此創建一個面部輪廓數據集。把這個數據集與探測圖像對比之後將其壓縮,僅保留圖像上對面部識別有用的數據。
  • 人臉識別下的隱私讓渡,代價有多大?
    20世紀70年代,在計算機技術、圖像處理技術、人工智慧和大數據等諸多學科的快速發展下,2D人臉識別算法誕生。2D人臉識別算法孕育了2D人臉識別技術系統,而繼承了2D人臉識別技術自然識別過程的3D人臉識別技術則同時具備了高效率與高識別正確率。當下,人臉識別技術已經嵌入到人們生產生活的各個方面,在財務行為、工作場所監督、安全防控等領域得到普遍應用。
  • 人臉識別哪家強?看看國內30家TOP企業!
    看看百度自動駕駛的系統和google圖像識別系統的開放可以預知未來免費是大趨勢,那可是曾經投入數百億美元。但是資本投進來,必須拉著媒體一起吆喝,不然本都回不了(進入AI行業才知道很多資本方原來什麼也不懂亂投)。