「極客公開課·Live」5 分鐘帶你複習「刷臉解鎖」技術背後的技術...

2021-01-08 極客公園

今天的話題講的是關於人臉在人工智慧、網際網路時代是怎樣在我們的電腦中運作的。


人臉——生物識別中的另類

指紋、虹膜、指靜脈、鞏膜以及視網膜,這幾個都是常見的生物識別的方式。這些生物特徵有一個共同的性質,那就是它們都有一定的隱私、私密性,也就是說如果不近距離接觸或者近距離觀察,根本沒有辦法直接獲取。但是人臉跟這些傳統的生物特徵相比,基本沒有所謂的隱私性可言。

在人腦當中有一個區域叫做梭狀回,現在公認的認為在這個區域裡面會對人臉的信息做一些處理,但是醫學有很多不同的假說,有說裡面的某些區域,或者裡面某一個神經來做這個處理。為什麼認定說這個區域對人臉做識別?因為如果這個區域受到損傷,就會得一種叫做面孔失認證,也就是我們常說的臉盲,就是看這個人,但我不記得這個人是誰了,那麼這個區域來專門處理人臉,也就是說其實人臉是人腦中,特別重要的一個要被處理的信息對象。


觀點總結成兩點即:

第一、人臉與其他生物識別特徵相比缺少「私密性」;

第二、人臉更適合人腦來做,但不一定適合電腦來做。

推論即:在缺乏隱私性這一環節上,我們人臉如果需要被更多的在機器學習、在商業上被使用的話,它一定要解決的問題,叫做有更強的鑑偽能力。


人臉識別背後的技術

1.找人臉

在實時獲取到的一個視頻流後,首先需要找到視頻幀當中的人臉具體在什麼位置,然後這個過程,對人腦來講很簡單,好像人就在那個位置。但對計算機而言,它需要有一個計算的過程,這個過程叫做 Face Detection,也是人臉檢測的過程。

這邊是用一個比較傳統的方式叫做 Sliding Window(窗口掃描法)來做人臉的查找。這個是通過基於統計基因學習方法訓練出來的:我得到一張圖像,我的分類就可以告訴你,我覺得這個是人臉,或者我覺得這個不是人臉。那麼於是在機器分類之後,我們發現剛才切出來很多小的圖像,輸入給機器,最終機器把其中一部分歸結為人臉的部分就全部挑選出來了。

2.分析臉

我們會做一些對這個人臉的一些屬性進行分析,通過找到人臉的關鍵點,包括眼睛、嘴巴、鼻子的位置,來判斷這個人臉目前的狀態,比如通過眼睛的睜、閉狀態來確認你是否在一個主動希望開啟手機解鎖這麼一個狀態。

3.真假臉判斷

完成這些分析之後,就要做下一步更重要的工作,叫做「真假人臉的判斷」,也就是我們所謂的活體檢測。

4.人臉對比

機器識別人臉,首先第一步先去找一個拿來容易比較的人臉,這個人臉的 Pitch 的角度是-15 度,那麼基於這個-15 度先去找一個底庫當中,比較容易拿來做比較的人臉。接下來它把這個人臉提取特徵,所謂的特徵其實是一個在高維空間中的一個向量,然後將兩邊都分別提取好的特徵進行比較,那麼高維空間中的向量,比較他們的相似性,其實有很多方法,這邊只是挑了一個比較簡單的方法,就是算兩個向量的距離,也就是算兩個高維空間中,向量的 Feature&a—Feature&b 的距離,如果兩個距離靠的越近,那我認為他就是同一個人,或者至少是一個相似的人。

下面的 LSW 表格,也就是一個公開的人臉測試數據集上面的一個大家提交的識別結果報告,這個報告當中顯示,在 2009 年的時候,學術界做的算法,普遍識別的準確率在 84.7%,但是隨著時間的往後推移,其實一方面是計算能力的提升,另外一方面是算法能力的提升,還有數據積累的提升,這個能力會越來越強,到 2014 年的時候,我們發現,準確度已經達到 99.5%,這個已經沒有太高去做提升的水平了。



正在被人臉識別接管應用場景

場景中比較常見的就是客流統計,然後是在安防場景下的一些嫌疑犯的追蹤,今年一個涉賭的通緝犯被我們對接過的一家醫院的安防系統識別出來,並自動發出了報警,對比分數大概在 87 分,隨後民警出警確認並抓捕歸案。據悉今年一年已經快百起此類被算法識別出來的實例。除此之外還有智能訪客系統、門禁系統、活動籤到、智能樓宇、閘機關口等。

另外還有一些大家都能接觸的場景如遠程身份驗證。首先,驗證身份其實在中國很容易,每個人都有一個唯一的 ID,叫做身份證號,同時公安部還有非常完善的人臉系統以供識別。然後進行一個活體檢測就可以確認身份。


活體檢測背後的技術

對於活體檢測的定義叫做:對傳感器感受到的「真人」與「攻擊」的不同做出辨識。

判斷對象是不是一個活人其實並沒有統一的方法。我們的算法研究員做了個示意圖(如下),我們來判斷這個人是真死還是假活,其實只是管中窺豹。這個斑點就是說,我的攝像頭,成像域下的這麼一個空間狀態,在這個空間狀態當中,活人(真人)在鏡頭中,只佔很少的一部分,就是中間藍色的 S 形狀,我們把它想像成一個高維空間當中的某一族的特徵的分布,這些都是活人。

那麼所謂的攻擊又是什麼呢?就是說,通過不同的攻擊手段,比如說翻拍屏幕、翻拍照片、翻拍蠟像,會有不同的介質,然後這些介質和這些真人都很像,正好就分布在這些真實數據的判斷,就像在圖像當中的紅色介質顯示的部分,我們可以把它想像成在一個高維空間當中,藍色的是我們活人的所有的這一族全部都在這裡,然後所有翻拍的介質都試圖去模仿這個活人,但都只是模仿了其中的一部分。


機器通過我們自己研製的一套深度學習算法的循環來進行訓練,簡單說就是通過大數據收集—訓練—產出算法—變成產品—再收集更多的數據,完成這樣一個閉環。


在人臉識別中常見的認知誤區

誤區一、人臉活體的安全是多少?

為什麼我說安全率一個不合理的一種提問的方式呢?因為安全的標準從來就不是一個百分點的數字,它就不是率,成本才是安全唯一衡量的指標。

衡量活體檢測安全標準是用時間成本來衡量的,攻破這個活體,要投入多少的成本在裡面,這個攻擊方法也分成技術性攻擊和非技術性攻擊。舉例一個技術性攻擊:比如有些攝像頭成像的時候,會被相機的三色給吃掉,那麼去調外部圖像顏色的時候,讓圖像變成和你實際成像是一樣的,如果可以完全做到一模一樣的,那麼算法就完全區分不出來。所以這其實是一個不合理的提問的方式。

誤區二、紅外的肯定更安全

為什麼大家覺得說,紅外好像更安全,其實這個道理很簡單,那是因為你的視覺的色彩系統不是紅外的,你會覺得,這是你的視覺色彩系統不能理解的一個東西,所以你會覺得它難。

實際上對於計算機來講,不管是紅外的,還是普遍的彩色成像,對它來講,難度都是一致的,舉個例子,就是說,我們現在拍照拍到的人臉都是我們自己視覺彩色系統當中成像的方式,如果我們拍照全部都是紅外的成像,那紅外的攻擊就會變的容易多得多。

誤區三、3D 的人臉識別是不是一定更準確

如果想要純 3D 的人臉識別能夠達到或者超過 2D 的人臉識別精度的話,那麼 1mm 這個點,是必須要突破的,也就是說,深度的精度必須要超過(或者達到)1mm 才可以有討論的餘地,目前來講,3D 商用產品精度大概都在 2-3mm 左右。所以目前 3D 只是 2D 的一種輔助,它還沒有辦法完全獨立來承擔人臉識別的功能。

誤區四、人臉關鍵點人臉特徵

人臉關鍵點,其實是一個非常物理的模式,就是找到人臉上面的一些小點或者輪廓點,這些點我們把它定義為關鍵點。所謂的人臉的特徵,其實只是在高維空間上的一個向量。所以說,人臉的關鍵點和人臉的特徵其實不等價。

相關焦點

  • 渡鴉raven R 極客公園舞臺首秀,這款「Q 萌」的機器人究竟有何特別?
    極客公園創新大會(IF 2018)進入到了第二天的日程,今天的舞臺上來了二位非常特別的「嘉賓」,它們看起來像是迷你版的工業機械臂,但卻和皮克斯的「小檯燈」一樣靈動。這兩個「嘉賓」名叫 raven R,渡鴉將其定義為「全球首款六軸情感機器人」。在去年年初加入百度後,渡鴉便承擔著將百度可用的技術落地為優秀產品的使命,在此過程中保持足夠的獨立。
  • 華為、騰訊「擦槍走火」、拜拜「Flash」|極客一周
    元旦當天,大家還在跨年的宿醉中尚未清醒的時候,兩家軟體和硬體方面的巨頭,騰訊和華為已經「擦槍走火」。1 日凌晨,華為遊戲社區中心發布公告,表示因為騰訊遊戲單方面作出重大變更,華為方面無法合作,只能將騰訊遊戲下架。幾小時後,騰訊遊戲方面回應,稱「因華為手機遊戲平臺與我們的《手機遊戲推廣項目協議》未能如期續約」,才是導致騰訊遊戲從華為下架的真實原因。
  • 渾水摸「YY」、「俠盜」蘋果和辛巴的「麥乳精」|極客一周
    對於此次做空,渾水給出了詳盡的調研方法,一方面是傳統的財務和帳目審查,另一方面則利用技術收集了超過 1 億筆交易進行分析。被做空一天後,歡聚時代發布聲明指責渾水對直播生態「無知」,做空報告邏輯不清,數據混亂,包含大量錯誤。但不得不說,相對於做空報告翔實的數據,歡聚時代的反駁聲明顯得有點無力了。
  • 螞蟻金服副總裁漆遠:螞蟻金服把最好的技術,種到「土」裡
    在 BMW · 極客公園 Rebuild 2019 科技商業峰會上,螞蟻金服副總裁兼首席數據科學家漆遠講了這樣一個故事,一下子把科技帶到了「土」裡。在中國絕大多數農戶因為沒有信用數據,比如銀行流水、資產證明、抵押物等,很難獲得金融服務,螞蟻金服打破了「現狀」,漆遠說,藉助用科技的力量,螞蟻金服服務全球小微企業主和中型企業,實現普惠。
  • 「猴臉識別」了解一下,這是派來救猴子的救兵
    隨著全面屏手機的潮流到來,不少人已經通過手機體驗過人臉識別技術。其實面部識別除了讓我們生活更加便利,也可以用在動物身上,甚至拯救一些瀕危物種,「獸臉識別」了解一下?研究人員曾將人臉識別技術用在這些靈長類動物上,出現了「過度擬合」的問題,也就是說細節不夠明顯。(狐猴,圖自:YouTube)這是因為動物的毛髮和眼睛顏色等特徵都有較大的差異,因此研究團隊不得不手動標記動物的眼睛和嘴巴協助系統識別。
  • 不想評價「吹牛」的公司,盒子魚 CEO 黎小說認為教育行業做技術...
    黎小說北大的同學教了他一個小時「廢話」和「繪畫」的發音,但還是沒學會,只記得教他的那個男同學特別胖。「F」和「H」分不清,「N」和「L」分不清,平翹舌也分不清,這個剛到北京的重慶人普通話和英語都是「災難」。
  • 一夜爆火,這款換臉 App 可能會把你的臉「賣掉」
    一夜之間,一款叫做「ZAO」的換臉 app 火了。朋友圈的張三李四,突然都擁有了一張「明星臉」,還跟愛豆們在屏幕裡談情說愛。相信很多人對類似的換臉技術並不陌生,從將女明星變成小電影主角的 Deepfake ,到 B 站上朱茵變楊冪的換臉視頻,類似的技術已經多次登上過熱搜。
  • 抖音小關老師帶貨「秘籍」:「人」與「貨」如何高效匹配
    一位業內人士評價,「能燒一手好菜是一回事,讓粉絲向你購買食材又是另一回事,美食垂直領域的競爭實際越來越激烈,但小關老師在這個領域的表現很不錯。」如何持續創作優質的視頻內容,如何在直播帶貨中找準定位,實現人與貨的高效匹配,小關老師的秘籍是什麼?「專業的人做專業的事」從 2019 年 2 月上傳第一條短視頻至今,小關老師已經發布了 909 個作品。
  • 「虛擬聲浪」背後,豪華汽車裡的軟體不豪華
    這種「新聲音」背後展現的「定製化」和品味體現,寶馬的這次合作更像是傳統汽車行業過去追求的「豪華主義」的一種延伸。但反觀特斯拉這家新車企,它們對「聲音」的態度卻很「佛系」。特斯拉也許一直認為這種「安靜」就是優勢。
  • 「你的名字」電影上映,同款濾鏡火爆的背後
    電影上映前一周,「你的名字」濾鏡就刷爆了朋友圈。而這也是繼 Prisma 之後,又一款備受推崇的「人工智慧」濾鏡。與 Prisma 不同的是,「你的名字」濾鏡主打日系動漫風格。雷鋒網聯繫到了這家公司的負責人沈振宇,為大家解密這款濾鏡背後的故事。時光相冊 App 主要為手機內存儲的照片提供雲存儲服務,並可以根據照片的主題,對照片進行智能分類管理以及簡單的編輯處理。沈振宇告訴雷鋒網:「公司創立時主要就是想將人工智慧技術運用在圖片分類處理類 App 中,日活在百萬左右,公司 80% 左右的員工都是工程師,但「你的名字」濾鏡的火爆程度卻是始料未及的。」
  • 「您要找的網頁不存在」,舶來品「404 錯誤」簡史
    編者註:「404 錯誤」是一個網頁錯誤代碼,代表該網頁不存在。這是現在人人都知道的常識,但是關於它的歷史來源,卻充滿著神秘色彩。有人說,以前整個網際網路的伺服器都裝在歐洲某地一個叫做 404 的房間裡,如果你要訪問網絡內容,就得向這個房間提交請求,如果找不到就會提示你「404 not found」。
  • 用技術造星,謝霆鋒聯同數字王國讓這位虛擬偶像「出」了「圈」
    12月26日晚,謝霆鋒線上音樂會抵達 #TMElive超現場#,引發賽博世界的「鋒狂搖滾」。與此同時,虛擬偶像勝男用主持人的身份在這場音樂會上達成了初次亮相。據了解,勝男由謝霆鋒聯同誕生於好萊塢的數字王國打造;依託後者自主研發的虛擬人技術,勝男擁有了實時捕捉、實時渲染和實時驅動特質,是中國首位全實時化虛擬偶像。
  • 他們可能走在了製造「超級人類」的路上
    「潘多拉魔盒」已開回到 1969 年,一隻猴子成為了腦機接口的第一個實驗對象,它標誌著腦機接口技術正式成型了。不久後,美國國防研究局迅速組建了腦機接口技術的研究團隊,國家機器對其的重視程度可見一斑。然而,接下來的 40 年,腦機接口作為一項極其前衛的技術,並沒有走出實驗室。這項技術放到今天來看,依舊十分超前,當時的科學家們艱難地探索著如何將人腦和電腦進行連接。
  • 用臉玩的遊戲,爆紅海外的「表情跳舞機」Facedance Challenge
    日常科學上網且時不時刷 Facebook、Twitter 的朋友最近應該發現了一個苗頭,一個可能馬上又要風靡全球的爆款 App 的苗頭——「Facedance Challenge」。但有個點要注意,最後添加的英文歌,因為無法識別中文,所以很有可能你會浪費掉一個珍貴的音符。(目前的曲庫較少,好在可以自己添加音樂)遊戲中的幾分方法和一些音樂節奏類的遊戲類似,就是根據面部表情的誇張程度來進行評判。只要你的表情轉換幅度大,就有較大機會獲得 perfect 評價,評級一共分為「Perfect」、「Excellent」、「Great」和「OK」。
  • 用臉玩的遊戲,爆紅海外的「表情跳舞機」——Facedance Challenge
    日常科學上網且時不時刷 Facebook、Twitter 的朋友最近應該發現了一個苗頭,一個可能馬上又要風靡全球的爆款 App 的苗頭——「Facedance Challenge」。只要你的表情轉換幅度大,就有較大機會獲得 perfect 評價,評級一共分為「Perfect」、「Excellent」、「Great」和「OK」。
  • ...成功研發 5G 技術;支付寶推鼻紋識別 可給貓狗買保險| 極客早知道
    「安納西斯-2 號」衛星將由美國太空探索技術公司 SpaceX 的「獵鷹 9 號」火箭搭載,今天凌晨 5 點左右(北京時間)從佛羅裡達州發射升空。(來源:科創板日報)印度首富宣布成功研發 5G 技術:獻給莫迪「自力更生的印度」計劃印度也想在 5G 時代「分一杯羹」。據印度報業託拉斯(PTI)報導,印度首富、信實工業集團董事長穆克什·安巴尼(Mukesh Ambani)15 日宣布,集團旗下的 Jio Platforms 已經擁有了自主的 5G 技術,並準備在 2021 年實地部署。
  • 抖音已不能搜索「英雄聯盟」「王者榮耀」;熊貓直播 App 已下架...
    另外,3 月 7 日晚間,熊貓直播 COO 張菊元在工作群「潘達踢威」中發文稱:「熊貓 TV 被迫選擇了這樣的結束,選擇結束並不是對員工與團隊的否定,而是大勢之下,一個無奈而又最理智的選擇。」據張菊元所言,從 17 年 5 月至今,熊貓 TV 在 22 月內沒有一筆資金注入,「管理層在過去兩年至少尋找了 5 個潛在的投資方,但遺憾的是最終沒有解決掉資金的缺口。」
  • 想讓年輕人開得「酸爽」?這款車憑「黑科技」讓人上癮
    答案毫無疑問,是凱酷(K5)帶來了濃厚的「科技誠意」。凱酷(K5)車身上運用的諸多「黑科技」,使其不僅成為同級別中最具科技範的車型,更通過這些技術配置帶來了動力、駕駛以及人機互動方面的全新體驗。在看得見的科技上下功夫是容易被看到的,但在「看不見的地方」提升才是真正的「技術升級」的內核。凱酷(K5)在「看不見的地方」,針對 270T(1.5T) 車型首次應用世界領先的發動機技術——全球獨創第四代 CVVD 發動機技術。這一技術實現了發動機在氣門控制技術領域的新突破,可根據定速行駛、加速行駛等行駛條件,合理控制氣門開啟持續時間,無需在性能和燃油效率之間妥協折衷。
  • 5 秒生成超萌動漫頭像,這個捏臉神器教你刷爆朋友圈
    從靜態臉萌 FaceU 到 Animoji,再到最近刷爆朋友圈的 ZEPETO,似乎每個人都有想把自己萌化的欲望,而美圖秀秀最近上線的 AI 動漫化身,也能讓你輕鬆地擁有萌值爆棚的頭像,今天就讓 A 君帶大家體驗一下。
  • 「大內密談」:一個有「溫度」的電臺是怎樣煉成的
    如果你是個播客聽眾,你肯定不會對「大內密談」這個節目的名字感到陌生。「2013 蘋果年度最佳 Podcast」、每期全渠道總播放量超過百萬、自開播以來就一直獨佔荔枝 FM 「新媒體排行榜」榜首,除了這些獎項和數據上的成績,這個偶然創立、風格隨意的網絡電臺還有著許多溫度感十足的故事。偶然成行的「鏘鏘三人」