「關注」人臉識別技術細節科普:從「流浪地球」的MOSS說起

2020-12-06 中國科學技術館

你一定還記得《流浪地球》中，

以冷靜理智賺足了觀眾眼球的人工智慧MOSS吧？

MOSS的一句「劉培強中校，請回到休眠倉休眠」開啟了整部影片人與人工智慧對抗的緊張氣氛。

雖然MOSS看起來很強大，擁有自主意識，但其實，MOSS這個強人工智慧也是首先基於人臉識別技術來進行決策的。

OSS在電影中的鏡頭

（圖片來源於網絡）

那人臉識別技術現在只出現在科幻當中嗎？當然不是。

歌神張學友的演唱會上，警方利用人臉識別技術抓逃犯共計55人。

歌神：「我為人臉識別技術代言，為自己鼓掌。」

唱會人臉識別安檢系統

（圖片來源於網絡）

這不禁激起了小編對人臉識別技術的崇拜，也讓小編不禁產生了想要了解人臉識別的好奇心。

於是，小編特意採訪了人工智慧方面的有關專家，寫下這篇科普文。

故事還要從人的大腦是如何進行人臉識別開始說起……

人的視覺系統工作原理

在了解人臉識別技術之前，首先我們需要知道人腦是如何進行人臉識別的。

眼睛的視網膜上密密麻麻的排列著大量視覺細胞，從瞳孔進來的光線被投射到這些細胞上，引起它們的興奮，這就是感受野（receptive filed）。感受野興奮值越大，表明感受到的光越亮。單個細胞的感知範圍是很小的，也就是說，它只能看到一丁點大的地方。但是所有細胞集合起來，就能感知到很大的範圍。下圖是人眼剖面圖:

人眼剖面圖

(圖片翻譯自Simple Anatomy of the Retina，2019 Webvision)

那麼視覺細胞產生的神經興奮是如何被傳到大腦中進行處理的呢？

拓展閱讀：視覺神經科學（Visual Neuroscience）對於視覺機理的研究驗證了動物大腦的視覺皮層具有分層結構。目前也已經證明，視覺皮層具有層次結構。從視網膜傳來的信號首先到達初級視覺皮層（primary visual cortex），即V1皮層。V1皮層簡單神經元對一些細節、特定方向的圖像信號敏感。V1皮層處理之後，將信號傳導到V2皮層。V2皮層將邊緣和輪廓信息表示成簡單形狀，然後由V4皮層中的神經元進行處理，它對顏色信息敏感。複雜物體最終在IT皮層（inferior temporal cortex）被表示出來。

神經網絡示意簡圖

（圖片翻譯自Principles of Neural Science）

通過上述拓展閱讀和圖片，我們可以發現大腦也是層級森嚴的。以行政體系來類比，一個「縣長」神經元負責從一批視覺細胞收集信號，然後若干個「縣長」神經元把自己的輸入進行總結，匯報給上級的「市長」神經元，再匯報給「省長」神經元。從「縣長」到「省長」，他們拿到的關於光的信息有著越來越大的範圍，一個「省長」神經元能看到更大的區域，因此可以做一些簡單抽象概念的判斷，比如是否發現了圓、線條等。信息就這麼逐級匯報到最終的高級皮層區域，裡面的神經元可以判斷眼睛是否看到了人臉，而這個人臉又有著什麼特徵。

人臉識別的工作原理

（一）在AI的眼中，表情包長什麼樣？

AI的眼睛其實是攝像頭。電子圖片是按照一個像素一個像素來存儲的。比如下面的圖片，大致是一個32x32的解析度。每一個小方格，都對應著3個數字，分別表示RGB（紅綠藍）三個顏色通道的亮度，數值範圍通常在0-255之間。當然如果是黑白圖片，就不需要三個顏色通道，而只用一個通道了。AI在做人臉識別的時候，第一眼看到的其實就是如下圖所示的「數字矩陣」。所以，在AI的眼中，表情包就是一串數字。

AI識別的表情包的數字矩陣

（圖片來源於網絡）

（二）AI怎麼模擬人類的神經元？

人類的神經元大體上長這樣：

人類神經元（樹突與軸突）

（圖片來源於維基百科）

神經元有兩個關鍵部位：

l 樹突（左邊）：很多很多短的小樹杈，用於接收信號。

l 軸突（右邊）：一根長長的樹杈，用於輸出信號。

通常，「市長」的樹突連著很多「縣長」的軸突，從它們那收集信號。而自己的軸突，連著自己匯報的「省長」的樹突，把處理過的信號傳遞上去。

整個過程從機理上看並不複雜，用一個簡單的數學模型就可以模擬，這個數學模型叫MP神經元，長的如下圖。

MP神經元數學模型

（圖片來源於學術論文，Warren McCulloch和Walter Pitts，1943）

我們試著解釋一下：左邊的每個「縣長」神經元報上來一個數字，乘以它對應的權重，加起來得到一個總數。當然，「市長」神經元要對這個總數進行某種處理，再匯報給「省長」。不過在一些學者的建模裡也允許把這個總數直接匯報給上級。所以，AI是用數學模型MP神經元來模擬人類神經元的。下表是生物神經元和MP神經元的對照。

生物神經元和MP神經元對照表

（三）人工神經元有什麼用？

有了一個模擬出來的人工神經元，會有什麼用呢？當然是複製很多很多份，然後按照一定的層次結構連起來，變成一個人工神經網絡。當我們連上幾千萬的神經元之後，就已經可以模擬人腦了。看下面的這個圖，只要神經元有特定的連接方式，就可以很好的模擬視覺皮層的人臉識別功能（小編偷偷告訴你：實際上，人工智慧領域每年發表的數以萬計的paper大部分是在提出新的連接結構，並絞盡腦汁用實驗證明自己的結構有用。）

人工神經網絡與人腦神經網絡的比對

（圖片翻譯自學術論文，Yamins D L K , Dicarlo J J .2016）

（四）人工神經網絡長得和機器人一樣嗎？

想知道一個簡單的神經網絡長什麼樣嗎？下圖就給大家展示一個。在這張圖中，每一個小圓圈是一個人工神經元，一層一層連起來。最後一層有輸出，也是一些數字。我們根據這些數字就可以判斷是不是人臉了（比如，輸出大於0，就認為檢測到了人臉）。如果想知道具體是誰的臉，就要更多的輸出神經元和一些特定的檢索技術，這裡就不展開了。

人工神經網絡

（圖片來源於學術論文，Shaker A, Ali A H, Hamed M, et al.2015）

其實上述就是當前被人們熟知和熱炒的人工智慧真正的長相。人工智慧並不是一個機器人，而是一種人工神經元連接方式，再用大量的計算機做數學計算，就能完成一個智能任務（人臉識別）。

其實小編和大家一樣，想通過了解這些技術細節來判斷現在有和MOSS一樣厲害的人工智慧出現嗎？其實MOSS基本可以判定為強人工智慧的範疇，現在的人工智慧還都只是弱人工智慧階段。強人工智慧涉及到哲學、生理學、機械學等多學科的開放問題，至今還沒有令人滿意的實質進展。所以看到這，你可以長長的舒口氣了。

此時小編突然想起MOSS在電影中的最後一句話：「讓人類永遠保持理智，確實是一種奢求」。

顫抖吧，人類……

參考文獻：

[1] Kandel, Eric R., James H. Schwartz, and Thomas M. Jessell. "25." Principles of Neural Science. 5th ed. New York: McGraw-Hill, Health Professions Division, 2013. 556-76. Print.

[2] Kandel, Eric R., James H. Schwartz, and Thomas M. Jessell. "27." Principles of Neural Science. 5th ed. New York: McGraw-Hill, Health Professions Division, 2013. 602-20. Print.

[3] Kolb H. Simple Anatomy of the Retina. 2005 May 1 [Updated 2012 Jan 31]. In: Kolb H, Fernandez E, Nelson R, editors. Webvision: The Organization of the Retina and Visual System [Internet]. Salt Lake City (UT): University of Utah Health Sciences Center; 1995

[4] 拓展閱讀來源於知乎文章：《卷積神經網絡為什麼能稱霸計算機視覺領域？》

[5] Shaker A, Ali A H, Hamed M, et al. ASSESSMENT OF ARTIFICIAL NEURAL NETWORK FOR BATHYMETRY ESTIMATION USING HIGH RESOLUTION SATELLITE IMAGERY IN SHALLOW LAKES: CASE STUDY EL BURULLUS LAKE[J]. 2015.

中國科學技術館展覽教育中心辛尤隆供稿

相關焦點

流浪地球深度解析:為什麼要帶著地球去流浪?

流浪地球作為一部硬科幻小說，在今年春節檔被拍成電影上映可謂是口碑與票房雙豐收，但在電影的背後，不知道有多少注意到了這些細節：流浪地球為什麼要帶著地球去流浪，而不是建造飛船逃跑？我們在看流浪地球時最大的疑惑便是，既然能造出像行星發動機這樣巨大推力的裝置，連地球都能推動，為什麼不把他建造成飛船，這樣不就會像現在帶著地球一樣多災多難了。
人臉識別技術介紹和表情識別最新研究

作者：夏初來源：公眾號|計算機視覺工坊（系投稿）一、人臉識別技術介紹人臉識別作為一種生物特徵識別技術，具有非侵擾性、非接觸性、友好性和便捷性等優點。2D人臉指的是RGB，灰度和紅外圖像，是確定視角下表徵顏色或紋理的圖像，不包括深度信息。2.5D是在某一視角下拍攝獲取的人臉深度數據，但是曲面信息不連續，沒有被遮擋部分的深度數據信息。3D人臉由多張不同角度的深度圖像合成，具有完整連續的曲面信息，包含深度信息。2D圖像人臉識別的研究時間較長，軟硬體技術較為完備，得到了廣泛的應用。
一個照片「隱身衣」,讓微軟曠視人臉識別系統100%失靈|開源

這就是來自芝加哥大學的最新研究：給照片加上一點肉眼看不出來的修改，就能讓你的臉成功「隱形」。如此一來，即使你在網絡上的照片被非法抓取，用這些數據訓練出來的人臉模型，也無法真正成功識別你的臉。用 x 指代原始圖片，xT為另一種類型/其他人臉照片，φ 則為人臉識別模型的特徵提取器。
「技術綜述」如何降低遮擋對人臉識別的影響

作者 | 劉東平、謝遠倫、言有三編輯 | 言有三人臉識別技術都是基於人臉關鍵特徵提取對比完成識別的，其中，特徵的完整性是算法成敗的一個極為關鍵的因素，但是當受到外界幹擾較多，外界的條件發生明顯變化的時候，由於傳統方法過於依賴明顯的、完整的圖像特徵，一旦由於人臉發生遮擋，造成部分特徵的消失，導致人臉圖像特徵不完整時，這種算法就會失效，導致無法和庫中人臉信息進行對比
「流浪地球2」概念海報發布:2023年大年初一見!

2019年大年初一，「流浪地球」正式上映。除了過硬的特效加持及細緻的世界觀構築，『國產科幻電影之光』帶來了強烈的民族自豪感和中國式情感共鳴，最終讓「流浪地球」斬獲超過46億元的票房。作為真正意義上的國產科幻大片，用『裡程碑』去評價「流浪地球」顯然不太恰當，因為它不是『裡程』而是『起點』，給中國『科幻大片』立了個標杆。
想要看看「流浪地球」的目的地?試試 NASA 出品的太空旅行工具

事實上，半人馬座 α 可能是在科幻作品中登場最多的系外星球：阿西莫夫在上世紀創作的小說《Homo Sol》以及《基地》系列中均提及遷徙到半人馬座 α 的人類文明；《阿凡達》故事的發生地潘多拉星則是半人馬座 α 星 A 恆星系裡的一顆衛星；而最近大熱的《流浪地球》設定中，地球流浪的目的地正是半人馬座 α 三合星之一的比鄰星。
人臉識別技術廣泛應用，是推進社會治安管理還是加速信息洩露？

現如今人臉識別技術大範圍應用，智能門鎖、手機開鎖、釘釘打卡等全都離不開面部識別，在技術的迭代升級中，指紋解鎖逐漸被無接觸式的人臉識別取代。在某種意義上，是現代化進程的加速邁進。在《中國新聞周刊》的報導（《人臉識別十字路口：臉的恐慌》），有專家稱，「中國人每天要暴露在各種攝像頭下超過500次。
vivo 發布 TOF 3D 超感應技術:更安全的「刷臉支付」來了

就在剛過不久的 6 月 12 日，vivo 正式發布了「未來」旗艦 ——vivo NEX，並公布了「零界全面屏」和「第三代屏幕指紋識別」等幾項新技術，成功吸引到了不少人的眼球。有效深度信息量比結構光高 10 倍相比去年在 MWCS 上發布的「屏幕指紋識別」，今年 vivo 則是將重心放在了智慧型手機的另一個風口——人臉識別技術上。
NASA 發現超級地球,距離 31 光年,人類要開始「流浪地球」計劃了?|嘮氪兒

說起移居其它星球大家最熟悉的可能是年初爆火的電影《流浪地球》當時也引起網友的廣泛討論而近日，NASA 發現了一顆名為「GJ 357d」的行星位於人類宜居區且這顆星球與其他行星一起繞恆星運行不過，目前還沒有證據表明這顆系外行星上存在生命那麼「GJ 357d」究竟適不適宜人類居住呢？
人臉識別時代來臨有多危險?央視爆用2元就買到臉造假

相信大家對Face ID不會陌生，內地更是將這個技術運用得淋漓盡致，購物用「刷臉」支付、用手機用「刷臉」解鎖，進住宅小區用「刷臉」開門，越來越多範疇都會運用到人臉識別技術，但隨之而來的是訊息安全風險。中央電視臺就揭發了市面上只需要用2元人民幣就可以買到過千張人臉照片，不法之徒可以利用這些照片，通過「照片活化」軟體生成動態影片，欺騙人臉核驗機，從而犯案！央視引述一份報告分析，目前中國人臉識別市場規模約佔全球市場的15%左右。
vivo又展示了另外一個領先行業的「武器」——TOF 3D超感應技術

在不到六個月的時間裡，vivo 先後展示並量產了包括屏幕指紋、升降式攝像頭、屏幕發聲、SIP 封裝音頻模塊等多個堪稱「黑科技」的技術。 6 月 27 日，在上海舉辦的 MWCS 上，vivo 又展示了另外一個領先行業的「武器」——TOF 3D 超感應技術。什麼是 TOF 3D 超感應技術？
人臉識別真的安全嗎？關於人臉識別技術發展的瞻望

在當今社會，人臉識別的數據安全已經成為大家關注的主旋律。該技術的發展主要是依靠深度學習、三維人臉識別、超低解析度人臉三個方面，」蘇教授介紹道。，研製出低解析度人臉圖像的重建與人臉識別的綜合技術，實現基於低解析度人臉圖像的重建與人臉識別的視頻目標人的搜索與跟蹤。
從流浪地球說起:國產科幻電影成功與否有多重要?

的話題，在導演郭帆看來，《流浪地球》體現出的是「中國農耕文化的烙印和對土地的眷戀」，是中國人的故土情結與對家園的眷戀根植於千年的農耕文明歷史，從而讓這種科幻敘事理念有了獨特之處，這種文化和精神內核讓「中國式科幻」有了一種確鑿的可行性。拍攝科幻電影難在哪？
神經網絡技術解析:手寫數字識別項目解讀

其實，早在 1989 年，LeCun 就已經發表了「將反向傳播用於手寫郵政編碼識別」的相關研究，而且已經在美國的郵政系統中成功應用。隨後，這一系統的應用範圍擴展至銀行支票。這一數據集包含數萬個樣本，被稱為「計算機視覺領域的 hello world 數據集」、「機器學習界的果蠅」，如今已經作為基準被使用了二十餘年。
難住庫克的 Face ID 到底與 Android 的人臉識別有什麼不同?

從 S8 發布到 iPhone X 面世，「人臉識別」從一個可有可無的嘗鮮功能逐漸地成熟並為大眾所熟知。很少有人知道，Android 早在 4.0 開始就已經在系統的解鎖方法裡面添加了人臉識別解鎖，在那個手機還沒有指紋識別的年代，能用上它的人，大多是抱著玩玩的心態。
「技術綜述」基於3DMM的三維人臉重建技術總結

基於圖像的人臉三維重建在人臉分析與娛樂領域裡有巨大的應用場景，同時它也可以用於提升人臉關鍵點檢測，人臉識別，人臉編輯等很多任務。本文重點介紹其中基於3DMM模型的核心技術及其研究進展。作者&編輯 | 言有三1.
iPhoneX的人臉識別夠安全嗎?真的是最安全的生物識別嗎

在iPhone X 取消指紋辨識，推出人臉識別之後，很多人第一時間就對其安全性做出質疑：「會不會有人拿著我的iPhone 對我掃一下，就直接把手機解鎖了？」網路上更傳出許多搞笑的情境，像是女友趁你睡著時，拿著iPhone 晃過去就直接解鎖。
人臉識別技術理論

人臉識別，是基於人的臉部特徵信息進行身份識別的一種生物識別技術。用攝像機或攝像頭採集含有人臉的圖像或視頻流，並自動在圖像中檢測和跟蹤人臉，進而對檢測到的人臉進行臉部識別的一系列相關技術，通常也叫做人像識別、面部識別。
基於深度學習的人臉識別技術全解

該技術是人工智慧技術的重要組成部分，也是當今計算機科學研究的前沿領域。經過近年的不斷發展，已逐步形成一套以數位訊號處理技術。計算機圖形圖像、資訊理論和語義學相互結合的綜合性技術，並具有較強的邊緣性和學科交叉性。其中，人臉檢測與識別當前圖像處理、模式識別和計算機視覺內的一個熱門研究課題，也是目前生物特徵識別中最受人們關注的一個分支。
《流浪地球》分析,moss為啥要突然說這樣一句話,這有什麼深意呢

《流浪地球》的檔期延長並沒有實際上為這部電影添加多少票房，不過，能夠上映這麼久也正是說明這部電影的熱度不減。目前，這部電影以接近50億票房的「身價」躋身到全國票房第二。票房確實是一個重要的參考指數。就像著名相聲演員郭德綱老師評價相聲一樣，觀眾賣座那就是成功。

「關注」人臉識別技術細節科普:從「流浪地球」的MOSS說起

相關焦點

流浪地球深度解析:為什麼要帶著地球去流浪?

人臉識別技術介紹和表情識別最新研究

一個照片「隱身衣」,讓微軟曠視人臉識別系統100%失靈|開源

「技術綜述」如何降低遮擋對人臉識別的影響

「流浪地球2」概念海報發布:2023年大年初一見!

想要看看「流浪地球」的目的地?試試 NASA 出品的太空旅行工具

人臉識別技術廣泛應用，是推進社會治安管理還是加速信息洩露？

vivo 發布 TOF 3D 超感應技術:更安全的「刷臉支付」來了

NASA 發現超級地球,距離 31 光年,人類要開始「流浪地球」計劃了?|嘮氪兒

人臉識別時代來臨有多危險?央視爆用2元就買到臉造假

vivo又展示了另外一個領先行業的「武器」——TOF 3D超感應技術

人臉識別真的安全嗎？關於人臉識別技術發展的瞻望

從流浪地球說起:國產科幻電影成功與否有多重要?

神經網絡技術解析:手寫數字識別項目解讀

難住庫克的 Face ID 到底與 Android 的人臉識別有什麼不同?

「技術綜述」基於3DMM的三維人臉重建技術總結

iPhoneX的人臉識別夠安全嗎?真的是最安全的生物識別嗎

人臉識別技術理論

基於深度學習的人臉識別技術全解

《流浪地球》分析,moss為啥要突然說這樣一句話,這有什麼深意呢