人臉識別算法終於超過了人類本身 - OSCHINA - 中文開源技術交流社區

2021-01-08 開源中國

計算機科學家已經開發出一種新的人臉識別算法,在識別人臉的能力上比人類本身更加強大。

我們每個人都有過認不出某個自己曾經認識的人的經歷,在不同的姿勢、光照和表情下,這其實是一件比較困難的事情。計算機識別系統同樣存在這些問題。事實上,儘管全世界的計算機科學家努力了這麼多年,還是沒有任何一種計算機識別系統在識別人臉方面能夠像人類一樣強大。

但這並非是說人臉識別系統不夠準確。恰恰相反,最好的人臉識別系統在理想情況下比人類識別的表現要好的多。但是一旦環境情況變糟,系統的表現就差強人意了。而計算機科學家們當然是非常想要開發出一種算法,在各種情況下都能夠表現優異。

現在,中國香港大學的湯曉鷗教授和他的學生路超超(對不起,譯者沒有找到這名學生的名字,只能音譯了)宣布他們攻克了這個難題。他們開發了一種叫「高斯」的人臉識別算法首次超過了人類自身。

新的識別系統對於各種平臺都能夠提供人類級別的識別能力,從手機到電腦遊戲中的人臉識別,從安全系統到密碼控制等等。

任何一個人臉自動識別程序,首先要考慮的就是去構建一個合適的數據集來測試算法。那需要一個非常大範圍的,各種各樣的,帶著各種複雜動作、光線和表情的,不同臉的圖像,各種人種、年齡和性別都要考慮在內。然後還要考察服裝、髮型以及化妝等其他因素的影響。

比較幸運的是,已經有這麼一個擁有各種不同人臉的標準資料庫——Labelled Faces。它擁有超過13,000張不同人臉的圖片,它們是從網絡上收集的6000個不同的公眾人物。更重要的是,每個人都擁有不止一張人臉圖片。

當然也存在其他的人臉資料庫,但是Labelled faces目前是計算機科學家們所公認的最具參考價值的測試數據集。

面部識別的任務是去比較兩張不同的圖片,然後判斷他們是否是同一個人。(你可以試試看,能否看出這裡展示的每對圖片是否是同一個人。)

人類在這個資料庫上的表現可以達到97.53%的準確度。但是沒有任何一個計算機算法能夠達到這個成績。

直到這個新算法的出現。新的算法依照5點圖片特徵,把每張臉圖規格化成一個150*120的像素圖,這些特徵分別是:兩隻眼睛、鼻子和嘴角的位置。

然後,算法把每張圖片劃分成重疊的25*25像素的區域,並用一個數學向量來描述每一個區域的基本特徵。做完了這些,就可以比較兩張圖片的相似度了。

但是首先需要知道的是到底要比較什麼。這個時候就需要用到訓練數據集了。一般的方法是使用一個獨立的數據集來訓練算法,然後用同一個數據集中的圖片來測試算法。

但是當算法面對訓練集中完全不同的兩張圖片的時候,經常都會識別失敗。「當圖片的分布發生改變的時候,這種訓練方法就一點都不好了。」超超和曉鷗說到。

相反,他們用四個擁有不同圖片的,完全不同的數據集來測試「高斯」算法。舉個例子,其中一個數據集是著名的Multi-PIE資料庫,它包含了 337個不同的物體,從15種不同的角度,在19種不同的光照情況下,分別拍攝4組圖片。另一個資料庫叫做Life Photes包含400個不同的人物,每個人物擁有10張圖片。

用這些資料庫訓練了算法後,他們最終讓新算法在Labelled Faces資料庫上進行測試。目標是去識別出所有匹配和不匹配的圖片對。

請記住人類在這個資料庫上的表現是97.53%的精確度。「我們的「高斯」算法能夠達到98.52%的精確度,這也是識別算法第一次擊敗人類。」超超和曉鷗說到。

這是一個令人印象深刻的結果,因為數據中的照片包含各種各樣不同的情況。

超超和曉鷗指出,仍然有很多挑戰在等著他們。現實情況中,人們可以利用各種附加的線索來識別,比如脖子和肩膀的位置。「超過人類的表現也許只是一個象徵性的成就罷了」他們說。

另一個問題是花費在訓練新算法上的時間,還有算法需要的內存大小以及識別兩幅圖所需要的時間。這可以用並行計算和特製處理器等技術來加快算法的運行時間。

總之,精確的人臉自動識別算法已經到來了,而且鑑於現在的事實,這只會更快。

原文連結: Medium   翻譯: 伯樂在線 - 菜鳥浮出水
譯文連結: http://blog.jobbole.com/66705/

相關焦點

  • Delta Lake 進入 Linux 基金會 - OSCHINA - 中文開源技術交流社區
    自 2017 年 10 月推出以來,Delta Lake 已被 4 000 多家組織採用,每月處理超過 2 exabyte(十億字節)數據。「將 Delta Lake 引入 Linux 基金會的中立組織之下,將有助於依賴該項目的開源社區開發解決存儲和處理大數據(本地和雲端)的技術」,Linux 基金會戰略計劃副總裁 Michael Dolan 表示。
  • 重磅|中科視拓開源SeetaFace2人臉識別算法
    今天,來自中科院計算所的人工智慧國家隊中科視拓宣布,開源商用級SeetaFace2人臉識別算法。SeetaFace2採用商業友好的BSD協議,這是在2016年9月開源SeetaFace1.0人臉識別引擎之後,中科視拓在人臉識別領域的又一次自我革命。
  • 什麼是 SeetaFace 開源人臉識別引擎
    為實現此目的,一種可能的技術手段是通過對人臉的光學成像來感知人、識別人,即所謂的人臉識別技術。經過幾十年的研發積累,特別是近年來深度學習技術的湧現,人臉識別取得了長足的進步,在安防、金融、教育、社保等領域得到了越來越多的應用,成為計算機視覺領域最為成功的分支領域之一。然而,人臉識別並非完全成熟的技術,離公眾期望的全面應用尚有距離,還需要學術界、工業界的共同努力。
  • 開源社區的「忌諱」話題 - OSCHINA - 中文開源技術交流社區
    加拿大資深開源技術記者Bruce Byfield較早前發表了一篇名為「開源社區從來不想承認的九大事實」(9 Things That Are Never Admitted About Open
  • SeetaFace開源人臉識別引擎介紹
    為實現此目的,一種可能的技術手段是通過對人臉的光學成像來感知人、識別人,即所謂的人臉識別技術。經過幾十年的研發積累,特別是近年來深度學習技術的湧現,人臉識別取得了長足的進步,在安防、金融、教育、社保等領域得到了越來越多的應用,成為計算機視覺領域最為成功的分支領域之一。然而,人臉識別並非完全成熟的技術,離公眾期望的全面應用尚有距離,還需要學術界、工業界的共同努力。
  • 算法是內功,程式設計師別冷落算法! - OSCHINA - 中文開源技術交流社區
    許多學生看到一些公司在招聘時要求的程式語言五花八門就產生了一種誤解,認為學計算機就是學各種程式語言,或者認為,學習最新的語言、技術、標準就是最好的鋪路方法。其實大家都被這些公司誤導了。程式語言雖然該學,但是學習計算機算法和理論更重要,因為計算機算法和理論更重要,因為計算機語言和開發平臺日新月異,但萬變不離其宗的是那些算法和理論,例如數據結構、算法、編譯原理、計算機體系結構、關係型資料庫原理等等。
  • Git 2.4.3 發布 - OSCHINA - 中文開源技術交流社區
    Git是一個開源的分布式版本控制系統,用以有效、高速的處理從很小到非常大的項目版本管理。開源中國 Git 代碼託管平臺:http://git.oschina.net/Windows下的Git請看這裡:http://www.oschina.net/p/msysgitGit 是 Linus Torvalds 為了幫助管理 Linux 內核開發而開發的一個開放源碼的版本控制軟體
  • 開源春天,此時不來,更待何時? - OSCHINA - 中文開源技術交流社區
    簡單地講,其實這背後都是利益問題,以這些開源項目社區的話來講,他們都不想讓一些雲廠商「坐收漁翁之利」,然而實際上,這些被指責的雲廠商真的都違反了開源協議內容嗎?這可真不好說。在這些社區宣布項目修改開源協議之後,遭到了各種反對聲音。
  • AI大廠算法測試心得:人臉識別關鍵指標有哪些?
    由調查機構發布的《中國AI產業地圖研究》中也有一組有趣的數據,目前中國的AI企業中,有近8成集中在應用層,其中AI行業解決方案佔比高達40.7%,從上下班的人臉識別考勤,到金融App的人臉身份核驗,再到醫院和政務大廳的人臉識別取號,以及車站的人臉核驗檢票……  目前市面上既有OpenCV等開源算法庫,很多晶片廠商的產品也自帶簡單算法,同時專業算法大廠也會開放相關技術,
  • 開源軟體蓄勢待發 - OSCHINA - 中文開源技術交流社區
    相關內容11家值得關注的開源技術公司優異的技術特性和相對低廉的價格的結合使得開源產品廠商比以往有了更多進入企業網絡的路徑。Likewise公司執行長 Barry Crist 稱:「在網絡泡沫時期,由於Linux比SPARC上的Solaris更為便宜,開源產品逐漸由Unix轉移到了Linux。
  • Hutool 2.16.0 發布,Java 工具集 - OSCHINA - 中文開源技術交流社區
    ClassUtil中對應方法引用此類方法ClassUil增加getConstructor方法,可匹配繼承參數優化ClassPath路徑轉為絕對路徑Direction增加方法從字符串轉換(大小寫不敏感)添加DigestUtil方法,用於md* sha1等摘要算法
  • 60% 的企業代碼庫包含開源漏洞 - OSCHINA - 中文開源技術交流社區
    對當今的企業來說,開源軟體、庫和組件往往起著重要的作用。開原始碼採用率高有許多原因,其中包括開源社區的許多程式設計師願意為項目貢獻時間、項目代碼的透明性、以及比開發內部系統更少的實現時間等。在黑鴨審查的所有代碼庫中,有 96% 包含了開源組件,而大多數沒有開原始碼的代碼庫其實包含不到 1000 個文件。在超過 1000 個文件的代碼庫中,開原始碼的採用率高達 99%。
  • 人臉識別哪家強?科大訊飛發布最新人臉識別技術
    ,一直是公認的模式識別難題,在過去幾十年間,世界頂尖科研機構一直在為人臉識別而努力,但是沒有任何一個計算機算法能夠超越肉眼在LFW上的識別率97.52% ,直到香港中文大學湯曉鷗教授團隊開發出了一個基於高斯過程的人臉識別技術—GaussianFace,「高斯臉的識別率為98.52%,這是機器首超人類」 ,「幾個月前我們的DeepID人臉識別技術在LFW上獲得了99.15%的識別率,又超極限;2014
  • Gitbook,這個開源出書平臺了不起 - OSCHINA - 中文開源技術交流社區
    GitHub充分利用了網際網路的能力,讓開發者可以方便地參與不同的項目,不要說查閱別人的代碼,修改別人的項目,是一種更高層次的交流、對話。就好像《如何閱讀一本書》裡提到的「主動閱讀」,是通過不斷了解作者核心觀念,並提出自己觀點進行碰撞的方式,讓讀者成為一名偉大的讀者。相比紙質書中作者與讀者的對話,GitHub 將兩段代碼撰寫者的溝通顯性化,不再是偷偷在旁邊的注釋裡加入自己的觀點。
  • 納德拉時代下的微軟開源之路 - OSCHINA - 中文開源技術交流社區
    Office 365日前微軟開源技術團隊正式宣布,微軟旗下的Offcie 365服務將會被集成到開源教育平臺Open edx中。微軟官方對此表示:「無論是當地小學的四年級小學生,還是一位40歲每夜堅持攻讀MBA的求學者,亦或者是準備參與升職培訓的公司職員,現在都有機會享受到Open edx帶來的學習管理系統(LMS)和大規模在線課堂(MOOC)。」
  • zmail 6.1版本更新 - OSCHINA - 中文開源技術交流社區
    Zmail的官方主頁:www.z-email.orgZmail的官方論壇:bbs.z-email.orgZmail的QQ群: 257959126系統要求redhat 6.x centos 6.x 64位最小安裝Zmail安裝說明:概述:(1)該安裝包為一鍵安裝包,方便快捷部署;(2)Zmail是開源郵件技術社區的最新的郵件伺服器軟體包
  • Netflix 的開源文化與技術 - OSCHINA - 中文開源技術交流社區
    在之前的新聞《Netflix企業文化與架構設計》一文中我們介紹了Netflix高擴展的企業文化與架構,而作為一家在線影片租賃提供商Netflix之所以能夠在如此大量的用戶、海量的數據、複雜的拓撲結構下取得成功,離不開其背後的開源文化與技術
  • 開放源碼是開源軟體嗎? - OSCHINA - 中文開源技術交流社區
    許可協議必須技術中立(License Must Be Technology-Neutral):意即許可協議不得限制為電子格式才有效,若是紙本的許可協議也應視為有效。所以,與此類似的,在中文裡,我們可以認為:「開放原始碼」是一個動詞+一個名詞。而「開源」則是一個特定的詞彙。作為動詞,我們說將某某軟體開源,是一種行為。作為形容詞,我們稱某某軟體是一個開源(的)軟體,不僅僅是指我們能夠獲取到他的原始碼。
  • 基於深度學習的人臉識別技術全解
    香港中文大學的 Sun Yi 等人提出將卷積神經網絡應用到人臉識別上,採用 20 萬訓練數據,在 LFW 上第一次得到超過人類水平的識別精度,這是人臉識別發展歷史上的一座裡程碑。自此之後,研究者們不斷改進網絡結構,同時擴大訓練樣本規模,將 LFW 上的識別精度推到 99.5%以上。人臉識別發展過程中一些經典的方法及其在 LFW 上的精度,都有一個基本的趨勢:訓練數據規模越來越大,識別精度越來越高。
  • SugarCRM:開源與商業的完美結合 - OSCHINA - 中文開源技術交流社區
    他認為,在中國市場以商業為後盾的開源模式將會成為CRM軟體發展的一個趨勢。 2009年4月22日,SugarCRM在上海舉辦了精英聯合峰會,並同時宣布中國區總經理的上任。我們可以看出這是一個信號,是關於SugarCRM商業開源策略正式在中國實施的前奏。