面部識別技術背後,有什麼「骯髒的小秘密」?

2020-12-05 雷鋒網

雷鋒網按,面部識別技術成為整個 AI 行業最為常見的技術應用之一;不過,在識別效率越來越高的同時,人們也開始擔心面部識別技術發展過程中的隱私安全問題。比如說最近 IBM 利用 Flickr 下載的圖片來進行面部識別訓練,就引起了人們的質疑;NBC News 針對此事進行了詳細的報導,雷鋒網對這篇報導進行了不改變原意的編譯。

近些年來,面部識別技術得到了長足發展,除了幫你解鎖 iPhone,還能讓執法機關在人山人海中「一眼」就認出犯罪分子,商店甚至用它來識別自己的「死忠」客戶。不過,法律專家卻警告稱,大量未經允許濫用網絡照片最終會畫地為牢,反過來成為監控你的「幫兇」。

現在的面部識別技術還不完美,它工作時靠的是算法,目標則很簡單——認出那張獨一無二的臉。

想把這個任務完成好,技術人員就必須提前「餵給」算法「養料」,即天量的面部照片。那麼這些照片從哪來呢?當然是網際網路。

起初,算法學習的照片都會按照不同的標準進行分類,比如年齡、性別、膚色等,但經過一段時間的學習後,它的能力開始變得有些嚇人了,於是法律和人權專家開始大聲疾呼,他們擔心技術人員對普通人照片的濫用會帶來「反噬」效果。

「這是 AI 訓練數據集背後的骯髒小秘密。技術人員可不管三七二十一,只要能用的照片他們都不放過。」紐約大學法學院教授 Jason Schultz 說道。

最近 IBM 公司也進了「暴風圈」,今年 1 月它們向研究人員分享了自己的數據集,包含了 Flickr 上近 100 萬張照片,雖然 IBM 號稱此舉是為了減少面部識別的偏差。

了解真相後的攝影師們不願意了,因為 IBM 在他們的作品上加了各種細節注釋,包括面部幾何結構、膚色等信息,而這些照片最終可能會成為面部識別算法的「養料」。

「我拍過的人可沒想過,自己的照片居然會被用在面部識別算法訓練上。」公關經理 Greg Peverill-Conti 氣憤地說道,他有 700 多張照片被收錄在了 IBM 的「訓練數據集」中。「IBM 太草率了吧,它們怎麼能不經同意就使用這些照片」。

IBM 公司 AI 研究主管 John Smith 則表示,公司「致力於保護個人隱私」,如果誰想從數據集中移除照片,儘管聯繫 IBM。

雖然 IBM 信誓旦旦的保證 Flickr 用戶可以隨時移除數據集中的照片,但事情哪有那麼簡單,這本就是個有來無回的「不歸路」。因為 IBM 需要拍攝者發送想要移除圖片的連結(光靠 Flickr 帳號不管用),而它們卻從沒分享過到底這個數據集用了誰的 Flickr 照片,所以你大概率會被蒙在鼓裡。

對於這個數據集,IBM 有自己冠冕堂皇的理由——它將用於學術工作,且擔負著讓面部識別變得更加公平的重任。當然,在網絡照片濫用方面,IBM 並不是獨一家,數十家其他研究機構或公司也在採集網絡照片訓練自己的面部識別系統。

一些法律專家認為,這不僅僅是對數百萬人肖像權和隱私權的侵犯,它還加重了人們對面部識別技術的擔憂,也許有一天執法部門會讓它「雙手沾滿鮮血」。

面部識別技術的進化歷程

面部識別工具剛剛誕生時,研究人員會付錢請人來試驗室「幫忙「,這些人拿錢辦事,將自己不同姿態和光照角度下的照片留了下來以供研究之用。不過,這樣的方案成本高還浪費時間,因此早期的數據集往往只有數百個樣本。

進入新世紀後,網際網路飛速發展,研究人員突然意識到,面部識別的好時光來了,因為網上有天量的照片可供使用。

「直接打開搜尋引擎,輸入名人的姓名,然後下載各種 360 度無死角的照片既可。」美國國家標準技術局數據集採集人員 P. Jonathon Phillips 說道。

隨著社交網絡的興盛和自媒體的發展,普通人的照片也突然多了起來。研究人員默認這些照片是對所有人開放的,有時他們甚至會從 YouTube 的視頻中抓取面部圖片。

由於工作的非經營性質,學術人員用起照片來絕對是近水樓臺,因為他們能繞過版權問題了,而 Flickr 的性質更是讓它們成了研究人員絕對的安全之選。

為了保證數據集的多樣性,IBM 其實從 Flickr 上 Down 了超過 1 億張照片,隨後又精選了 100 萬張有注釋的面部照片。為了力求精確,它們甚至為這些照片定了 200 多種分類標準。

谷歌學術指出,這種研究方法在業內幾乎已經是盡人皆知,因為有數百篇學術論文都在靠照片採集來佐證自己的論點,沒人敢說自己是完全清白的,或者拿到了授權或同意。因此,面部識別準確性的提高和分析工具的進步主要就是靠這些「野路子」來的照片。

IBM 真沒拿面部數據集賺錢?

「要想讓面部識別系統超常發揮,訓練數據必須足夠多樣化,而且覆蓋範圍足夠廣。」IBM 的 John Smith 說道。

在 IBM 看來,自己的數據集並未將圖片中的人臉和具體的名字聯繫起來,這就意味著系統不會侵犯人們的隱私。不過,依然有人質疑 IBM 的動機,因為它們可是向政府出售過監控工具。

舉例來說,911 襲擊發生後,IBM 就將面部識別技術賣給了紐約警方,執法部門通過搜索監控錄像就能識別出特殊的膚色或發色。IBM 還曾推出過「智能視頻分析」產品,它們能通過監控攝像頭給人們加標籤(亞裔、黑人或白人)。

如今,IBM 則有了 Waston 視覺識別系統,通過圖片算法就能識別出人的年齡和性別。配合正確的訓練算法,客戶就能從圖片或視頻中識別出特定的人。在被問到 Waston 用了什麼訓練數據時,IBM 稱數據有多個來源,不過卻拒絕披露具體的數據來源,並美其名曰保護智慧財產權。

一再逼問下,IBM 稱從 Flickr 拿到的相片數據集僅用於研究,不會用來提升公司的商用面部識別工具。不過,有專家指出,類似 IBM 和 Facebook 這樣的公司,其研發和商業運營部門之間的界限非常模糊,而且研發部門的智慧財產權均歸 IBM 所有。因此,面部識別公司 Kairos 前 CEO Brian Brackeen 斷言,即使學術部門研發的算法有其非商業化性質,這些算法最終還是會被拿來賺錢。

他還打了個形象的比喻,「你可以把它看做拿面部識別技術洗錢,公司將網上的照片洗成了自己的智慧財產權。」

「被選中」的攝影師們怎麼想?

澳大利亞攝影師 Georg Holzer 將自己的作品上傳 Flickr 是為了記錄自己聲明中的精彩瞬間,他也籤署了創意認證,只要是非營利性項目,就能免費使用他的照片。不過,他沒想到自己的照片會成為面部識別技術的「養料」。

「我了解技術能造成的傷害。」Holzer 說道。「當然,面部識別技術也有其積極的一面,但如果用得不對,它也能剝奪人的基本權利和隱私。我是無法接受這項技術廣泛應用的。」

「我覺得 IBM 可不是家慈善公司,最終它們還是會用這項技術牟利,所以面部識別技術還是會進入商業市場。」Holzer 說道。

Dolan Halbrook 也有 452 張照片被 IBM 的數據集「侵吞」,他也認為 IBM 在使用這些照片時應該徵得自己的同意。

當然,也有攝影師覺得自己的照片能被 IBM 選中並用在推動面部識別發展上是一大幸事。

瑞士的 Guillaume Boppe 就表示:「如果我的照片能幫助 AI 進化,降低探測錯誤率並最終提升全球安全指數,我舉雙手贊同。」

想從數據集中刪圖?沒那麼容易

如果你不同意 IBM 將自己的照片當成訓練數據,也可以聯繫它們刪除,但操作起來沒那麼容易。一位被抓取 1000 多張照片的攝影師忙活了半天,也只刪除了 4 張照片,因為他無法找到所有照片的連結,而 Flickr 帳號 IBM 可不認。

此外,即使從 IBM 的數據集中刪除了照片,IBM 研究夥伴拿到的數據集也無法一併刪除(已經有 250 多家組織和機構接入了 IBM 的數據集)。

顯然,IBM 的數據集不是公共場所,沒法想來就來想走就走。

好在,各國對隱私數據的保護正在加強。舉例來說,歐洲就將照片看做「敏感個人數據」,如果 IBM 不按規定刪圖,可能就會被歐盟重罰。在美國,也有一些州有了相關規定,在不徵得當事人同意的情況下採集、存儲和分享生物信息屬違法行為,而生物信息包含指紋、虹膜和面部幾何結構等。

近期,芝加哥的律師 Jay Edelson 就向 Facebook 發起了集體訴訟,稱其面部識別工具觸犯了相關法律。

至於典型的法院判例,現在還是一片空白。

via NBC News,雷鋒網(公眾號:雷鋒網)編譯

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 因未經授權,洛杉磯警察局禁止面部識別技術
    洛杉磯警察局(Los Angeles Police Department)已經禁止使用面部識別技術,因為據稱警員未經授權使用面部識別技術。 今年6月,底特律警察局長詹姆斯·克雷格(James Craig)表示,面部識別有大約96%的機率會認錯人。 克雷格發表此番言論的幾天前,美國公民自由聯盟(ACLU)就底特律警方因面部識別錯誤而錯誤逮捕黑人男性羅伯特•威廉士一事向底特律警方提出了投訴。
  • 英特爾發布自家的面部識別技術RealSense ID
    英特爾正式發布了RealSense ID,這是一種基於RealSense深度感應技術的面部識別解決方案,在過去幾年,英特爾的RealSense技術多數被用來展示解鎖電腦,如今將以此為基礎,用於識別人臉,與蘋果公司的 Face ID 同樣,用來當個人的身分證。
  • 在線寵物商店使用面部識別技術讓狗自己購物
    現在說的最多的是人臉識別,幾乎很少用於動物,更別說動物面部識別在線購物,但是大千世間,無奇不有,下面就讓我們來看看吧:巴西寵物連鎖店Petz將人臉識別技術和人工智慧相結合,創造了一個突破性的平臺,讓狗可以通過分析他們的面部表情來購買自己喜歡的產品。
  • AI面部識別技術破解動物行為研究難題
    圖1 基於關注機制的深度神經網絡模型框架圖2 Tri-AI動物個體識別系統對動物面部進行檢測近半個世紀以來,藉助動物本身特徵(如斑紋、顏色、傷疤等)或人為標記特徵(如烙印、刺青、染色、環志、無線電項圈及遺傳標記等)等進行個體識別,極大地豐富了人類對動物及其行為的認識。比如,人們突破了個體識別技術後,才揭開野生金絲猴社會的神秘面紗。
  • 寵物面部識別:識別準確率達99%,快速破解寵物身份「密鑰」
    相比晶片/電子標籤(RFID)、虹膜等識別方式,寵物識別具有友好性高、操作體驗好、識別精度高、接入門檻低等優點,可廣泛應用於寵物保險、寵物管理、寵物用品、寵物娛樂等場景。悅保科技AI寵物面部識別,可識別靜態或動態貓狗臉圖像,通過深度學習分析模型提取面部關鍵點特徵作為寵物數字身份標籤
  • 美波特蘭市禁警察使用面部識別違規罰款
    當地時間周三美國緬因州波特蘭市投票通過一項禁止警察和市政機構使用面部識別技術的法令,五年內不會撤銷。新的禁止面部識別法令還增加了具體的懲罰措施。如果波特蘭市警察或市政機構違反法令,將會受到至少1000美元罰款的處罰。市政僱員違反這一法令或將面臨被解僱或暫停工作。但私營部門在當地使用面部識別技術不受影響。繼波士頓、舊金山、俄勒岡州之後,波特蘭是最新一個禁止使用面部識別技術的城市。
  • 加碼「狗臉識別」背後,曠視的AI商業化焦慮
    而通常提到的面部識別技術,一般專指人臉識別技術。就在近日,曠視科技公布了「狗臉識別」的技術專利,把面部識別技術的應用擴展到寵物領域。在人臉識別技術日漸成熟的情況下,「狗臉識別」技術研發起來自然也是得心應手。而曠視科技研發的狗臉識別技術,則是為了增加AI識別技術在更多場景的應用。一直以來,AI領域發展勢頭迅猛,但應用場景有待開發、商業化滯後的現狀一直沒有得到改善。
  • 一掃便知:動物也能面部識別了
    近日,京都大學與牛津大學團隊合作,開發出能識別猩猩面部的AI,迄今為止已有十餘種動物能被識別。研究小組以西非幾內亞的野生黑猩猩視頻錄像為研究對象,利用英國牛津大學研發的一種名為「CNN」的面部識別深度學習技術,對幾內亞森林中23隻野生黑猩猩個體共約1000萬張面部圖像進行解析。
  • 這個面部識別APP準確率極高 社交信息一應俱全
    【環球網科技綜合報導】據英國《每日郵報》近日報導,英國公司Blippar最新研發的面部識別APP能夠有效識別人臉,並提供包括個人照片和社交網站地址等信息。該項技術能夠識別超過40萬的公眾人物,準確度達到99%,連雙胞胎也逃不過它的法眼。
  • 寵物「面部+鼻紋」身份識別科技搶先看
    、線下操作等不足那麼,有沒有更友好的識別技術呢?悅保科技首次在展會展示自主研發的「寵物面部+鼻紋識別」同步認證框架,通過自研FaNl-pet深度學習框架和MSA算法,「面部+鼻紋」雙重體徵認證,能更精準地分析寵物品種和個體身份屬性,在1:1和1:N的識別場景下,均能達到98%以上的超高精確度。
  • 動物也玩面部識別?不止是寵物貓狗能「刷臉」,大象和鯨魚也可以
    這項技術作為一個整體在很大程度上受到了不準確和系統偏差的影響。無論誰使用這項技術,出於什麼目的,這些算法都使用了從一個因種族和性別傾向而受阻的社會中提取的原始數據,而種族和性別傾向最終會產生類似的有偏見的結果。從本質上講,壞數據意味著有偏差的結果。顯然,對人類的監視伴隨著一系列道德和道德難題。但是如何識別動物呢?
  • 人臉識別技術升級 戴著口罩也能刷臉打卡
    但新冠肺炎疫情下,在建築工地、學校機關等需要鑑別入場人員身份信息的場所,人員在佩戴口罩、安全帽後,實現人臉快速識別並同步檢測體溫,成為一項全新的技術成果。戴口罩進行人臉識別的技術難點在哪裡?現有成果如何提供「一手抓防疫、一手抓生產」的解決方案?未來該技術還有怎樣的應用空間?3月6日,記者採訪了相關科研人員。全員口罩 身份識別面臨新挑戰「滴,體溫數據正常!」
  • 人工智慧成功從野生黑猩猩群體視頻中識別出個體面部特徵
    人工智慧成功從野生黑猩猩群體視頻中識別出個體面部特徵 日本京都大學一個研究小組最近利用人工智慧技術,成功從野生黑猩猩群體的視頻中識別出個體面部特徵。
  • 美國出境旅客必須進行生物認證 主要機場100%面部識別
    (來源:美聯社)CBP表示,經過多年的測試,生物面部識別是最安全、有效和經濟的方式,同時也能夠保護所有旅客的隱私。迄今為止,已經有超過5500萬來美遊客進行生物識別比對。自2018年9月以來,該系統識別出了300多名持假證件試圖非法進入美國的人。
  • 悅保"寵物面部+鼻紋識別」為寵物行業提供智能引擎
    深圳市悅保科技有限公司(以下簡稱「悅保科技」)作為寵物AI技術的代表企業,受邀參與展會並展示了其獨創的「寵物面部+鼻紋識別」身份認證技術,成為本屆展會備受歡迎的亮點。不同於傳統的晶片識別,寵物「面部+鼻紋」識別只需通過手機、平板等智能設備拍攝寵物面部或鼻紋
  • 用數學方法識別獼猴面部特徵
    臉盲症患者的生活有諸多不便,是的,哪怕是研究猴子也不行。想看更多解讀視頻?請關注優酷(ID:youku)回復「菠蘿」獲得。在動物行為學的研究中,研究人員需要面對個體識別方面的問題——你必須要知道誰是誰,才能知道這些個體的某些行為有什麼意義。
  • 美媒:新面部識別APP,能認出每一隻熊貓
    來源:環球網美國《華盛頓郵報》5月20日文章,原題為「中國有一種新的面部識別APP ——這次是大熊貓」。分不清「貝貝」和「寶寶」?不用擔心,已經為人類提供了完善面部識別技術的中國科技人才,如今又研發出一款能識別出每隻「白臉黑眼圈熊」的APP。
  • 革命性面部識別:逆天
    人工智慧的出現,讓語言識別、圖像識別和自然語言處理及專家系統等得到快速發展。在2017年《麻省理工技術評論》評出的「十大突破性技術」中,刷臉支付成為其中之一。眾多網際網路科技公司都在研究該項技術,比如阿里巴巴、曠視Face++、百度和科大訊飛等。
  • 目前換臉技術識別人臉的模型是不能更換的
    能否採用ai技術實現真人換臉呢?真人臉動漫人物換臉怎麼做呢?百度前端團隊總結了一些實現ai換臉的工作方法,總結如下。不考慮代碼實現,只考慮從人臉辨識到換臉的全流程。以眼睛為準,將所有參數同步到ai模型。
  • 新面部識別APP幫你識別大熊貓
    一款面部識別應用程式能讓你輕鬆分辨。成都大熊貓繁育研究基地在公布這款「大熊貓面部識別」應用時發布微博稱,「再也不用擔心喊錯名字惹熊貓生氣了。」前往該基地參觀的遊客只要使用該應用程式掃描熊貓面部,就能獲知每隻熊貓的信息。這裡是中國最著名的旅遊景點之一。