作者:劉秋娜
「你是什麼垃圾?」這樣的靈魂拷問,或許將被人工智慧技術終結。
今年8月,一款名為「火星男孩」的智能廚餘垃圾分類機出現在長沙市嶽麓區望城坡街道長華社區。居民掃描人臉後,可將垃圾放到拍照處識別,若垃圾識別成功,垃圾桶開啟,完成垃圾分類。
不僅是垃圾分類,隨著以人臉識別為代表的生物識別技術迅速普及,行業投融資日益活躍,各種「刷臉」應用不斷湧現:火車站刷臉檢票進站、高考考生刷臉進考場、城市救助管理刷臉尋人……
但如火如荼的發展盛景背後,生物特徵數據的安全風險也隨之凸顯,亂象漸增。
一方面是虛火漸旺。CB Insights「2019 年全球AI企業100強榜單」中,排在前11位的5家中國公司成立年限僅3~8年,多為5年內催熟而成,在基礎研究領域普遍缺乏深度和定力。
另一方面,數據裸奔導致隱私洩露現象漸重。阿里首席風險官邵曉峰測算,我國相關黑產從業人員超150萬,市場規模達千億元級別,但卻難有法律跟進——網絡安全法尚缺落地細則;行業、企業標準較多但缺乏強制效力,致使監管缺少抓手,執法層面困惑。
如此背景下,不少行業人士呼籲,構建與之相適應的市場環境和監管機制,迫在眉睫。
攻防持久戰
當下,生物識別技術逐步向深度學習進化,協助各行業各領域從業人員將經驗數位化,節省人力,提高效率。
例如,生物識別技術的應用場景已逐漸從最初的員工考勤、小區門禁等延伸至智慧醫療、智能家居等諸多領域。維護社會治安、識別侵入人員、保證財產安全、人證核驗、監控安防、線上支付等方向的技術應用,已經大範圍落地。
然而,技術升級必然伴隨著攻擊手段的升級,攻與防、正與邪始終處在持久戰之中,「反人臉識別技術」「反生物識別產業」等黑科技、黑產業也隨之漸火。
例如,矽谷Bellus3D公司研製出Face Camera相機,能從各個角度捕捉人臉輪廓,然後3D列印出一張逼真的人臉面具;美國卡耐基梅隆大學開發的CMU眼鏡可幹擾計算機視覺,混淆佩戴者的性別、年齡等絕大部分面部特徵;線上換臉工具Deepfake能把上百張人物樣圖輸入一個算法中完成「換臉」,生成普通人無法辨識的假視頻。
因此,防禦機制也必須持續升級。
「光流分析、3D結構光、飛時測距(TOF)等技術日益成熟,使用微紋理、多光譜、運動信息等可有效抵禦2D及3D假體攻擊。此外,虹膜識別、靜脈識別、步態識別等其他的生物識別技術也取得積極進展。」中國人民銀行科技司司長李偉介紹。
此外,為應對近來全國多地出現的基於「反人臉識別技術」的資金盜刷案件,金融機構開始疊加「聲紋+語音」技術系統來識別欺詐行為。
「刷臉之後,還可讓消費者面對屏幕讀出隨機出現的幾個數字。」清華大學信息技術研究院語音語言技術中心主任鄭方介紹,「一是每人的聲音各異,二是通過這種活體檢測可識別其轉帳行為的真偽。」
這一安全防護技術也可用於多個社會化服務領域。遠鑑科技投資總監王秋明以自己公司的應用舉例說,要進入遠鑑科技有限公司的辦公區,就需要「人臉+聲紋+語音」的驗證方式,每位員工在刷臉之後還須讀出屏幕上隨機產生的八位數字,才能算考勤打卡成功。
「通過手機端的APP就實現了打卡,APP只有在進入辦公區範圍內才能夠啟用,這樣的考勤方式既便捷又安全。」王秋明說。
數據在「裸奔」
「生物識別技術在大步快進,難免會重速度不重安全,這或許會造成一些不可逆轉的風險。」信聯智慧創始人楊楠認為。
這已經成為全球性難題——在世界經濟論壇2018年和2019年的《全球風險報告》中,排名三四位的是網絡攻擊、數據詐騙及數據洩露風險。全球範圍內,數據及網絡安全已連續兩年成為除自然因素以外的最嚴重風險。
而生物特徵數據的洩露危害尤甚。
李偉表示,生物特徵數據具有唯一性,通常不隨個人主觀意願而變化,因此難以針對不同業務、不同渠道、不同場景進行安全隔離。生物特徵一旦被非法竊取利用,基於此特徵的身份認證系統均可被輕易繞過,導致大規模隱私洩露,或致系統性風險。
「由於採集難度、硬體需求等不同,各種生物識別技術的防攻擊性差別各異。虹膜、指靜脈等生物特徵相對安全,人臉、指紋則完全暴露於外,過度採集、過度存儲的現象非常普遍。」楊楠表示。
如今,人臉識別技術被廣泛用於高鐵、飛機、紅綠燈監控等公共場所,識別和採集範圍最遠可至10公裡。不法分子可通過遠程、非接觸方式,在本人毫無察覺之下「無聲無息」地批量採集生物特徵數據,手段極具隱蔽性。
一些開展相關採集業務的第三方技術商以及各類手機APP運營商,也常在用戶不授權、未授權情況下偷採、存儲數據,造成洩露風險。
比如Facebook就在2018年因「未經照片主體同意的情況下,定期對照片進行掃描和生物特徵匹配」而遭到起訴;今年2月,深圳深網視界公司發生大規模用戶信息洩露事件,超過250萬用戶的身份證號碼、人臉圖像及拍攝地點等信息外洩。
面對這一系列問題,當前的治理手段卻相對有限。
數據行業專家隋欣池分析,首先,大多數企業維護資料庫安全的意識薄弱,且這一安防能力需要長期的技術積累,企業水平參差不齊。其次,企業大多將算法而非數據當作自己的核心資產,倒賣數據的行為很普遍,防不勝防。
虛火漸旺時
「不僅是一些企業發展『重量難重質』,更有大批跟風現象和資本簇擁,已致使一些領域陷入惡性競爭,造成劣幣驅逐良幣。」鄭方說。
他以售賣一款基於人臉識別技術的身份核驗系統舉例,去年有少數技術公司給銀行出價8萬元,已經算是虧本了,今年更是有公司提出為銀行免費服務,「大家都是先搶市場再說」。
這種情況自2018年產業規模開始井噴就已經出現。
CVSource報告顯示,2018年上半年AI創業公司融資事件驟增至130次,總額402億元,超過了2017年全年。而2013年,進行融資的AI創業公司數量還只有21家。
此景象頗為眼熟——與2015年網貸行業「大爆發」如出一轍。當年,紅杉、IDG、老虎等投資人先後進駐111家網貸平臺,共發生總額為188億元的121次融資事件,海爾、鏈家、恆大、綠地等產業巨頭,也紛紛以併購和設立子公司的方式迅速佔位。
如今,當年大手筆「催熟」網貸的資本方紛紛轉戰AI,掀起另一股熱潮。胡潤數據顯示,截至2018年年底,紅杉資本共捕獲了49家AI企業,在投資企業數量上高居榜首,IDG、老虎等機構也相當活躍,恆大、聯想、海爾等公司也大筆砸錢。
但沸沸揚揚之下,中國的AI產業實力卻並不能與之匹配,無論是AI公司的成長質量、數量還是研發能力,均與發達國家存有一定差距。
鄭方分析,中國AI創業公司與西方國家一些優秀企業的差距主要在於:中國機構重在應用層面投入,對晶片、硬體、算法等基礎技術有所忽略。相比之下,歐美一些企業的投資更加全面和立體,不僅重視商業應用,還有大批實力雄厚的企業投身於基礎研發,並高度重視智慧財產權保護。
「一些企業急於求成,並無核心技術,只是利用開源軟體對各路數據進行簡單訓練,形成一些不成熟的解決方案,卻最終因為『會講故事』而獲得資本青睞造成市場估值畸高,擠兌了一些『良幣』的生存空間。」鄭方為此憂慮。
多位受訪人士警示,網貸行業早前就是在經歷了亂象叢生、監管整頓、破產爆雷之後大幅縮水,至2019年一季度已不足200家平臺仍能良性運營。「新技術、新產業應以此為戒。」
立法防走偏
在不少受訪專家看來,數字經濟時代,新技術、新產業正深刻改變經濟發展方式和軌跡,亟待對此建立多維度、立體式的管理體系,防止數字經濟業態「走偏」。
當前我國並無生物識別領域的專項法,對其規範更多依託於個人隱私保護的相關法律法規,但目前我國直接涉及個人數據保護的相關法律法規相對分散,在執行上也羈絆頗多。
對此,有專家認為可適當借鑑歐美經驗。
去年3月,比利時出臺法規禁止私人使用人臉識別等基於生物特徵的視頻分析攝像機,全面整頓視頻監控市場;
去年5月,歐盟實施《通用數據保護條例》(GDPR),將生物識別數據納入監管,任何收集、傳輸、保留或處理涉及到歐盟所有成員國內個人信息的機構均受該條例約束;
今年2月,俄羅斯央行以去年出臺的第4859-U號條例為參考頒布了新規,降低個人生物識別數據收集和處理過程中的風險。
簡單的「拿來主義」在中國顯然行不通。「我們可以選擇GDPR中適合國情的部分予以借鑑。比如從業機構處理和使用數據需要徵得用戶同意」,鄭方認為,GDPR規定「控制者需證明數據主體已經同意對其個人數據進行處理,且數據主體應當有權隨時撤回其同意。」因此,用戶有權要求網際網路服務商停止信息採集,也有權選擇不被營銷廣告打擾。
同時,儘快完善國民生物特徵資料庫也是良策之一。
鄭方認為,首先應建立覆蓋全國的人口資料庫,並適時升級為居民身份核驗庫,逐步建立管理平臺、申請領證(申領)平臺、認證平臺和追溯平臺,構建起「一庫四平臺」的頂層架構。由國家有關部門統一管理,杜絕數據洩露。
「國家級的居民身份核驗庫建立之後,有需求的機構可以在相關部門的管理和督導下,與核驗庫的運營機構建立合作關係,研發和輸出經由脫敏、加工、過濾後的產品,將一切納入監管之中。」楊楠說。
曠視科技副總裁謝憶楠認為,在這一過程中,要深化政企合作,加強行業組織、科研機構等作用,推動頭部企業成為相關資料庫及其使用標準的積極響應者、貫徹者。
李偉認為,要處理好安全與創新的關係,既不能盲目冒進,神化生物識別技術的作用;也不能裹足不前,漠視其優勢。要加強技術研究,深入分析不同技術在效率、安全性上的優劣,尤其要重視技術中性對公眾隱私、國家安全的影響,趨利避害。在風險可控的前提下選取較為成熟、安全性高的技術穩妥應用。