雷鋒網(公眾號:雷鋒網)按:上一期公開課提到了指紋的傳感方法,傳感器把真實的指紋採集為圖像,算法來識別指紋的一致性,而萬能指紋是目前還沒有開始研究的一種攻擊方法。
在雷鋒網的上一期硬創公開課中,邁瑞微電子創始人李揚淵為大家分享了《指紋傳感器原理和假指紋攻防技術》的內容,其中,就提到了在系統層面,假指紋攻擊有三個等級,這三個等級對指紋識別的技術需求都不一樣:
rank1,已知指紋實體複製的假指紋;
rank2,根據指紋特徵還原出的假指紋;
rank3,不基於具體指紋特徵製作的「萬能指紋」。
所以,如果聽過上一期課程,你應該已經有所了解,黑客要攻擊一部手機和設備,除了複製一個和你一模一樣的指紋之外,他們會不會通過竊取指紋數據逆推出你的指紋來,甚至直接製作「萬能鑰匙」一樣的「萬能指紋」來破解你的設備?
面對這樣的安全隱患,我們需要認清以下幾個問題,才好做到未雨綢繆:指紋識別的原理是什麼?指紋識別的攻擊方式有哪些?萬能指紋真的存在嗎?雷鋒網再次邀請到了李揚淵,為大家繼續解答上述問題。
嘉賓介紹李揚淵,蘇州邁瑞微電子創始人;指紋識別領域唯一貫通算法、傳感器、IC設計的從業者;密碼晶片領域最早的開發者之一;基於李揚淵所發明的「C-Q-T」電路,僅成立3周年的蘇州邁瑞微電子已成為中國大陸電容式指紋傳感器出貨量第二名的供應商。
模式識別指紋識別是模式識別的一種,模式識別是給一種物體每個個體一些描述,這些描述的總和就是特徵空間,特徵空間的維度越豐富,辨別個體就越容易。例如:男,中等個頭,瘦小,面容猥瑣,但是僅憑這些信息我們很難定位到某一個人。如果在上例增加一些特徵,如下巴有一顆痣,左眼角有傷疤,就能對個體描述的更加準確。
在特徵空間建立的時候,對個體抽象成一個特徵序列的描述的時候,會有一定的不確定性,例如有的人會認為他長得很醜,但也有的人則認為帥。為了把特徵空間的描述特性變成有意義的分類和辨別,就需要算法來實現了。
模式分類是把特徵空間劃分為若干區域,從而實現對個體的分類;
落戶打分可以看作一種最為簡單的分類,把多個特徵維度合併到一個維度;
更為普遍的大於2種類別的分類,並不會首先形成一個連續的分值序列。
指紋不是典型的模式識別為什麼這麼說呢?主要有兩個原因:
1.特徵空間不明確
如果存在準確的坐標系,那麼指紋特徵就可以用特徵空間來描述:
•細節點,無論端點還是叉點,其特徵主要是幾何位置;
•方向場、頻率場等特徵都基於坐標系;
但不幸的是,指紋匹配的目的是找到坐標變換:
•指紋匹配分數的定義是,窮盡任意坐標變換下,兩個指紋實現最大程度匹配的坐標變換下的匹配分數即為指紋的匹配分數;
•指紋相對於手指的位置通常不予採集,是導致這個屬性的原因。
2.模式分類不明確
從1823年起,就有關於指紋分類學的論述,上圖顯示的是珀金傑描述的9類指紋。因為指紋的基本環形有很大的差異,所以我們沒法為指紋定做一個比較靠譜的坐標系,如果世界只存在一種指紋,那麼指紋識別就會變得很簡單。
自動指紋識別技術的目標是:
辨別某指紋是否是特定的已註冊的指紋;
辨別某指紋是否是已註冊的多個指紋中的一個,以及是哪一個。
所以,經典的指紋分類學對指紋識別技術沒有什麼助力。
從數學本質上,將指紋識別看作似然性匹配更為貼切。很多人都學過滑動窗相關法,這是最基本的似然性匹配,它只考慮兩個維度的幾何平移。但是指紋識別要考慮更多的因素:
•旋轉,皮膚的蠕變(非剛性形變);
•皮膚的變化,例如脫皮、起皺;
•傳感器帶來的噪聲和信號衰落。
因此,這些因素導致指紋識別成為充滿挑戰的領域:
•不能直接從經典大領域獲得知識支持;
•涉及面廣,又缺乏理論,偏偏應用呼聲極高;
•作為信息源頭的指紋傳感器,其設計方法的開放性,使整個指紋識別領域的研發工作具備更大的開放性。
其它生物識別技術就目前而言,除指紋識別之外,生物識別還有面部識別和虹膜識別兩種,但是後兩者的特點是有明確的幾何坐標系:
•五官有明確的結構關係,虹膜也有明確的結構和方向;
•人臉和虹膜都可以用特徵空間來表述,虹膜甚至有經典的編碼;
•採用高清攝像頭,在傳感器自身的穩定性上更好。
而指紋識別區別於這兩種生物識別的最大因素就是它們不是一個類別,所以指紋識別的研究人員也很少有共同點。
指紋識別是信息安全技術嗎?在周一的公開課上,我們提到了活體指紋識別被破解的案例,但這種想法並不合理,安全一定是系統級的,並以攻擊成本為價值衡量。
以單一技術單一環節實現安全,是以無知迎合無知,好比安裝金庫級的大門,卻開著窗;
攻防相長,持續進步,落後的技術價值為零,所以安全領域不能炒冷飯;
層層設卡環環嵌套是基本做法;不同技術的防禦面不同,結合起來看結果。
各種安全技術的可靠性和攻擊成本必須得到量化:
從系統整合和系統攻擊成本量化估計兩方面都有此要求;
決不能等被攻破後才得知某技術的破解成本。
目前的指紋識別並沒有發展成為一個安全技術,一直以來是個模式識別的研究,當它推向市場得到普及應用之後才真正具備了向安全技術的演進,也就是產業化在先,研究在後的階段。
指紋識別的安全性指紋識別自身還沒有量化安全性評估,還不能作為安全技術,未來能不能發展成安全技術,就是現在產業界的責任。
FAR / FRR 測試依賴於數據集,而數據集由採集獲得:
•所以指紋識別系統的FAR只是隨機碰撞概率,不是防攻擊能力;
•這就好比聲稱6位數字密碼的安全性等於10^6一樣,非常業餘;
•模式識別指標定義,不能作為信息安全定義。
再來看看指紋識別潛在的攻擊方法,在上一期公開課中,我們提到和指紋識別技術有關的攻擊方法有三種:
•rank1,根據真實指紋製作假指紋,攻擊點是欺騙傳感器;
•rank2,根據指紋數據製作假指紋,攻擊點是資料庫;
•rank3,無須指紋數據先驗製作假指紋,攻擊點是指紋識別算法。
如果真實指紋和指紋數據都得到保護,則傳感器和算法構成兩重防禦。
其它生物識別的安全性特徵空間明確對安全屬性是雙刃劍,一方面安全性容易量化,另一方面攻擊方法容易研究。rank3大眾臉攻擊是面部識別的主要困境;而rank1從照片提取虹膜並製作美瞳是虹膜識別的主要困境。
當一種方法被普遍接受成為了要承擔安全責任時候,如果有價值被攻擊,那麼一定有人研究,有人研究就有人實施,這也是為什麼一定要提出「萬能指紋」攻擊方法的研究,並且評價最低成本的攻擊方法成本是多少,進而評價指紋識別的安全性。
小面積圖像帶來的挑戰傳統指紋識別的研究思路自動指紋識別技術由美國FBI主導於20世紀70年代建立,這個時代背景是指紋採集技術手段落後,圖像質量差;而且運算平臺落後,算法研究也落後。
唯一能保證的就是圖像比較大,但是圖像大特徵不準確,採集儘量大的指紋圖像,獲取遠超過必要的信息量,所以要對不可靠的特徵集合進行「模糊識別」。
小面積圖像的產業前提實現一定程度準確性的識別所需要的信息量是一定的。但是指紋傳感器面積減小,信息總量也相應的減小了,所以要提高信息準確性,那麼信息利用率也需要提高。
與此同時,傳感器所面臨的挑戰是要保證更高的圖像質量和保真度;而對算法來說需要儘可能全面的利用指紋圖像蘊含的信息。
特殊手指問題更嚴重指紋傳感器面積小,圖像質量再不給力,問題就大了。
舉個例子,有傳言稱國內某超聲波指紋手機在冬天導致近20%人群無法使用,這實際上是特定指紋所導致的:
•亞洲人皮膚油脂最少,冬天氣候乾燥皮膚尤其幹;
•亞洲女性是全世界人種中指紋最難搞的,又淺又細;
•再加上東亞人手洗衣服的生活習慣造就了數以億計的指紋殺手。
除此之外,還有很多指紋對指紋識別不友好,如幹皮膚對稜鏡光學也是噩夢,家裡有光學指紋鎖都可以感受;另外,最近炒的很火的蘋果授權的新專利技術在東亞市場也難以適應,因為細指紋對近光源陰影成像就是噩夢;表皮薄的妹紙更是噩夢中的噩夢。
傳統的算法不能用據統計,過去有8萬人在研究指紋識別算法,但目前全球只有5個公司實現算法的大規模應用,而傳統指紋識別算法和現在的小面積圖像指紋識別算法有著很大的差異。
傳統大面積圖像指紋識別算法:
•特徵提取馬馬虎虎,反正原始數據就不可靠;
•特徵匹配精細調整;
小面積圖像指紋識別算法:
•原始數據必須可靠;
•特徵提取精雕細琢,一點也不能放過;
•特徵匹配要求精確,哪裡還有模糊識別?
•對模板融合擴展(自學習功能)的要求大大提高。
萬能指紋攻擊的猜想萬能指紋是否存在是從業者必須面對的事情。
第一種情形是針對算法缺陷,存在構建萬能指紋的可能性:舉個例子,2010年深圳客戶報告過,其技術總工用拇指能夠開啟使用註冊了別人指紋的杭州某公司算法晶片的指紋鎖。
這是傳統算法的缺陷造成的,它的思路是部分特徵匹配即過,如果特徵有無差別大,往往認為是圖像問題或提取問題導致的異常,予以忽略。這哥們的指紋比較皮爛,特徵提取算法差的話容易提取出非常多的假特徵,正好和很爛的特徵提取算法配合的匹配算法往往更容易忽略不匹配的特徵的影響而只關注匹配特徵。
第二種情形是特徵空間遍歷。如上圖,我們用無線網覆蓋的案例來解釋什麼叫特徵空間遍歷,類似鎖匠嘗試許多把鑰匙來開鎖。紅點代表一個路由,每個路由覆蓋一定的區域,這些區域會有連接重疊,我們把假指紋比喻成路由。
生物識別算法的判決規則允許一定程度的失真。如果特徵空間很明確,算法自身的容錯度導致比較大特徵空間區域都可以判定通過,把這個區域定義為通過區域;製作一組假指紋,其通過區域能夠覆蓋特徵空間,則必存在一枚假指紋可以通過。
萬能指紋的研究價值只有實施攻擊並評估其複雜度和成本,才能量化安全技術。指紋識別要從模式識別技術走向安全技術,必須進行進一步的研究,從攻擊角度可以評價各種算法特性是否構成安全缺陷,第二個要評價指紋識別的特徵空間。儘管指紋識別特徵空間的不明確,但我們也需要要用等價的方法來做覆蓋性的研究。
主動攻擊相當於降低了判決閾值,所以除判決閾值處的FAR,當判決閾值進一步降低時FAR的提升曲線也很重要。
萬能指紋的研究價值就是一個指紋識別系統從安全評價角度到底有多大的能耐。
萬能指紋的測試有了評價標準之後,我們需要建立相應的測試方法體系和工業標準。從測試成本考慮,不能使用物質的假指紋,而是軟體合成的假指紋圖像,具體來說有以下幾個方向:
研究點1,軟體合成器如何能體現具體指紋傳感器的噪聲特性?
研究點2,如何設計假指紋特徵分布來針對性的測試算法?
研究點3,如何調整合成策略來產生不同等級的測試庫?
研究點4,不同測試庫的測試結果如何統一為安全性量化評估?
精彩問答Q:匯頂的IFSTM 技術見龍不見尾,目前有投產嗎?另外,這個技術量產的關鍵難點是什麼?
A:IFS不是指紋傳感器的類型,而是手機工業設計的一種方向。按匯頂的意思,把電容指紋傳感器放在玻璃下面。因為匯頂做觸屏,這樣一結合,一張玻璃兩個產品,就沒別人什麼事了。但對手機設計而言,這樣並不好。
所以IFS不是技術概念,而是插手了手機設計,但並沒有被主流手機接受。
Q:鑑於指紋本身的差異性以及指紋識別技術的多樣性,行業是不是應該要形成一個規範?
A:規範是有必要的。尤其是我這樣的研究背景很強的參與者。畢竟江湖功夫咱不到家,按技術規律規範著來,比較有競爭優勢。規範的形成,是一個長期的拉鋸戰,各方博弈的後果,最後誰大呢?傳統看法是誰份額大誰就有事實標準。
但有時也未必,因為涉及安全,安全是非常理性的規範性,否則就要遭遇大賠償。跟金融業比起來,指紋識別技術供應商都算不得什麼控制力,金融業是規範的需求方,不具備制定規範的技術能力。所以這事有得搞。
Q:之前業界也在呼籲幾種生物識別技術融合的方案,原則上安全性應該會有所提高,現在業界有沒有相關的案例?以及技術難點在哪?
A:這就和結合光學與電容搞得活體一樣,一高一低的結合不提高安全性。不過人行有個文件,安全等級是數技術手段個數的。從風控的角度,如果場景比較安全,那麼認證手段就會少。此時選擇最方便的一個讓消費者舒服。如果場景本身不靠譜,認證手段多上幾個,對提高攻擊成本總有點價值,所以如果生物識別手段上多個,會有主有次,有高頻有低頻。而不會相互牴觸。
如果非要說難點,只有兩個非技術的:第一,安全量化沒做到,金融業定不了標準。如果多模給100萬額度,單模給1000額度,立刻都多模;另外是成本,但節流問題沒有開源重要。
本期公開課視頻如下:
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。