專訪極驗張振宇:揭秘滑動拼圖驗證碼背後的故事

2020-12-12 雷鋒網

對傳統驗證碼而言,便捷和安全長期以來一直是魚與熊掌的關係。

這可從 12306 與黃牛多年的鬥爭史中看出。

最先開始,買火車票只需要輸入簡單數字或數字加字母即可,後來有了加減法算式,以宅宅的數學水平勉強可以應付。

直到出現一閃一閃的動態碼和變形字母,第一次體會到眼睛都快看瞎了,還是輸不對的抓狂情況↓↓↓

但這些與後來推出的圖片驗證碼相比,還只是小兒科,一大波網友用自己的 PS 技能大開腦洞,以此吐槽12306 反人類的驗證碼設計↓↓↓

▲網友戲稱不懂娛樂圈、不看動作片的人,沒資格買票回家

越複雜的驗證碼越能保障安全?

12306 拼命把驗證碼弄複雜的原因,目的就是識別出背後同你一起搶票的機器。

作為區分計算機和人類的一種程序算法,驗證碼可有效對抗機器的大批量自動化訪問,這也催生了從事識別驗證碼的各路黑產。

有關驗證碼的黑色產業鏈,雷鋒網此前曾做過相關報導一秒分辨出楊臣剛、王大治和孫楠,這個黑產居然用AI 來"打碼",其中提到的「撞庫」便是黑產慣用的伎倆。

在網絡黑產中,不法分子竊取網站資料庫後,需要確認帳號對應的密碼是否正確,將有價值的數據通過驗證的方式篩選出來,這一過程叫「曬密」,即撞庫。

那這與驗證碼有何關係?

「曬密」最核心的障礙就是網際網路公司設置的驗證碼安全體系。每天面對數以億計的「曬密」需求,黑產分子不可能人工逐個識別,而是需要提高「曬密」效率,批量識別。

如果闖過了驗證碼這關,黑產就可以使用海量的帳號密碼去「薅羊毛」、進行垃圾註冊、搶票等。

在巨大的利益面前,「打碼平臺」這一專業服務便應運而生,下圖就是機器識別數字字母驗證碼的過程。

為了提高黑客的攻擊成本,我們的驗證碼變得越來越複雜,便捷和安全在很長時間中,只能二選一。

但是,近年來隨著人工智慧在圖像識別領域的飛速發展,當機器 PK 肉眼時,還真不一定誰佔上風。

在雷鋒網對「快啊答題」的報導中就提到:

其打碼平臺基於主流 AI 深度學習 Caffe 框架,使用 vgg16 卷積核神經網絡模型,可以直接輸入原始圖像(避免了對圖像的複雜前期預處理),並能通過深度的機器學習來獲得較高的驗證碼識別率。

當機器可以理解圖像的含義時,傳統的驗證碼就不再安全了。

揭秘行為式驗證碼背後的故事

那有沒有一種方法可以同時兼顧安全和用戶體驗?

一家名為極驗的公司,正嘗試通過深度學習,構建生物行為特徵模型來解決上述問題。

創始人張振宇曾用電影中的一個例子來講他們正在做的事情:

在阿湯哥主演的《碟中諜5》中,有個劇情是他們要進入安全機構拿檔案,最開始有指紋識別,後來是人臉識別,但是最終極的安全措施是通過你的步伐來識別進行認證,這就是行為式驗證。

張振宇所提到的驗證方式之一,就是我們所見到的滑動模塊驗證,過程有些像拼圖。

其實這種滑動模塊驗證很多人早已體驗過,相比傳統的驗證碼要識別字母、數字或者點選文字圖像等方式,這種方式的便捷性是可以直接感受到的,那這種方式是如何來保障安全性的?

張振宇向雷鋒網解釋,滑動模塊時,可以根據滑鼠或是觸摸的時間、加速度、上下浮動的頻率等維度來進行分析,然後通過深度學習的方式去建模,找出其中更多維度之間的關聯。

這就是極驗行為式驗證服務的核心技術原理,據雷鋒網了解,今年行為式驗證進行了一次升級,由滑動模塊驗證升級為點選認證。

簡單來說,這款名為「Test-button」驗證產品,不需要經過滑動模塊的動作也可以完成識別,絕大部份正常用戶直接點擊登錄、註冊等按鈕後直接就能完成操作。

這是如何實現的?

張振宇解釋,這是把原來在滑動驗證中才開始識別的過程提前了,網站主將 Test-button 隱藏部署到登陸、註冊等按鈕中,當你點擊這些按鈕時,就能同步就會完成驗證過程。

在和許多客戶深入交流的過程中發現,不論是批量垃圾註冊還是撞庫登錄,薅羊毛還是刷帖刷票等,他們其實真正需要解決的是系統性的業務安全問題,驗證碼是幫助客戶解決問題的一個重要工具,但不是全部。

基於這個訴求,張振宇和團隊結合之前在生物特徵與交互安全上的積累,希望做出針對不同企業的整套安全解決方案。

如果說之前的產品只是針對驗證碼而言,那之後他們希望將基於生物行為的安全模型帶到對整個網絡行為的識別中。

以生物行為特徵構建多尺度安全模型

在最近的2017先知創新大會上,張振宇分享了背後的技術原理。

在底層生物特徵層中,主要專注於非常細微的滑鼠行為或者觸摸行為,由此來判斷產生的數據符不符合生物特徵模式。在這個過程中,會用到CNN(卷積神經網絡)對滑鼠軌跡或觸摸進行人機判別;會從群體維度大規模樣本進行群體分布或者聚類分析,找出異常群體等。這部分技術是極驗之前積累最深厚的。

動作交互層中,則不再關注滑鼠序列等非常細微的特徵,開始和業務有了進一步的接觸。其中主要有兩種模型,分別是動作模型和交互模型。動作模型就是關注用戶跨頁面的點擊喜好、停頓、速度等行為,交互模型就是關注結構布局、頁面內容、甚至目標用戶群體等,這個也和生物特徵建模密切關聯。

在演講現場,張振宇用下面這張布滿格子的圖,來解釋動作交互層的一個實踐案例。

▲格子化的位置預測

可以把上圖看成是一個普通的網頁,被分為很多的格子,圖中深色的部分,代表這樣的格子間的轉移概率非常大,即我們的滑鼠或是觸屏的活動在這些部位很集中。

這個實驗印證了之前他們的想法,即在不同頁面結構,不同的內容上會形成生物特徵序列的不同模式。利用 RNN(循環神經網絡)對這些格子序列進行訓練模型,還可以做進一步的預測和分析。

在第三層場景模型中,就會和企業業務有更緊密的結合。比如像航空等票務網站,會有具體的選座行為,正常人在這樣的場景下,有相應的目的和習慣。比如我們進入攜程訂機票和去鬥魚看直播,會有不同的行為特徵,可以以此做分析推測。

我們認為所有交互動作,在最宏觀的層面,都是代表了業務意圖的習慣。

在第四層意圖模型中,張振宇更強調通過大規模圖計算來做關聯分析,發現異常的聚集,通過建立數據之間的關聯,可以發現一些傳統的方法做不到的異常。

這四個模型不是單純累加起來,比如生物特徵層的分析,其訓練得到的特徵可以輸入到上一層,去幫助上層建模,同樣在上層分析出的結果,可以指導下層學習的目標,這樣才能有反饋形成閉環,從而把億萬級的生物行為特徵數據所蘊含的『安全』信息釋放出來。

那通過生物特徵識別,真的能保證安全性嗎?

盯著極驗的黑客可不少,在知乎中就有「極驗驗證可以被破解嗎」這一話題,雷鋒網編輯看到,早在 3 年之前,就有黑客針對當時的產品漏洞,在 github上將破解程序開源,並指出當時極驗的前端加密有缺陷。

針對 3 年前的這個破解,張振宇說當時他們也立馬採取了升級模型和前端加密等措施,幾年來團隊也一直在關注這個話題的更新。

如今極驗的客戶數量已經超過20萬家,遭遇各路黑客的攻擊並不少見。

目前的體系是非常嚴密的依靠AI算法進行防禦的體系,會以天甚至是小時來更新迭代。

他坦言,安全永遠是攻防對抗升級的過程,只有知道如何攻擊,安全模型才會更加可靠。

相關焦點

  • 揭秘滑動拼圖驗證碼背後的故事
    12306 拼命把驗證碼弄複雜的原因,目的就是識別出背後同你一起搶票的機器。  作為區分計算機和人類的一種程序算法,驗證碼可有效對抗機器的大批量自動化訪問,這也催生了從事識別驗證碼的各路黑產。  揭秘行為式驗證碼背後的故事  那有沒有一種方法可以同時兼顧安全和用戶體驗?  一家名為極驗的公司,正嘗試通過深度學習,構建生物行為特徵模型來解決上述問題。
  • 驗證安全2.0時代:極驗驗證碼評測
    驗證碼的設計是人能理解而機器無法理解的圖像含義,但是隨著OCR技術的發展,傳統驗證碼已經嚴重影響用戶體驗,並且有些傳統驗證碼還存在相關安全問題。在網際網路飛速發展的今天,傳統驗證碼與當今的網際網路思維背道而馳,人們需要新的驗證碼機制來解決這個問題。在這些問題下,極驗驗證孕育而生了。
  • 極驗滑動驗證碼6.0破解復盤 - 知乎
    GeeTest.6.0.0 GeeTest極驗驗證碼悄悄在這一兩個月更新了js代碼,從5.X到了6.0,破解的難度比之前稍微複雜了一些,破解已成功,就來復盤一下吧。 1. 整體思路 拿這個《國家企業信用信息公示系統》為例,查詢時會先需要通過滑動驗證碼。打開f12刷新網頁,完成一次失敗的滑動,查看加載項。 請求時提交一些參數完成驗證。 passtime應該就是滑動的時間。
  • 極驗聯合創始人張振宇:技術變革帶來產業上的機遇
    峰會上,極驗聯合創始人張振宇以《AI生長:下一代深度學習技術的創新機遇》為題分享了自己的觀點。張振宇認為,以卷積神經網絡為代表的深度學習的技術進步,過去的3-4年在很多的應用領域,比如人臉識別、智能安檢、語音識別等取得了很大的進步。技術變革會帶來了產品上的機遇,甚至帶來產業上的機遇。在未來,AI+圖數據的組合對產業帶來巨大的變革。
  • Python3網絡爬蟲課程 8.2極驗滑動驗證碼的識別
    上一節了解了簡單驗證碼的識別,但是現在這種驗證碼非常少見,現在出現了一大批新型的驗證碼,如極驗滑動驗證碼,它需要拖動合併滑塊才能完成識別。目標本節目標是識別極驗滑動驗證碼,如分析思路、識別缺口、生成拖動路徑、模擬合併等。
  • 01 | 圖形驗證碼的識別
    隨著技術的發展,驗證碼的花樣越來越多。驗證碼最初幾個數字組合的簡單的圖形驗證碼,後來加入了英文字母和混淆曲線。有的網站還能看到中文驗證碼,這使得識別語法困難。 因為,我們需要識別文字,然後點擊與文字描述相符合的圖片,驗證碼完全正確,驗證才能通過。現在這種具有交互式的驗證碼越來越多,如 極驗滑動驗證碼 此類驗證碼需要 滑動拼合滑塊才可以驗證(我不過我個人更喜歡叫它拼圖驗證碼)。
  • 極驗驗證真急眼了!訴網易抄襲LOGO攔截流量,網易雖道歉但否認抄襲
    技術交流成為抄襲關鍵極驗是一家位於武漢、專業從事網際網路驗證碼方向的公司,公司首創了「行為式驗證」,並取得了國家多項技術專利。2012年,極驗推出一款安全2.0技術產品,產品以滑動拼圖來實現安全驗證,取代了之前需要輸入圖片數字或字母的安全驗證方式。
  • 極驗創始人、CEO吳淵:不走尋常路的極客創業者
    定下想幹的事情後,他就辭去工作,拿出積蓄,拉來曾經在實驗室共事過、已在華為工作的師弟張振宇,迅速幹了起來。在武漢大學附近民房起步,團隊沒錢時有多苦,吳淵不願多提,「創業之初都不容易,不想比慘,做自己想幹的事,是一種快樂」。求學時,吳淵就常「不走尋常路」。
  • Axure教程:登錄滑動拼圖驗證交互教學
    滑動拼圖是網際網路一種新的驗證形式,被廣泛應用在各種網站的登錄、註冊、找回密碼。用戶可以不需要填寫複雜的驗證碼,而是用滑鼠去拖動滑塊便能通過驗證。下面為今日頭條的滑動拼圖驗證,接下來將為大家講解:一、界面元件搭建(教程為axure 8)首先,需要下面這些元件。熱區1和熱區2是用來校驗小圖的位置是否正確,作為左右的重合區間。
  • 極驗牽手三大運營商,全面推進無感本機認證業務
    快訊 | 詳情 極驗牽手三大運營商,全面推進無感本機認證業務 日前,極驗無感本機認證完成前期試運營,正式推向全國市場。至此,極驗成為國內首個獲得移動、聯通、電信三大運營商網關內部能力授權的交互安全服務商。
  • 網易被指購買百度關鍵詞、高仿極驗官網:官方致歉 否認抄襲
    極驗公司今天發布了一篇名為《網易,請把LOGO還給我們》的文章,指責網易旗下的雲易盾公司不僅佔用極驗公司公司的logo及搜尋引擎關鍵詞,高仿極驗公司官網,還以技術交流為名騙取極驗公司技術資料,照搬極驗產品。對於這個指責,網易方面確認存在搜尋引擎購買關鍵詞廣告的行為,表示道歉,但網易否認存在抄襲行為。
  • 滑動拼圖下載_滑動拼圖手機版下載【官方安卓版】-太平洋下載中心
    滑動拼圖 休閒益智 大小: 3.09M
  • 「無感認證」將成新趨勢,「極驗」想要用「網關取號」功能取代傳統...
    「輸入帳號密碼」、「輸入手機號獲取簡訊驗證碼」、「掃碼授權第三方」為目前網上主要的登錄註冊方式。然而,用戶會遇到忘記密碼、接收簡訊驗證碼延遲以及信息洩露等問題。有數據顯示,因交互繁瑣,體驗差等原因,直接造成平臺用戶流失數據高達 20%。
  • 專注圖關係數據挖掘,「極驗」發布圖數據建模平臺「疊圖」
    36氪獲悉,7月11日,「極驗」舉行Graph Learning 創新大會暨極驗 2019 圖數據建模平臺發布會,並發布新產品——圖數據建模平臺。36氪曾多次報導極驗。極驗成立於 2012 年,是一家驗證安全技術服務提供商。
  • 極驗驗證碼(6.0.9)破解(四) 之 'aa' 參數調試和分析
    今天我們繼續進行極驗破解,這次我們介紹 'aa'參數的生成,距離上篇文章,已經過去快三個月了,工作很忙,又忙著結婚,一直抽不出來空,或者靜不下心來寫博客,今天總算是忙裡偷閒,也讓自己沉澱一下,準備更新極驗破解第4篇正當我擼起袖子準備大幹一番的時候,發現我的目標網站,關閉了相關功能頁面,不過還好基礎頁面還在,我還能接著用它的極驗滑塊接著幹,哈哈不廢話了
  • 海大被製成了拼圖小遊戲?還要滑動解鎖才能通關!
    海大被製成了拼圖小遊戲?還要滑動解鎖才能通關! 遊戲小貼士左右滑動每個小格
  • 張藝興美國專訪上線!暢談《夢不落雨林》背後的故事
    點開視頻來一起聽聽張藝興在美國的專訪中都分享了哪些專輯製作中的小秘密吧!藝興美國專訪終於來了,專訪中藝興暢談製作《夢不落雨林》的背後故事,萬萬沒想到《NAMANANA》的創作靈感居然是......!!想知道答案的貝殼就一定不能錯過這個專訪了。只要談到音樂就停不住,一個接一個的專業詞彙蹦出來,張PD的才氣滿滿地往外溢!
  • 吐槽驗證碼的背後……
    近日自2016年春運火車票網絡預售以來,其購票圖片驗證碼又一次遭遇不少的吐槽聲。    鐵路部門為了方便廣大旅客購買火車票,也是為了打擊黃牛在春運期間囤積和倒賣火車票,在2011年建立12306網站實行了網絡售票。進行網絡售票的同時,也拉開了鐵路與黃牛在科技與智力上較量的序幕,而最顯然的較量就是驗證碼的變化。
  • 對抗偷獵者 《滑動拼圖大逃亡》上架蘋果商店
    近日App Store 上架了一款名為《Oonyoo : Slide Puzzle Run》(Oonyoo:滑動拼圖大逃亡)的遊戲。這款遊戲中的生物不再需要人類的保護,而是利用自身的超能力對抗森林偷獵者。
  • DNF十周年拼圖一直失敗?拼圖答案全攻略揭秘!
    但是十周年慶典拼圖,這個活動確實有點令人頭疼,要拼齊10圖可不是那麼簡單的。下面就為大家揭秘十周年拼圖的全攻略首先第一步就是要收集碎片了,在地下城刷怪的時候會掉落慶典碎片的禮盒,儘量收集多一些(大約150個盒子)。