最近,又聽到很多人被電信詐騙傷害的案例。
有時候我在想:一個「優秀的」騙子和企業家有什麼共同點呢?
首先,必須有法制意識。
比如,他永遠不會拉黑受騙的女學生,並且在她情緒失控精神崩潰的時候,適當退回來一些錢款。
其次,他要有靈敏的市場嗅覺。
比如,他可能會參考人民日報掌握全國各大城市的拆遷進度,然後第一時間拿到拆遷村民的背景資料和電話,「集中優勢兵力消滅敵人有生力量」。
再次,他還要進行嚴格的供應鏈成本控制。
比如,每搞到一批手機號碼,他會讓小弟們「物盡其用」,在號碼被封禁之前,神速地向全國32個省市自治區以及2個特別行政區打出去夠足夠多的詐騙電話。
▲這種叫貓池的東西,可以同時插16張電話卡,是騙子常用的「黑科技」。
這群詐騙大佬分為兩個部分:有一部分在監獄裡吃牢飯,還有一大群仍然在逍遙法外。這就是我們每天都能接到這麼多「高端」詐騙電話的原因。
之所以說高端,是因為這些詐騙電話往往有非常精妙的劇本,並且騙子對受害者的家庭情況、組織關係、生活習慣了如指掌。這些,很可能讓騙局中的你客串一場刺激的「真人秀」。
囉嗦了這麼多,其實我是想澄清兩個概念:
所謂「心防」,當然就是靠宣傳教育,滿街標語告訴大家不貪小便宜。但是,人心比我們想得更脆弱,一念成佛一念成魔。你越是擔心家人、想獨自承擔,越是容易走進深不見底的套路。
還有一種,就是「技防」,也就是靠技術防禦。一個電話打過來,反詐騙平臺已經在後臺分析了它所有歷史通話記錄,判定出這個電話到底是魔鬼般的詐騙,還是你心心念念的外賣或快遞。
事實證明,技防的效果,比心防更有效。
有詩讚曰:
自古真情防不住,總讓套路得人心,問君上當幾多愁,防騙還得技術流。
其實,這種怒懟騙子的技術在現實中早就成熟並且開始應用了,去年國務院官方推出了一個「錢盾反詐平臺」(為了方便,後文就叫「錢盾」吧),就是這樣一個「安裝在手機上,就可以十有八九地識別出詐騙電話」的系統。
因為錢盾背後的技術支持,是馬爸爸的阿里巴巴,所以我和兩位專門負責錢盾技術支持的阿里巴巴安全專家聊了一下,好好了解了一下應用在錢盾裡的最前沿技術,這就講給各位老鐵。
▲這兩位就是阿里巴巴的安全專家,左邊是裕宏,右邊是梅黛。
問題一:你剛才說什麼盾?
錢盾。
應該這麼說,錢盾這貨並不能直接揪出騙子然後把他吊在樹上抽。
它能做到的是:對於一個電話號碼(注意不是打電話的人),識別出它是詐騙電話的可能性(注意不是肯定)有多少。
這樣,你接到電話的時候,就可以直接在屏幕上看到「詐騙電話」的提醒了。
問題二:這我知道,手機上安裝的騰訊管家和360衛士也是這樣工作的。
沒錯,就是這種提醒方式。不過,各家識別詐騙電話的機制有些不同。
科普一下,識別詐騙電話最傳統的方法是:用戶標註。也就是說,安裝了某個防護軟體的用戶接到詐騙或者騷擾之後,人為地給它打一個標籤。如果這個電話被標註詐騙的數量足夠多,比如說10個,那麼系統就會提示接下來再接到這個電話的用戶:疑似詐騙。
這個方法,也是政府或各家公司反詐騙平臺的基本機制。
不過,這種方法存在一個顯而易見的問題,一說你就明白。那就是有時候用戶也分辨不出這個電話究竟是神馬性質。
比如裕宏告訴我,很多用戶接到了推銷電話,怒火中燒,直接把它標註成了詐騙,甚至是很多運營商的電話,也被憤怒的用戶標註成為了詐騙。
也就是說,純粹靠用戶標註,很容易出現「這世界上一個好人都沒有」的錯覺。換句話說,準確率堪憂。
問題三:接到電話就會標註的熱心人,應該比例不高吧?一個詐騙電話湊夠十個標註的時候,可能有很多人都已經上當了吧?
沒錯,除了準確率之外,時間滯後也是這種技術的問題。所以包括錢盾在內的很多反詐平臺都使用了進一步的驗證策略,那就是大數據算法分析。
這個方法其實不難理解,我舉幾個例子:
正常的電話,大多數呼叫會撥打給固定的幾個人,而詐騙電話呢?
正常的電話,大多會打給固定幾個城市,而詐騙電話呢?
正常的電話,打出去和接進來電話的數量大概相同,而詐騙電話呢?
怎麼樣,是不是有點感覺了?
撥打、接到電話的數量、目標城市、時長、頻率,這些都是不同維度的數據。而這些數據裡面,隱藏著每一個電話身份的「驚天秘密」。
問題四:那麼他們究竟怎樣辨別詐騙電話呢?
接下來就到了最技術也是最神奇的地方了。因為裕宏和梅黛剛剛發表了一篇論文,得到了國際權威機構的認可,說的就是識別詐騙電話的算法。
他們把和電話號碼相關的數據分成七種:
1、號碼本身的屬性。
例如號碼類型(固話還是行動電話)、運營商(三大運營商+一眾虛擬運營商)、歸屬地等。從事詐騙的團隊往往來自固定的地獄,我就不地圖炮了。
2、呼入呼出的頻次和比例。
按照經驗我們也能明白,騙子的電話呼出電話的比例會遠大於接到電話,這個比例會非常異常。
3、呼入、呼出的時長。
一般人接到騙子電話,會馬上掛斷,有的會罵一聲娘再掛斷。總之,接到正常電話我們一般不會這麼塊就掛。
4、號碼本身的活躍度。
比如這個號碼,每天都在不停地一個接一個地打電話。正常人恐怕不會這樣。
▲詐騙電話來電時間在每天和每周的分布都是有規律的。
5、呼出電話的城市位置信息。
剛才說過,一般的私人電話可能只會和一兩個城市的人通話,而騙子顯然不會。當然有些公司的電話也有這樣的屬性,這個話題我們一會再說。
6、呼出電話對方的設備信息。
每臺電話都會對應一個獨特的識別碼,這個是可以獲得的。如果一個電話每次呼叫的設備都不同,那麼他也顯然不正常。(這個和剛才的呼出電話城市位置信息有異曲同工的地方)
7、撥打的對象之間的聯繫。
你有沒有想過,你撥打的電話,它們之間一般也是有聯繫的。比如你的前女友的現男友可能是你的好基友。如果一個電話撥出去的對象,完全沒有這種聯繫,也是十分可疑的。
▲根據電話之間的隱秘關係,找出詐騙電話
剛才七個維度,我從感性的角度給老鐵們做了一下解釋,而具體的算法需要結合七個維度的十億條數據,通過天書一樣的算法,最終給一個電話的「詐騙度」打分。
如果一個電話號碼最後分數很高,比如說90分,這就很可能意味著七條規則它中槍了六條半,很可能是每天不接電話,反倒給不同城市的不同電話打了1000個,並且這1000個電話機主還不認識。這基本就是詐騙無疑了。
▲我的錢盾截圖,這些電話我都人肉驗證了一下,對電話的分類還是挺準確的。
問題五:聽上去倒是挺靠譜,不過,畢竟是計算機計算的概率,如果把我的外賣小哥標成騙子怎麼辦?
這就涉及到一個召回率和準確率的問題。
科普一下,任何一種算法都會有這兩個指標。召回率是指100個詐騙電話裡你找到幾個,準確率是指你找到的10個詐騙電話裡面有幾個是錯的。召回率和準確率都是100%的時候最好,這個大家都能理解。
但是,臣妾做不到。
所以就要用一系列的技術提高檢出率,降低誤報率。
裕宏和梅黛這兩位大牛舉了很多例子,我挑兩個說說。
1)在算法之外,可以輔助白名單制度。
阿里巴巴是中國最大的電商,所以他們掌握很多電話號碼,比如企業註冊的號碼,用戶收貨地址中的號碼。這些號碼經過分析處理後可以被用作白名單。
因為,騙子一般是不會用詐騙專用電話號碼做收貨地址的。。。所以一旦一個電話被系統初步認為是詐騙,但是在白名單庫裡,標註了這個電話只是企業的業務電話,那麼系統最後就會把它移出惡意電話的範疇。(這就是之前提到的遇到企業業務電話和詐騙電話行為相近時的解決方案)
2)在算法內部,也可以有很多方法降低錯誤的機率。
比如外賣小哥的問題。外賣小哥雖然每天都會給不同的人打電話,但是他們打電話的時段很有規律,那就是集中在午飯和晚飯的時段,通過這個判定條件優化一個算法,立刻就能把外賣小哥和詐騙分子區分得非常明顯。
總之,經過一些列調優,這種算法最終的錯誤率是8%,就是說對可疑號碼有92%的識別準確率,據說超越了目前所有同類算法的效果。
當然,只要不是確定無疑的詐騙電話,錢盾只是會提示你,不會擅自幫你掛斷。最簡單的辦法就是:你可以接起來驗證一下究竟是外賣小哥還是詐騙。
其實,反電信詐騙功能只是錢盾的一項主要功能,而我剛才介紹的最新的算法的論文剛剛發表,技術也正在部署到錢盾之中,很快就會正式使用。
據說,在所有人群中,20-30歲的人最容易被騙。所以,正在讀本文的適齡青年,還是不要過於相信自己的「心防」,在手機裡加上這麼一道技防,應該也不錯。
沒錯,說的就是你。
註:錢盾反詐系統,全稱國務院聯席辦錢盾反詐平臺,是國務院打擊治理電信網絡新型違法犯罪部際聯席會議辦公室與阿里巴巴集團聯合開發的「反詐神器」,是覆蓋手機端、PC端、Pad端,專業解決用戶資金安全、防信息洩露的技術平臺。
本文作者史中,科技媒體人,微信:fungungun,歡迎交流。