10月21日上午,一排警車出現在杭州西溪谷辦公樓外,隨後警察直奔大樓 15 樓,帶走了 51 信用卡上百名工作人員。
進入 9 月以來,類似的場景在杭州頻繁上演。在 51 信用卡之前,摩羯科技、公信寶等公司先後被查,同盾科技、新顏科技等公司的高管也被警方帶走調查。
他們都是大數據風控公司,提供爬蟲類服務,客戶以網際網路金融公司居多。
51 信用卡被查當晚,@杭州公安 官微通報稱,51 信用卡涉嫌委託外包公司冒充國家機關,進行暴力催收等犯罪行為。
而針對另一更敏感問題——是否利用爬蟲違規收集用戶信息,51 信用卡於昨天(10月22日)澄清說,公司所有的個人信息收集均有合法用戶授權,並保留對惡意報導的起訴權利。
不過,這並不能打消用戶的顧慮,風聲鶴唳的現金貸和大數據,或許只是揭開了這個龐大「爬蟲產業鏈」的冰山一角。
網貸與爬蟲相伴相生
所謂爬蟲是指按照一定規則,讓計算機模擬人的行為來抓取網絡數據,這是門很成熟的技術,在過去很長時間內,它都是作為搜尋引擎的底層技術而存在。
2013年,網際網路金融的興起為爬蟲技術提供了新的土壤。
當年 6 月餘額寶橫空出世,開啟了中國互金元年,巨頭效應帶動下,理財端 P2P 在全國遍地開花。
一開始,網貸平臺、金融公司對技術的使用還算相對克制。
在那個智慧型手機未完全普及、用戶隱私獲取渠道少的年代,他們會委託數據公司去電信運營商資料庫中爬取借貸人的通話詳情,從中分析出用戶的親朋好友的聯繫方式,作為貸後催收的保障。
隨後幾年,一場投融資的高潮拉開序幕,最瘋狂的時期,P2P 平臺數量以每天1到2家的速度膨脹,很快這場瘋狂隨著 2015 年宜人貸 IPO 達到頂峰。
對於金融從業者,這是個千載難逢的機遇。原來只屬於銀行的合法放貸權利被下放到民間,不少民間高利貸和非法集資者裹上高科技、網際網路的外衣,也能順利拿到融資。
資本從正常的投融資,開始變得瘋狂。
51 信用卡也是正在這時開始業務轉型,在此前「信用卡管理工具」的基礎上,增加了「小額信貸業務」。
作為銀行,可以從背調、儲蓄、歷史信用記錄等方面入手,獲取用戶的徵信信息;而民間借貸機構沒有這個條件,為了衡量的你貸款資質和還款能力,他們只能訴諸於「技術手段」。
龐大市場需求的召喚下,越來越多有數據爬取能力的大數據公司湧入這個市場。
通訊錄數據可以造假,但從電信運營商爬取的通話記錄則可靠得多,對貸後催收最管用;電商購物記錄、網銀數據、信用卡帳單這些代表了你的消費能力;工資流水、社保、公積金這些數據則可以衡量的你還款能力;如果需要,還能找出你的學歷背景、職場信息、放貸車險等等…
爬取的數據有兩個來源:網際網路公開數據,和用戶授權數據。所謂「授權數據」,就是用戶在現金貸平臺被強制要求提供並驗證的運營商、支付寶、電商等。
以剛出事的摩羯科技旗下的爬蟲為例。
根據虎嗅在 2017 年的報導,這家公司能爬取的信息包羅萬象:你在其他網貸平臺填寫的信息、放款額度、信用數據;你支付寶的收貨地址、近一年的購物記錄;旅行網站、外賣平臺、地圖、共享單車等平臺的個人信息,甚至可以定製化抓取。
「不管是網站還是APP,只要有帳號密碼就可以爬,連央行的徵信報告都能爬。」
網際網路苦「蟲」久矣
值得注意的是,除了這次踩雷的「人品貸」,51 信用卡的核心業務中還有大數據風控平臺 iCredit。
自 2017 年上線以來,51 金融中心總經理蔣燕青曾在公開場合反覆提及,iCredit 對標同類產品的最大優勢就是數據:
「除了帳單數據,也有運營商數據,電商消費數據等等。基於這樣的數據,再通過一系列的數據整合、延伸,我們提煉出來超過20個緯度的近萬個風控變量。」
在 51 信用卡招股書中,iCredit 也被列為公司的技術護城河之一,但對於這些「大數據」,51信用卡並未披露或聲明過其來源。
作為中國網際網路金融重鎮,這個杭州警方的「除蟲」行動很快波及到了下遊企業。
大數據公司被查風波中,有媒體爆出進程消費金融旗下產品 「錦易貸」、「收入貸」,疑似因突然失去數據爬取服務,無法繼續做用戶風險評定,而被迫暫停放款業務。
其實早在 2017 年,《網絡安全法》就對隱私信息獲取做出過明確規定,其中將個人徵信信息劃定為高度敏感信息,無論「非法提供」和「非法獲取」都可入刑,刑期最高可達 7 年。正所謂那個被當作調侃的段子:「爬蟲學得好,監獄進得早」。
但這並沒能遏制爬蟲技術在利益的誘惑下,繼續淪為作惡工具。
去年 10 月,有數據團隊爆出馬蜂窩點評數據造假,大量內容是使用爬蟲技術從大眾點評、攜程、美團等競品網站搬運而來,用來製造流量假象。
今年 3 月,中國最大的簡歷大數據公司巧達科技被查封,原因是在未得到授權的情況下,非法爬用戶簡歷,並結合「大數據分析能力」,為 170 多萬家企業提供員工離職預測服務。
根據燃財經拿到的一份商業計劃書,巧達掌握著 2.2 億人次的 37 億份簡歷,而從簡歷中的電話、背調資料、家庭婚姻背景輻射出去,巧達資料庫裡至少攥著 8 億中國人的信息。
大數據不斷模糊著隱私的邊界,甚至在許多領域,只要把「隱私」換成「數據」,一詞之差就能從很大程度上免去負罪感,讓非法獲取信息變成一種高度」合理化「的運營方式。
其實不止中國,全球網友都有同樣的困擾。
在這樣的既定事實面前,美國網友甚至開始倡導實施「數據分紅」的方案,以 kb 為單位為數據制定價格,政府按照獲取了多少用戶數據向公司徵收」數據稅「,再將這部分稅收用於社會福利。
這個看起來腦洞大開的新思路,映射出的我們對於隱私安全的無可奈何。
網貸正處在整頓的暴風眼中,和它一起站在風口浪尖的還有非法爬蟲行業的從業者們。
其實網際網路苦「蟲」久矣,現金貸和暴力催收像一根導火線,引爆了這顆暗雷。