來源:創事記
歡迎關注「創事記」微信訂閱號:sinachuangshiji
文/雷慢
來源:新金融洛書(ID:FintechBook)
01
2006年,已經做了幾年天使投資人的唐寧,自掏腰包借款給100多個大學生參加培訓收到了回款,因此受到鼓舞,在北京SOHO現代城的三室一廳裡創立了宜信公司,在這裡一同辦公的,還有他剛創辦的華創資本,招進了早已熟識的第二號員工吳海燕,後者後來成了華創資本的當家人。
36歲這一年,從阿里巴巴安全部技術總監崗位上辭職的蔣韜找到吳海燕說,他想做一個SaaS級應用而服務所有網站,名叫同盾科技。吳海燕很快給了蔣韜第一筆天使投資。
那時,市場傳聞一條不成文的規則,從阿里中層出來的人創業,天使風投100萬美元起步。華創資本和IDG資本給蔣韜的則是千萬元人民幣的天使輪。
蔣韜出來單幹之前兩年,即2011年,在矽谷工作了11年的汪德嘉回國了。汪德嘉是個留美數學博士,在VISA等公司做大數據分析、金融反欺詐技術工作,回來後就創辦了通付盾,仍是老買賣。
一次,汪德嘉帶隊在杭州參加一個安全技術交流會,遇見了還在阿里巴巴做安全部技術總監的蔣韜和團隊。兩人聊得投機,很快,雙方籤訂了技術交流合同,
兩個年輕人走向志同道合的路。不到幾年時間,一個成為網絡反欺詐領域的兇猛後生,一個成為數字身份認證領域的不得不提的主。
數據產業起於草莽,蔣韜、汪德嘉們也不得不劍懸顱頂。友商們數據倒賣、侵權爬蟲、竊取隱私的事情太多了。幹這事,像淺水行舟,還百舸爭流,水不僅攪渾了,身邊的人也一個個觸礁了。
誰也沒有想到,幾年後,兩人突然翻臉,汪德嘉指蔣韜偷竊通付盾核心技術。蔣韜則一紙狀書將汪德嘉告上法庭,頓時反目成仇。
02
趟數據這趟渾水的,不止蔣、汪。
數據產業的淘金熱,在2007年前後出現,於2013年前後興起。與P2P的展業有著相當的軌跡。
同盾科技、百融金服、聚信立、GEO集奧聚合、白騎士、算話徵信。這些大多湧現於2014年前後兩年,這些第三方數據公司的出現,迅速滿足並激活了消費金融、P2P甚至銀行金融機構的風控、獲客、營銷需求。
通觀第三方數據企業的合作體量,就知道市場需求並不少。截至目前,第三方數據企業的聚信立合作企業超過2900家、上海的新顏科技合作機構2500家以上;同盾科技的數聚魔盒,在2019年3月份下線前,合作企業10000多家。這些第三方數據公司的主顧們,主要來自網際網路金融機構,包括了P2P網貸、消費金融、現金貸等。
IDC名為《數據時代2025》的報告顯示,全球每年產生的數據將從2018年的33ZB增長到2025年的175ZB(1ZB相當於1.1萬億GB)。
資料來源:數據時代;數據來源:IDG
做金融的,無論銀行、消費金融、P2P,言必稱大數據風控。雖然有效性現在還能定論,但在品牌營銷、精準獲客上,這兩年確實讓做地推的都捨棄了原本的路子。銀行們找騰訊、阿里、百度合作,P2P、現金貸、消費金融們則有同盾、通付盾們,大家各自配對。
問題是,這些第三方數據有多少是清白的。那些流量巨頭的數據後門,個體甚至監管,都不容易摸到。
一些明目張胆做數據買賣的,就難免被拉出懲戒示眾。
自稱數據第一股的北京「數據堂」,2014年掛牌新三板。2017年7月山東公安上門時,這家公司日均傳輸公民個人信息1億3000萬餘條,累計傳輸數據壓縮後約為4000G。
數據堂的數據,大多是用自營眾包平臺、公共領域共享,網絡爬蟲爬取方式獲取。一份「車輛標準圖像數據」的數據包在網頁公開售價20000元。新華視點記者曾問他們客服,這是否會涉嫌侵犯用戶隱私。客服聲稱,這些照片都是擺拍,獲得了授權。但該數據產品卻明確寫著「來自交通卡口監控視頻截取」,並非擺拍。
被抓了幾十人後,警方偵查發現,數據堂公司向不同的多家公司各售賣了1萬條至70萬條不等的公民個人信息。
數據堂案件一審判決時,數據堂營運長柴銀輝、營銷產品部副總裁胡曉敏都被判有期徒刑三年,兩人都不服,以「數據堂公司系單位犯罪」理由提起上訴,終被駁回。
之後,「數據堂」正常運行。
有些「鐵打的營盤,流水的罪犯」的意思。
03
我曾陷於解這樣一個謎,前一天我和朋友聊過的旅遊想法,第二天就出現了微信底部的攜程訂票廣告,我在私底下談過的某款車,之後就出現在了頭條的短視頻裡。我想,究竟是誰走漏了風聲?
像一個被扒光的人,卻不知道如何被誰扒光了。而且越來越被扒得徹底。
以數據所構建出虛擬生活的我們,活在一個巨大的「圓形監獄」之中——所有囚室對著中央監視塔裡的數據處理器,每一個囚室有一前一後兩扇窗戶,一扇朝著中央塔樓和所有人的監視,一扇背對著中央塔樓贏得短暫和半透明的自由。監視者可以觀察到囚室裡的罪犯的一舉一動,囚徒卻不知是否被監視以及何時被監視,時刻處於憂慮之中。
英國哲學家傑裡米·邊沁(Bentham)把圓形監獄描述為"一種新形式的通用力量 "(a new mode of obtaining power of mind over mind, in a quantity hitherto without example)。
幾個月前,馬化騰喊出了「科技向善」,實在是有些牽強了,因為資本逐利,技術在資本手裡,簡直就是一個黑箱了。
別忘了,中國的網際網路大公司,在數據上都有不光彩的過去,
螞蟻金服鬧過個人信息被默認勾選進《芝麻服務協議》事件;京東金融曾曝出留存用戶圖片緩存和10G數據外洩事件,至於抨擊百度作惡,已成了政治正確了。
這兩年,我們已幾乎走進科幻電影中的現實。
2002年上映的科幻驚悚電影《少數派報告》,曾出現這樣一幕(大意):湯姆克魯斯扮演的約翰·安德頓進入商場,大屏幕上出現一個個定製給他個人的廣告,並推銷給他說:約翰·安德頓先生,您上一次買夾克已經過去3年了,您要買一件新的皮夾克嗎?
我們的個人信息,大抵如是。
個人信息、隱私,在電腦算法、機器學習的挾持下,輸出給個人的廣告或信息,都是經過數據精心算計的結果。
在算法的挾持下,放貸公司的廣告會給出令你心花怒放的說辭,也會在你申請貸款時,給你滴水不漏的貸款價格。這背後,是批量放貸的大數據信審和不可琢磨的技術黑箱。
04
這些年,數據黑箱現象隱而不發,但蔚為大觀。
消費金融公司雖然給了你一筆利率不錯的貸款,但你無法知電腦算法在審貸決策過程中,是否出現程序錯誤,是不是對你有算法歧視,是不是將學歷、種族、戶籍信息作為風險定價的依據,你的社交行為數據、朋友圈層次在多大程度上作為你利率定價的依據?這就是數據黑箱,看不見摸不著,卻決定著對你的信貸定價。
法學教授弗蘭克·帕特洛伊(Frank Partnoy)和普立茲獎獲得者傑西·艾辛格(Jesse Eisinger)曾於2013年年初共同研究過」美國銀行的內幕「,他們在報告中把銀行描述為「掩蓋了巨大風險的『黑箱』,這些風險可能會再次擊垮經濟」,因為黑箱不可捉摸,不可明察。
金融科技化之後,越來越多的黑箱產生,並未使得金融科技更加透明。
黑箱的種子與土壤到處都是,如黑產軍團、數據倒賣行為、大數據信審、人工智慧深度學習、機器決策…
金融科技的技術和數據黑箱使得監管越來越難。
一家借貸平臺在他的大數據風控的系統中輸入一個人用戶數以千計的社交數據、搜索數據、瀏覽數據、交易數據等,經過深度學習和決策模型的計算,最終可能將一個人的信用定為不及格,但這其中的具體決策過程是什麼,企業不會告知你。
更甚至於,這個決策過程中出現程序錯誤、算法歧視時,電腦試圖向程式設計師解釋時,程式設計師也無法明白。
哥倫比亞大學的機器人學家 Hod Lipson曾說:「這就像是向一條狗解釋莎士比亞是誰。」
被問及Google公司如何對數據進行私下操作時,前執行長埃裡克·施密特(Eric Schmidt)曾經回答:「Google的政策就是和警戒線打擦邊球。」
05
2018年,歐盟頒布了一道了不起的法令——《一般數據保護條例》(GDPR)》。
它未被國人重視的嚴重性,正如它深遠、前瞻的偉大性一樣不可忽視。
這則法令最重要的兩個原則在於:
1、最大限度的保護個人隱私,嚴格限定企業、政府對個人信息數據的使用條件。將科技、人工智慧、數據滲透阻擋於個人隱私之外。
2、要求人工審查重要的人工智慧中的算法決策,提供個別算法決策的詳細解釋或關於算法如何做出決定的一般信息。這一條款將大大降低技術黑箱問題的存在。
通俗並且簡而言之,這兩個原則,試圖保護人類個體不受愈發失控的數據或技術黑箱之侵害。
如果不受限制,數據亂象將導致怎樣的後果?
國內大數據企業常掛在嘴上的打擊黑產、打擊擼貸大軍、欺詐軍團,可實際上,數據產業有目前最大之一的黑產軍團。
2014年,曾有過詐騙、敲詐勒索兩次犯罪經歷的「王成予」創辦了一家名為「巧達科技」的數據公司。僅僅一年多時間後,王成予的巧達科技掌握了1.6億中國人求職簡歷。
巧達科技利用這些數據發布了這款全稱叫「愛夥伴員工離職預報」的產品,能發現90%以上員工離職前的動態信息,最快30分鐘內向企業管理者發出預報通知。
巧達科技和企業、獵頭們在做的是一項拿產品換數據的勾當,交易著你我的簡歷,而將你我排除在外。
2019年3月24日,大數據行業盛傳巧達科技被警方「一鍋端」,原因或涉及未經授權收集公民個人信息。
我們回過頭來再看,GDPR有它了不起的地方。
歐盟GDPR了不起的地方在於無視利益集團、犧牲科技革新的速度,將科技進步控制在可理解的天花板裡,而非放任在失控的黑箱中。
一百年前,路易斯·布蘭戴斯(Louis Brandeis)曾經發表言論「陽光是最好的消毒劑」。
在數據黑箱的失控下,螞蟻金服或騰訊、百度們,甚至於美團、攜程們,有可能成為金融科技領域的新權威者。
曾經我們舟船往來、書信有無,一封家書私藏50年,打聽一個人的私密要聊很久的八卦。如今數據通了信息高速,但我還是發願:個人不裸體示人,我願隱姓埋名,國家就對我一無所知,BAT們不能左右。