獨家起底巧達科技:「玩轉」8億人數據的灰色生意-虎嗅網

2020-12-24 虎嗅APP


一份巧達科技的文件,透露出的數據問題,令人十分震驚。


日前,有消息稱招聘數據公司巧達科技被查封,全體員工被警方帶走。一位巧達科技前員工告訴燃財經:「陸續有HR等非核心員工回家,但核心高管依然失聯中。」多位業內人士和律師認為,巧達科技出事可能與其未經授權獲取和使用簡歷、「販賣」簡歷信息等涉嫌侵犯用戶隱私權、侵犯公民個人信息的行為有關。


公開資料顯示,巧達科技成立於2014年7月,號稱擁有中國最大的簡歷資料庫,其主要數據來源為大數據產品矩陣「喬大招」。喬大招旗下擁有「愛夥伴」、「簡歷時光機」等多款招聘產品。巧達科技在2014年11月獲得創新工場數百萬美元A輪融資,2017年1月獲得中信產業基金數千萬人民幣B輪融資。



燃財經拿到一份巧達數據給客戶的商務合作BP。這份文件宣稱:巧達科技旗下有38個B端招聘產品、超過170萬招聘者用戶,巧達科技資料庫有2.2億自然人的簡歷、簡歷累計總數37億份。此外,巧達科技還有超過10億份通訊錄,並且掌握著與此相關的社會關係、組織關係、家庭關係數據。結合簡歷、通訊錄,以及外部獲取的超過千億條其他用戶數據,巧達科技自稱擁有超過8億自然人的認知數據。也就是說,超過57%的中國人的信息都在巧達科技的資料庫裡面。


根據文件介紹,巧達科技將這些數據用在教培、保險、招聘等行業,某大型地產公司、某職業教育培訓機構、某分類信息網站和幾家招聘網站在這份文件裡被列為典型案例。數據生意為巧達科技帶來了大量收入。2016年,巧達科技全年收入1.2億元,淨利潤4800萬元;2017年,巧達科技全年收入4.11億元,淨利潤1.86億元,淨利潤率超過45%。


王成予在向一位客戶介紹數據合規性時表示:巧達科技獲取的數據大部分為「非敏感數據」,且數據使用時會經過脫敏處理。


但有律師認為,不論是通過自有渠道還是第三方渠道,沒有經過用戶同意和違反用戶意願的數據交易,都屬於擅自利用用戶信息並可能侵犯隱私。


燃財經嘗試聯繫王成予,向其證實文件裡信息的真實性,但其電話長時間處於關機狀態。


要點速覽  


  • 在BP的管理團隊介紹中,其董事長並非工商信息中的王成予,而是由百度風投管理合伙人齊玉傑擔任。


  • 假如某APP提供某用戶手機號,巧達科技將其與自有的簡歷庫進行匹配,便能反饋給APP這個自然人包括年齡、性別、行業、職業、戶籍、收入、教育經歷、工作經歷、關係鏈等在內的信息。巧達科技即使沒有掌握你的簡歷,它依然可以「算」出你的信息。


  • 巧達科技宣稱通過2.2億+有簡歷的自然人、10億+通訊錄、100億+用戶識別ID組合和1000億+用戶綜合數據,計算出了8億+,也就是可能涉及到57%的中國人的多維度數據。


  • 巧達科技提供的多項服務都指向用戶個人,並且涉及在沒有用戶授權情況下對外許可,很可能涉及侵犯隱私。


高管多為百度出身,公司2017年淨賺1.86億元


根據工商信息,巧達科技有限公司成立於2014年7月,註冊資本1050萬人民幣,法定代表人為王成予。巧達科技登記有3名股東,其中王成予佔股85.33%,劉煒佔股12.19%,北京創新方舟科技有限公司佔股2.48%。此外,王成予還擔任經理和董事長。


燃財經發現,巧達科技將股權悉數質押給北京邁可倫科技有限公司,該公司成立於2015年2月,公司類型為有限責任公司,註冊資本1017.702萬美元,法定代表人、董事長、經理亦為王成予。該公司唯一股東為2014年11月在香港成立的巧達數據集團有限公司。


巧達科技對外稱,自己是「一家專注於商業數據服務領域前瞻性產品設計和技術研發的公司」。核心團隊由「中國網際網路元老級產品經理和技術極客」組成。PPT顯示,巧達科技在2014年11月獲得了來自創新工場的A輪融資,2016年2月獲得了來自齊玉傑和創新工場的A+輪融資,2017年1月,獲得了來自中信產業基金、驪悅金實、創新工場的B輪融資。


創新工場方面對外表示,其僅是巧達科技的財務投資人,從未參與任何公司運營,巧達科技也早已搬離工場。


在BP的管理團隊介紹中,其董事長並非工商信息中的王成予,而是由百度風投管理合伙人齊玉傑擔任。其創始人「成予」曾任IBM WebSphere解決方案副總裁、百度早期產品部負責人、聯想FM365產品經理;其聯合創始人沈毅曾任百度愛樂活技術副總裁、百度電子商務事業部技術總監、百度有啊技術負責人。



此外,其他四位重要高管分別有在聯想、阿里、百度、普華永道等知名企業的從業經驗。巧達科技旗下愛夥伴產品負責人劉博曾經自詡不會侵犯用戶隱私,並稱巧達科技團隊COO劉煒曾是中國最大的在線法律服務平臺盈科律雲的創始人,在法律方面把關格外嚴謹。


燃財經就此聯繫了齊玉傑的同事,對方稱,齊玉傑因身體原因已經休假很長時間,並拒絕了燃財經進一步聯繫齊玉傑求證的請求。一位百度員工則告訴燃財經,巧達科技是齊玉傑去百度風投任職之前就投資的公司,跟百度沒有關係。


該文件還展示了兩組十分引人注目的數據。截至2016年12月,巧達科技完成了全年1.2億元的營收,其中淨利潤4800萬元。一年後,其收入和淨利潤完成了成倍的增長,截至2017年12月,其全年收入4.11億元,淨利潤1.86億元。


巧達科技號稱擁有中國最大的簡歷資料庫,其自有的網際網路招聘工具便是「喬大招」,創始人為劉煒,法人為王成予,旗下擁有「愛夥伴」、「簡歷時光機」、「人才蛙」等10多款網際網路招聘相關產品。


另外,劉煒在明易互通信息技術有限公司擔任聯合創始人,該公司主營「快火箭」和「妙招網」兩款產品。


其中,曾在明易互通任職的葉錦生,是北京紛歷數據技術有限公司的執行董事,「紛簡歷」是其主打產品。「紛簡歷」曾被知乎網友曝光稱,5600多萬份求職簡歷未經當事人允許便被非法兜售,導致個人信息嚴重洩露,致使不少當事人收到大量騷擾電話。


令人驚訝的資料庫:2.2億自然人簡歷、10億通訊錄、100億用戶ID


BP顯示,巧達科技運營的是「以人為核心的大數據」,這其中的關鍵是自然人屬性。


因為傳統的用戶畫像靠行為來猜,依據的是上網特徵、媒體及購物偏好、自定義標籤等相對模糊的信息,很容易猜不準。而巧達科技通過自然人數據還原,能夠精準地進行用戶畫像。



巧達科技的簡歷來源包括38個B端招聘產品和超過170萬招聘者用戶。簡歷解析後自然人的原生數據能夠產生四項定位,包括角色畫像、軌跡變化、社會關係以及區域位置,幾乎涵蓋了個人所有的數據維度。


自稱擁有中國最大的自然人簡歷庫,巧達科技手握2.2億自然人的簡歷,簡歷累計37億份。這也意味著,假如某APP提供某用戶手機號,巧達科技將其與自有的簡歷庫進行匹配,便能反饋給APP這個自然人包括年齡、性別、行業、職業、戶籍、收入、教育經歷、工作經歷、關係鏈等在內的信息。


簡歷之外,巧達科技還通過自有產品獲取用戶授權,以及第三方合作授權等方式,累積了超過10億「本機號不重複」的通訊錄。有了這10億通訊錄和2.2億自然人簡歷庫,加上聚類分析,巧達科技可以給有通訊錄數據但沒有簡歷數據的自然人進行畫像。也就是說,巧達科技即使沒有掌握你的簡歷,它依然可以「算」出你的信息。



拿到自然人的資料後,巧達科技可以通過通訊錄找到他的社會、組織、家庭關係,並進一步挖掘用戶信息。在此基礎上,將這些信息匹配平臺的簡歷庫,最終得出這些自然人及其周邊關係的收入水平、潛在需求、關係影響等要素。這些數據可以再進一步分成運營商數據、消費數據以及行為數據,售與相關企業。


同時,公司將用戶數據與其郵箱、微博號、微信號、QQ等社交ID組合,通過多個識別ID關聯、多種設備關聯、跨平臺行為關聯、線上線下數據互通,打通自然人與ID的關係。


至此,巧達科技宣稱通過2.2億+有簡歷的自然人、10億+通訊錄、100億+用戶識別ID組合和1000億+用戶綜合數據,計算出了8億+,也就是可能涉及到57%的中國人的多維度數據。



巧達科技稱認識用戶就可以預知未來,按照其業務邏輯,此話不僅不假,甚至十分恐怖。



掌握這麼多信息,巧達科技將其應用在數據運營、大數據執法、教培、保險、招聘五大領域。


拿教培行業舉例,某職業教育培訓機構每日新增15萬線索號碼,但僅有手機號+簡單信息,面臨需求不明、付費率低、無效溝通增加成本、學員間轉介紹困難等問題。巧達科技則可以自動補全意向學員的資料信息,將學員線索按照關係分配給課程顧問,並且發現學員通訊錄中有培訓需求的人。



據悉,該職業教育培訓機構已積累2億條諮詢號碼,但同樣面臨推薦錯誤形成騷擾、無法挖掘最大價值的困境。巧達科技則將公海裡的號碼進行關係影響建模,再將課程學員號碼進行產品特徵建模,最後進行匹配計算,得出潛在客戶的分級標記,得出最適合每一位客戶的前幾位課程。


自詡「合法獲得」數據,法律專家稱站不住腳


在這份BP中,單獨有5頁講述業務合規性。巧達科技稱,數據獲取於3個途徑:


1. 自有招聘網站。巧達科技自稱合法取得,求職者用戶直接授權,包括簡歷中敏感數據和非敏感數據。


2. 招聘工具產品。巧達科技自稱合法取得,HR/獵頭用戶授權,包括簡歷中敏感數據和非敏感數據。


3. 第三方數據源。巧達科技自稱合法取得,合作方授權,包括用戶ID組合,通訊錄,行為標籤和偏好畫像。


獲得數據後,巧達科技將簡歷中敏感數據、用戶ID組合、通訊錄進行MD5脫敏,以及簡歷中非敏感數據、行為標籤、偏好畫像,一併放入資料庫中。數據通過建模計算,結合用戶的認知引擎,最後提供給客戶。



法律專家、上海版權協會監事林華認為,巧達科技聲稱的「合法性」在事實和法律上來說都是站不住腳的。「合法」的前提是要有當事人的授權,即使巧達是通過自有招聘入口獲取用戶簡歷,使用用戶信息也必須限於用戶投簡歷的目的範圍之內。超過為用戶直接推薦工作機會之外的都是違反用戶意願,屬於擅自利用用戶信息並可能侵犯隱私 。


如果巧達是從第三方獲取用戶數據,第三方本身不僅需要合法獲得用戶數據而且需要取得用戶對轉售簡歷的許可,這兩個條件缺乏其一都不合法,從而導致購買和再利用數據的行為不具有合法性。


即使巧達以合法方式取得用戶簡歷信息,對簡歷的使用也應是另一個獨立行為。如果對匯總的用戶信息經過數據脫敏,使信息不再和具體自然人而是和特定群體掛鈎,即只在統計學意義上利用不包含個人身份的用戶大數據,法學上基本認同這種使用方式不涉及隱私權。


但巧達科技對用戶簡歷的使用應當不止於此,巧達科技提供的多項服務都指向用戶個人,並且涉及在沒有用戶授權情況下對外許可,很可能涉及侵犯隱私。


此前已有販賣簡歷被指控侵犯公民個人信息罪的先例。2017年,在求職網站智聯招聘工作的員工先後私自出售15萬份個人簡歷信息給「獵頭」餘秋雲,每份簡歷信息售價2~2.5元,餘秋雲再將信息加價賣給他人。上述員工被抓獲,公訴方指控三人犯侵犯公民個人信息罪。


一位行業人士告訴燃財經,做數據生意的公司都很「低調」,屬於「悶聲發大財」,巧達科技也不例外。據他介紹,巧達科技為HR或獵頭提供簡歷管理工具,並引導他們主動上傳自己手中的簡歷以免費換取其他簡歷,巧達科技由此獲得了大量的簡歷數據。


「數據交易行業裡,簡歷數據屬於比較貴的數據。」該行業人士猜測,巧達科技很可能拿著手中免費得來的簡歷數據和擁有其他類型數據的數據公司進行了交換,從而拿到了通訊錄數據、消費數據等等其他數據。


多位行業人士告訴燃財經,數據行業的「水很深」,個人隱私被用來非法牟利的例子比比皆是。對於此類事件,燃財經將持續關注。


相關焦點

  • 巧達科技被查:遭競爭對手舉報?販賣個人數據是禍根
    「基本上所有你能數的上名的大型網際網路公司,都是巧達科技的客戶。」一位之前簡歷中介生意的從業者志鵬飛,如是告訴消金界。擁有如此龐大的數據量,成立於2014年的巧達科技是如何做到的呢?他們又是如何,在販賣隱私數據的不歸路上,越走越遠?
  • 巧達科技36人被批捕 警方披露「乍舌」案情
    警方提醒網際網路企業,在收集、存儲、使用用戶個人信息數據開展合法經營時,要嚴格按照國家法律法規,落實數據保護責任,採取必要的技術防範措施,確保用戶信息數據的安全。附《獨家起底巧達科技》一文:此外,巧達科技還有超過10億份通訊錄,並且掌握著與此相關的社會關係、組織關係、家庭關係數據。結合簡歷、通訊錄,以及外部獲取的超過千億條其他用戶數據,巧達科技自稱擁有超過8億自然人的認知數據。也就是說,超過57%的中國人的信息都在巧達科技的資料庫裡面。
  • 賣8億人信息換4億營收,這是怎樣一種病態的商業模式
    從媒體披露的商業計劃書看,這家公司通過自有招聘網站、第三方數據源和語意含糊的「獵頭授權」等方式,直接掌握了2.2億自然人的簡歷,並藉此掌握了10億份通訊錄。因此,巧達科技得意地宣稱,自己已經擁有了超過8億自然人的認知數據。而巧達科技的盈利模式,則是向相關企業直接出售這些非法獲取的用戶信息。
  • 巧達科技被端,揭露大數據行業的兩大頑疾
    一家名叫巧達科技的AI大數據公司火了,不是因為融資,也不是因為它吸引了什麼大牛,而是因為它被警方一鍋端了。「大約是兩三周前,警察突然進來,把所有人都帶走了,甚至連來面試的人都帶走了。一兩百號人,一溜警車,全給帶走了。」財新網探訪巧達科技辦公所在地時,大樓保安與前臺如此說。
  • 一線丨傳數據公司巧達科技被查 其創始人曾有多項犯罪前科
    根據公開信息顯示,巧達科技曾獲得了創新工場的投資。從巧達科技公布的信息來看,該公司發展早期曾多次利用創新工場品牌為自身背書,如在公司簡介中會自稱是李開復博士創新工場家族成員。此外,巧達科技在數個第三方招聘網站公布的公司地址都為創新工場位於中關村鼎好電子商城寫字樓A座10層的辦公室。
  • 一家販賣8億份個人簡歷的公司 現已人去樓空
    【TechWeb】或許,簡歷的生意從最開始就是個偽命題。近日,號稱擁有全國最大簡歷庫的招聘類數據公司巧達科技被曝公司所有人員被警方帶走。這家公司曾宣稱通過整合多達2.2億份自然人簡歷、10億份通訊錄、100億個用戶識別ID組合和1000億+用戶綜合數據,繪製出了涉及中國8億人口的多維度數據。其中,包含個人隱私與非隱私信息。TechWeb在巧達公司門口拍攝到的畫面,據大樓物業介紹,該公司早已被封,不過還是有不少慕名而來「參觀」的人。
  • 簡歷大數據公司「巧達科技」被查 多家共享簡歷網站無法打開
    三言財經3月25日消息,近日,有網友爆料稱簡歷大數據公司北京巧達科技所有員工被警察帶走,公司辦公室也被查封,事發後,巧達科技員工有陸陸續續被放出來的。昨日,三言財經實地探訪位於北京中關村中鋼國際廣場寫字樓內的巧達科技辦公室發現,辦公室大門現已被封條封住,辦公室內空無一人。此前有消息稱,巧達科技被查或與未經允許獲得用戶簡歷數據有關。巧達科技公司名下主要產品為「喬大招」和「愛夥伴」。
  • 賣簡歷升級版「背景調查」業務面世 大股東為同盾和被端的巧達系
    來源:藍鯨財經巧達科技非法獲取計算機信息系統數據案已經是公安部「淨網2019」中的典型案例。巧達科技非法獲取的簡歷超過2億條、10億份通訊錄,掌握了超過57%的中國人的信息。2016年,巧達科技全年收入1.2億元,淨利潤4800萬元;2017年,巧達科技全年收入4.11億元,淨利潤1.86億元,淨利潤率超過45%。信息和數據就是金錢。因此巧達科技被端並不會成為信息獲取的阻礙,反而例如同盾科技依然與巧達科技發起的有本科技等深度合作,發力「升級版」的簡歷業務——背景調查。
  • 創新工場回應「巧達科技被查封」:未參與該公司運營
    圖片版權所屬:站長之家站長之家(ChinaZ.com) 3月25日 消息:近日,有媒體報導稱,簡歷大數據公司 「巧達科技」被警方查封,公司全員被帶走對此,曾參與巧達科技A輪融資的創新工場表示,其僅為巧達科技財務投資人,未曾參與公司的任何運營。且巧達早已搬離創新工場,公司獨立運營。公開資料顯示,巧達科技成立於2014年7月,註冊資本1050萬元人民幣,法定代表人為王成予。
  • 只因寫了一段爬蟲,大數據公司200多人被抓!
    掌握2.2億人簡歷大數據,年賺1.8億 巧達科技號稱是中國最大的用戶畫像關鍵數據服務提供商,專注於大數據及人工智慧領域前瞻性產品研發,客戶覆蓋網際網路行業及泛金融領域。
  • JAMA:2015年美國醫生「灰色收入」達24億美元
    近日JAMA刊登的一項研究顯示:2015年,美國醫生從生物醫療公司獲得的收入高達24億美元。該報告研究者——加利福尼亞大學聖地牙哥分校 (University of California San Diego School of Medicine) 雷迪管理學院(Rady School of Management)的凱薩琳·特林加萊(Kathryn Tringale)從平價醫療法案酬勞公開項目(Affordable Care Act Open Payments Program)網站收集數據
  • 起底34.8億美元的音樂周邊生意
    在去年9月,華納音樂以1.8億美元收購德國電子商務公司EMP;三個月後,環球音樂收購了總部位於洛杉磯的周邊製造商Epic Rights;而上個月,索尼音樂的美國商品部門The Thread Shop還收購了The Araca Group音樂周邊商品部門。古話說得好,無利不起早。三大唱片公司加速布局音樂周邊的背後,潛藏著怎樣的商機?
  • 秦絲公布8月生意大數據 服裝用戶25萬其他行業23萬
    近日,秦絲科技對外發布了8月的數據報告,報告顯示秦絲服裝鞋帽專用版的「秦絲進銷存」註冊用戶已達25萬,美妝、建材、五金、家具等多個行業通用版的「秦絲生意通」註冊用戶達23萬,總使用人數超過150萬。
  • 飯圈灰色產業鏈背後的賞與罰,起底「代拍」江湖
    飯圈灰色產業鏈背後的賞與罰,起底「代拍」江湖作者:張津來源:南方傳媒書院全文4240字,閱讀約需8-9分鐘11月8日,有網友曝光了一段胡歌怒斥代拍的視頻。視頻中的胡歌從穿著上來看非常低調,在代拍無休止的懟臉拍攝下,他指著旁邊拍視頻的人訓斥到:「再說一遍,別拍了啊,還拍?12月5日,吳京獨自一人現身機場。當天他出現在機場十分低調,代拍人群一直緊跟不舍,吳京語氣嚴肅用手指著旁邊的人生氣地說:「你們看那裡還有小孩,你們這樣真不好。」
  • 灰色生意:奶粉桶回收能賺幾十倍利潤(附其他高利潤項目)
    除了以上我們提到的三種回收公益和回收生意,回收細分領域,也有一些創業者在探索商業模式。 做什麼生意本小利大?奶粉桶,在很多媽媽眼裡就是一個廢品,但是在一些精明的商人眼裡這些都是真金白銀。隨著海外代購奶粉的火爆,收購奶粉桶已經成為了一個灰色的生意。
  • 起底「超級團購」:一部手機如何做成「傳銷生意」?
    但這個明眼人一眼就能看透的,依然吸引了那麼多人參與其中,除了被洗腦外,也是抓住了人性最關鍵的弱點——貪婪。「2019年底,公司全面進行股改;2020年開始,接受納斯達克上市輔導……」這是四川中天興盛網絡科技有限公司(以下簡稱「中天興盛公司」)向外界勾勒出的一張雄心勃勃的「美好藍圖」。然而,隨著四川省樂山市公安局沙灣區分局的兩份警情通報,這張「美好藍圖」戛然而止。
  • 數據顯示Android 4.1系統使用率達0.8%
    網易科技訊 8月2日消息,據國外媒體報導,代號為「果凍豆」的Android 4.1系統於一個月前發布,正式推出僅僅三個星期,但據谷歌在Android開發者網站上發布的最新數據顯示,該系統版本在Android設備中的使用率已達0.8%。
  • 全家70億的會員生意,上海人都入坑了-虎嗅網
    據央視財經報導稱,伊藤忠商事從7月9日開始對全家進行股權收購,預計將持續到8月24日,收購金額為5000~6000億日元。收購完成後,伊藤忠將持有全家100%股權。早在22年前,全家母公司西友陷入資金危機時,伊藤忠出手相助,把全家41.45%股權收至麾下,並力主後者打開中國市場。
  • 起底心靈培訓騙局 通過精神控制斂財超10億
    起底心靈培訓騙局 通過精神控制斂財超10億時間:2016-08-01 19:48   來源:鳳凰網   責任編輯:毛青青 川北在線核心提示:原標題:起底心靈培訓騙局 通過精神控制斂財超10億 只要刷卡參加心靈輔導課,生活就能改善?在心靈輔導機構創造豐盛兩名老師的口中,種種奇蹟都被解釋為人接受宇宙能量的結果。
  • 掌閱科技如何做好這單1億人的閱讀生意?
    原標題:用免費做大規模 靠付費細分市場  與國內外600多家優質版權方合作,能為全球150多個國家和地區的數億用戶提供正版圖書內容,平均月活用戶超過1億人次……作為國內最早開始探索付費閱讀的數字閱讀平臺,掌閱科技股份有限公司打算如何做好這單1億人的閱讀生意?