巧達科技被端,揭露大數據行業的兩大頑疾

2020-12-24 墨客星球

一家名叫巧達科技的AI大數據公司火了,不是因為融資,也不是因為它吸引了什麼大牛,而是因為它被警方一鍋端了。

「大約是兩三周前,警察突然進來,把所有人都帶走了,甚至連來面試的人都帶走了。一兩百號人,一溜警車,全給帶走了。」財新網探訪巧達科技辦公所在地時,大樓保安與前臺如此說。據燃財經援引巧達科技前員工表示,直至3月25日,除了HR等非核心成員被放回家以外,改公司核心高管依然失聯中。

巧達科技到底所犯何事、如何處罰等,仍需靜待警方公布調查結果。但外界普遍認為「違規收集並利用個人簡歷信息」可能是此次事件的導火索。

據了解,巧達科技成立於2014年7月,號稱擁有中國最大的簡歷資料庫:通過2.2億+有簡歷的自然人、10億+通訊錄、100億+用戶識別ID組合和1000億+用戶綜合數據,計算出了8億+用戶數據。巧達科技曾對外披露,截至2015年6月30日,收入自然人的簡歷超過1.6億人,總計超過18億份,超過25億行為軌跡。2017年1月完成B輪融資,估值2億美元,投資者包括李開復創新工場、百度風投齊玉傑、中信產業基金、人工智慧產業基金等等。

1

疑似違規收集數據

如此多的數據,巧達科技是怎麼得到的呢?外界普遍認為有如下幾種方法:

1、按照巧達科技自己的說法,其通過向HR或獵頭提供一系列免費的招聘工具,獲得數以億計的共享簡歷。藍洞新消費也對其中具體的原理進行過專門的分析:HR招人任務繁重,巧達科技等公司開發的智能招聘SaaS產品可以幫助HR提高效率,登錄一個平臺即可管理所有渠道的簡歷信息。由於目前很多招聘網站的商業模式都包括付費下載簡歷,花幾萬元可以下載幾千份簡歷,可以查看該招聘網站的無限量個人簡歷。因此,當HR將多個招聘平臺的「付費帳號」託管給SaaS系統平臺之後,該平臺便共享了這些簡歷,當SaaS平臺累計的HR客戶過萬數時,該平臺沉澱的簡歷則可以過億。那麼,問題來了,HR或獵頭對共享簡歷是否知情?而且他們是否有權共享用戶的簡歷?

2、另外,外界還猜測巧達科技利用爬蟲技術搜集簡歷。從技術層面來看,利用爬蟲確實可以在各大招聘網站海量下載簡歷。有微信好友曾告訴墨客星球他手上就有幾萬份智聯的簡歷,都是之前沒事爬著玩的。爬蟲這麼容易?難道各大網站的反爬蟲技術都是瞎了嗎?「在花高價買的高權shell面前,任何防禦都是紙老虎。」該好友如此表示。

因此,聚光燈背後,其實反映出來的是用戶隱私保護、爬蟲危機等行業問題。

1、其實很早之前就有網友指出違規獲取用戶個人隱私信息。但巧達科技愛夥伴產品負責人劉博表示,在民法的侵權責任法中界定個人信息分為個人敏感信息和個人一般信息。隱私部分包含在個人敏感信息中,分如下幾類:個人私生活情況、婚姻家庭情況、財產狀況、個人身體隱蔽部位特徵。除此之外的部分,都歸屬個人一般信息。 劉博表示,簡歷中不存在法理規定的個人隱私信息,巧達科技只分析簡歷信息中的個人教育經歷和個人求職經歷兩部分,是屬於「個人可向公眾開放並知悉」的信息。而簡歷中的照片、聯繫方式、身份證等不在喬大招的獲取範圍內,解析前會做脫敏處理。

然而,據某媒體報導,巧達科技提供的服務還包括根據客戶提供的某用戶手機號,與自有的簡歷庫進行匹配,補全這個手機號的其他自然人信息,包括年齡、性別、行業、職業、戶籍、收入、教育經歷、工作經歷、關係鏈等。

根據工信部《信息安全技術公共及商用服務信息系統個人信息保護指南》,個人一般信息可以建立在默許同意的基礎上, 敏感信息則建立在明示同意的基礎上,收集和利用必須獲得個人信息主體明確授權。據媒體報導,根據《信息安全技術個人信息安全規範》定義的「個人敏感信息」以及「個人一般信息」標準,簡歷中有部分數據已然屬於「個人敏感信息」。

另外,根據《信息安全技術個人信息安全規範》,當直接收集用戶個人信息時,需要有明確個人授權;而當間接收取個人信息,應了解個人信息提供方已獲得的個人信息處理的授權同意範圍,包括使用目的,個人信息主體是否授權同意轉讓、共享、公開披露等。如本組織開展業務需進行的個人信息處理活動超出該授權同意範圍,應在獲取個人信息後的合理期限內或處理個人信息前,徵得個人信息主體的明示同意。

總之,通過HR獲取用戶簡歷數據或許是不正當的。

2、關於爬蟲危機,大數據時代,爬蟲已經成為獲取大數據最普遍的方法,在如今這個將大數據神化為黃金和石油的年代,企業間對大數據的爭奪逐漸演變成了爬蟲危機。

2017年,hiQ Labs爬取LinkedIn用戶資料中的公開可見信息,為企業了解是否僱員有意向離職提供幫助,但LinkedIn認為該行為違反反爬取軟體禁令,要求hiQ Labs停止這類爬取行為。隨後,hiQ Labs不服並起訴LinkedIn。雖然最終法院給出了有利於hiQ Labs的判決,但對如何合理利用爬蟲技術大社會討論卻一直沒有休止。

2

技術作惡

實際上,除了在簡歷的獲取上可能存在問題以外,在簡歷數據的使用上,巧達科技的做法也很不得人心。

除了上面所說的利用簡歷數據幫助客戶補全用戶畫像的服務以外,巧達科技旗下「愛夥伴」項目會時刻「監視」公司員工在招聘網站上刷簡歷等行為,得知哪個員工有跳槽意向,然後把這個信息賣給企業HR,然後企業HR會去找員工約談。這令眾多求職者深惡痛絕,不少求職者感覺被侵犯,卻無從反抗。有行業從業者告訴墨客星球,巧達科技通過該服務賣了很多錢,但在行業內早就臭名昭著了。

時候,巧達科技的投資方紛紛澄清與該公司的關係。

創新工場表示,創新工場為巧達科技財務投資人,未曾參與公司的任何運營。同時,巧達早已搬離創新工場,公司獨立運營。

百度風投方面對21世紀經濟報導回應稱,巧達科技並非百度風投的投資組合。該公司可能為齊玉傑早年所投,但齊本人目前在休假,並不方便聯繫。

總的來說,該事件說明了大數據的強大價值,但價值雖大,若不好好利用,被人拿去作惡,大數據對人們的傷害也將是巨大的。大數據行業仍處於發展的早期,一顆老鼠屎就能壞了整個行業,為此,為行業樹立更加明確的法律法規將勢在必行。當然,對於企業而言,要記住一點:別犯法,莫作惡。否則,眾叛親離是小,被判坐牢才得不償失。

墨客星球交流社群開始招募啦,本社群目前下轄「人工智慧」以及「區塊鏈」兩大專業社群。

歡迎對「人工智慧」或「區塊鏈」感興趣的同學,在墨客星球公眾號對話界面回復關鍵字「交流群」,獲取入群方式;

歡迎轉發至朋友圈

為行業人提供有價值的產業內容

墨客星球

相關焦點

  • 獨家起底巧達科技:「玩轉」8億人數據的灰色生意-虎嗅網
    一位巧達科技前員工告訴燃財經:「陸續有HR等非核心員工回家,但核心高管依然失聯中。」多位業內人士和律師認為,巧達科技出事可能與其未經授權獲取和使用簡歷、「販賣」簡歷信息等涉嫌侵犯用戶隱私權、侵犯公民個人信息的行為有關。公開資料顯示,巧達科技成立於2014年7月,號稱擁有中國最大的簡歷資料庫,其主要數據來源為大數據產品矩陣「喬大招」。
  • 巧達科技被查:遭競爭對手舉報?販賣個人數據是禍根
    巧達科技員工被抓!這家號稱擁有全國最大簡歷庫的數據公司,近日麻煩纏身。個人隱私數據保護越來越嚴,他們到底還是踩了紅線。「買簡歷?找巧達!」這是人力資源、獵頭行業內,口耳相傳的一句話。「基本上所有你能數的上名的大型網際網路公司,都是巧達科技的客戶。」一位之前簡歷中介生意的從業者志鵬飛,如是告訴消金界。擁有如此龐大的數據量,成立於2014年的巧達科技是如何做到的呢?他們又是如何,在販賣隱私數據的不歸路上,越走越遠?
  • 賣簡歷升級版「背景調查」業務面世 大股東為同盾和被端的巧達系
    來源:藍鯨財經巧達科技非法獲取計算機信息系統數據案已經是公安部「淨網2019」中的典型案例。巧達科技非法獲取的簡歷超過2億條、10億份通訊錄,掌握了超過57%的中國人的信息。2016年,巧達科技全年收入1.2億元,淨利潤4800萬元;2017年,巧達科技全年收入4.11億元,淨利潤1.86億元,淨利潤率超過45%。信息和數據就是金錢。因此巧達科技被端並不會成為信息獲取的阻礙,反而例如同盾科技依然與巧達科技發起的有本科技等深度合作,發力「升級版」的簡歷業務——背景調查。
  • 巧達科技36人被批捕 警方披露「乍舌」案情
    公開資料顯示,巧達科技成立於2014年7月,號稱擁有中國最大的簡歷資料庫,其主要數據來源為大數據產品矩陣「喬大招」。喬大招旗下擁有「愛夥伴」、「簡歷時光機」等多款招聘產品。巧達科技在2014年11月獲得創新工場數百萬美元A輪融資,2017年1月獲得數千萬人民幣B輪融資。
  • 簡歷大數據公司「巧達科技」被查 多家共享簡歷網站無法打開
    三言財經3月25日消息,近日,有網友爆料稱簡歷大數據公司北京巧達科技所有員工被警察帶走,公司辦公室也被查封,事發後,巧達科技員工有陸陸續續被放出來的。昨日,三言財經實地探訪位於北京中關村中鋼國際廣場寫字樓內的巧達科技辦公室發現,辦公室大門現已被封條封住,辦公室內空無一人。此前有消息稱,巧達科技被查或與未經允許獲得用戶簡歷數據有關。巧達科技公司名下主要產品為「喬大招」和「愛夥伴」。
  • 創新工場回應「巧達科技被查封」:未參與該公司運營
    圖片版權所屬:站長之家站長之家(ChinaZ.com) 3月25日 消息:近日,有媒體報導稱,簡歷大數據公司 「巧達科技」被警方查封,公司全員被帶走對此,曾參與巧達科技A輪融資的創新工場表示,其僅為巧達科技財務投資人,未曾參與公司的任何運營。且巧達早已搬離創新工場,公司獨立運營。公開資料顯示,巧達科技成立於2014年7月,註冊資本1050萬元人民幣,法定代表人為王成予。
  • 一線丨傳數據公司巧達科技被查 其創始人曾有多項犯罪前科
    根據公開信息顯示,巧達科技曾獲得了創新工場的投資。從巧達科技公布的信息來看,該公司發展早期曾多次利用創新工場品牌為自身背書,如在公司簡介中會自稱是李開復博士創新工場家族成員。此外,巧達科技在數個第三方招聘網站公布的公司地址都為創新工場位於中關村鼎好電子商城寫字樓A座10層的辦公室。
  • 天風證券趙曉光:未來科技投資兩大主線是移動網際網路和精準數據
    來源:21世紀經濟報導原標題:天風證券副總裁、研究所所長趙曉光:未來科技投資兩大主線 移動網際網路紅利和精準數據在消費電子領域,最值得關注的是智能終端的「五化」,分別是:手機的5G化、耳機的智能化、手錶的服務化、電視的社交化和AR的加速化。
  • 快船對症下藥同解兩大頑疾,倫納德喬治開懷大笑
    除了進攻高效,伊巴卡在防守端存在感也很強,頂防、補防和換防都相當積極,給快船帶來了一道內線保障。 內線和後衛線的短板是上賽季困擾快船的兩大頑疾,他們在季後賽3-1領先被掘金逆轉和此也不無關係。
  • 反壟斷破除大數據「殺熟」頑疾
    2019年3月,北京市消費者協會發布的「大數據殺熟」問題調查結果顯示,88.32%的被調查者認為「大數據殺熟」現象普遍或很普遍,56.92%的被調查者表示有過被「大數據殺熟」的經歷。同時,被調查者認為網購平臺、在線旅遊和網約車等消費「大數據殺熟」問題最多,在線旅遊高居榜首。  2018年12月20日,「大數據殺熟」當選為2018年度社會生活類十大流行語。
  • 菠菜科技:體育大數據分析專家
    菠菜科技就是其中一家致力於彩票行業大數據的應用和分析的大數據公司。公司以大數據建立數學模型,為體育彩民提供理性的數據分析,並開發出相關工具(如值博率、變盤指數、投注風險控制系統等)幫助彩民完成投注。「通過彩票投顧概念的引入,助推國內體育彩票市場的發展,讓中國的彩票行業更理性,更科學。」
  • 恆普金融黃筱贇:藉助大數據提升金融科技效率
    北京恆泰惠普信息服務有限公司(恆普金融)董事長黃筱贇表示,恆普金融藉助大數據提升金融科技效率,努力保護金融消費者合法權益。  黃筱贇作為金融消費者合法權益保護創新企業代表,應邀出席了此次金融論壇,就「金融科技助力消費者權益保護」主題參與討論。
  • 只因寫了一段爬蟲,大數據公司200多人被抓!
    巧達科技號稱是中國最大的用戶畫像關鍵數據服務提供商,專注於大數據及人工智慧領域前瞻性產品研發,客戶覆蓋網際網路行業及泛金融領域。 巧達的創始人成予曾經是百度第一任產品部負責人、聯合創始人沈毅曾經是百度電子商務事業部技術總監和百度愛樂活技術副總裁。 公司曾宣稱通過整合多達2.2億份自然人簡歷、100億個用戶識別ID組合和1000億+用戶綜合數據,繪製出了涉及中國8億人口的多維度數據。
  • 兩大數據中心通過Uptime M&O認證 平安科技推出白皮書
    [導讀]近日,中國平安(61.53 +0.51%,診股)保險(集團)股份有限公司深圳、上海兩大數據中心先後通過國際權威的
  • MobTech袤博榮獲2020國際金融科技大會「最佳大數據行業貢獻獎」
    12月9日 ,由上海現代服務業聯合會金融科技專委會、華東江蘇大數據交易中心、《理財周刊》聯合主辦的「2020國際金融科技大會暨中國數字經濟科技創新應用頒獎盛典」在上海明天廣場JW萬豪酒店隆重舉辦。MobTech袤博受邀參加慶典,會上斬獲「最佳大數據行業貢獻獎」,同時被授予「華東江蘇大數據交易中心」會員單位牌匾。
  • 2020中國財稅科技企業發展研究報告:2021年行業規模將達1265億
    高燈科技高級副總裁楊光現場對報告內容進行了深入解讀。他提到,財稅科技是以業財稅智能化融合為目標,通過結合網際網路、雲計算、大數據、人工智慧、區塊鏈等科技手段,幫助政府、企業、個人三方解決業務協作,持續提升財稅運轉效率,以及提升行業數位化、智能化水平的商業應用技術。預計2021年,財稅科技行業規模將達1265億元,未來發展空間巨大。
  • 華為自爆Mate30新升級;微博、支付寶兩大流量「黑洞」聯姻;大數據...
    (來源:新浪科技)國內新聞兩大流量「黑洞」聯姻:微博、支付寶小程序全面打通微博一直以來缺少消費基因,往往是「導購者」自居。網聯清算平臺成立後,留給微博進軍第三方支付的機會幾乎為零。支付寶小程序的接入,讓微博有了線上交易、清算的可能。
  • 雲蝶科技總裁田雪松博士接受媒體專訪,暢談基礎教育大數據
    時至今日,《中國基礎教育大數據發展藍皮書》已發行兩冊,受到教育信息化企業、教育行政部門及一線學校的高度關注,對於促進教育大數據行業發展具有重要意義在第三冊藍皮書即將發布之際,《中國基礎教育大數據發展藍皮書》主編、華南師範大學博士、廣州雲蝶科技有限公司總裁田雪松博士接受了記者的採訪。
  • 天風證券副總裁、研究所所長趙曉光:未來科技投資兩大主線 移動...
    原標題:天風證券副總裁、研究所所長趙曉光:未來科技投資兩大主線,移動網際網路紅利和精準數據   2020年非同尋常,突如其來的新冠疫情給全球經濟發展按下了暫停鍵,
  • 字節跳動投資極課大數據 深度布局教育行業
    來源:新浪科技新浪科技訊 11月21日下午消息,天眼查數據顯示,11月18日,極課大數據的運營主體江蘇曲速教育科技有限公司發生工商變更,原投資方萬豐友方投資的2家投資實體——上海萬豐友方七期股權投資基金合夥企業(有限合夥)、上海鈺子投資管理合夥企業