一家名叫巧達科技的AI大數據公司火了,不是因為融資,也不是因為它吸引了什麼大牛,而是因為它被警方一鍋端了。
「大約是兩三周前,警察突然進來,把所有人都帶走了,甚至連來面試的人都帶走了。一兩百號人,一溜警車,全給帶走了。」財新網探訪巧達科技辦公所在地時,大樓保安與前臺如此說。據燃財經援引巧達科技前員工表示,直至3月25日,除了HR等非核心成員被放回家以外,改公司核心高管依然失聯中。
巧達科技到底所犯何事、如何處罰等,仍需靜待警方公布調查結果。但外界普遍認為「違規收集並利用個人簡歷信息」可能是此次事件的導火索。
據了解,巧達科技成立於2014年7月,號稱擁有中國最大的簡歷資料庫:通過2.2億+有簡歷的自然人、10億+通訊錄、100億+用戶識別ID組合和1000億+用戶綜合數據,計算出了8億+用戶數據。巧達科技曾對外披露,截至2015年6月30日,收入自然人的簡歷超過1.6億人,總計超過18億份,超過25億行為軌跡。2017年1月完成B輪融資,估值2億美元,投資者包括李開復創新工場、百度風投齊玉傑、中信產業基金、人工智慧產業基金等等。
1
疑似違規收集數據
如此多的數據,巧達科技是怎麼得到的呢?外界普遍認為有如下幾種方法:
1、按照巧達科技自己的說法,其通過向HR或獵頭提供一系列免費的招聘工具,獲得數以億計的共享簡歷。藍洞新消費也對其中具體的原理進行過專門的分析:HR招人任務繁重,巧達科技等公司開發的智能招聘SaaS產品可以幫助HR提高效率,登錄一個平臺即可管理所有渠道的簡歷信息。由於目前很多招聘網站的商業模式都包括付費下載簡歷,花幾萬元可以下載幾千份簡歷,可以查看該招聘網站的無限量個人簡歷。因此,當HR將多個招聘平臺的「付費帳號」託管給SaaS系統平臺之後,該平臺便共享了這些簡歷,當SaaS平臺累計的HR客戶過萬數時,該平臺沉澱的簡歷則可以過億。那麼,問題來了,HR或獵頭對共享簡歷是否知情?而且他們是否有權共享用戶的簡歷?
2、另外,外界還猜測巧達科技利用爬蟲技術搜集簡歷。從技術層面來看,利用爬蟲確實可以在各大招聘網站海量下載簡歷。有微信好友曾告訴墨客星球他手上就有幾萬份智聯的簡歷,都是之前沒事爬著玩的。爬蟲這麼容易?難道各大網站的反爬蟲技術都是瞎了嗎?「在花高價買的高權shell面前,任何防禦都是紙老虎。」該好友如此表示。
因此,聚光燈背後,其實反映出來的是用戶隱私保護、爬蟲危機等行業問題。
1、其實很早之前就有網友指出違規獲取用戶個人隱私信息。但巧達科技愛夥伴產品負責人劉博表示,在民法的侵權責任法中界定個人信息分為個人敏感信息和個人一般信息。隱私部分包含在個人敏感信息中,分如下幾類:個人私生活情況、婚姻家庭情況、財產狀況、個人身體隱蔽部位特徵。除此之外的部分,都歸屬個人一般信息。 劉博表示,簡歷中不存在法理規定的個人隱私信息,巧達科技只分析簡歷信息中的個人教育經歷和個人求職經歷兩部分,是屬於「個人可向公眾開放並知悉」的信息。而簡歷中的照片、聯繫方式、身份證等不在喬大招的獲取範圍內,解析前會做脫敏處理。
然而,據某媒體報導,巧達科技提供的服務還包括根據客戶提供的某用戶手機號,與自有的簡歷庫進行匹配,補全這個手機號的其他自然人信息,包括年齡、性別、行業、職業、戶籍、收入、教育經歷、工作經歷、關係鏈等。
根據工信部《信息安全技術公共及商用服務信息系統個人信息保護指南》,個人一般信息可以建立在默許同意的基礎上, 敏感信息則建立在明示同意的基礎上,收集和利用必須獲得個人信息主體明確授權。據媒體報導,根據《信息安全技術個人信息安全規範》定義的「個人敏感信息」以及「個人一般信息」標準,簡歷中有部分數據已然屬於「個人敏感信息」。
另外,根據《信息安全技術個人信息安全規範》,當直接收集用戶個人信息時,需要有明確個人授權;而當間接收取個人信息,應了解個人信息提供方已獲得的個人信息處理的授權同意範圍,包括使用目的,個人信息主體是否授權同意轉讓、共享、公開披露等。如本組織開展業務需進行的個人信息處理活動超出該授權同意範圍,應在獲取個人信息後的合理期限內或處理個人信息前,徵得個人信息主體的明示同意。
總之,通過HR獲取用戶簡歷數據或許是不正當的。
2、關於爬蟲危機,大數據時代,爬蟲已經成為獲取大數據最普遍的方法,在如今這個將大數據神化為黃金和石油的年代,企業間對大數據的爭奪逐漸演變成了爬蟲危機。
2017年,hiQ Labs爬取LinkedIn用戶資料中的公開可見信息,為企業了解是否僱員有意向離職提供幫助,但LinkedIn認為該行為違反反爬取軟體禁令,要求hiQ Labs停止這類爬取行為。隨後,hiQ Labs不服並起訴LinkedIn。雖然最終法院給出了有利於hiQ Labs的判決,但對如何合理利用爬蟲技術大社會討論卻一直沒有休止。
2
技術作惡
實際上,除了在簡歷的獲取上可能存在問題以外,在簡歷數據的使用上,巧達科技的做法也很不得人心。
除了上面所說的利用簡歷數據幫助客戶補全用戶畫像的服務以外,巧達科技旗下「愛夥伴」項目會時刻「監視」公司員工在招聘網站上刷簡歷等行為,得知哪個員工有跳槽意向,然後把這個信息賣給企業HR,然後企業HR會去找員工約談。這令眾多求職者深惡痛絕,不少求職者感覺被侵犯,卻無從反抗。有行業從業者告訴墨客星球,巧達科技通過該服務賣了很多錢,但在行業內早就臭名昭著了。
時候,巧達科技的投資方紛紛澄清與該公司的關係。
創新工場表示,創新工場為巧達科技財務投資人,未曾參與公司的任何運營。同時,巧達早已搬離創新工場,公司獨立運營。
百度風投方面對21世紀經濟報導回應稱,巧達科技並非百度風投的投資組合。該公司可能為齊玉傑早年所投,但齊本人目前在休假,並不方便聯繫。
總的來說,該事件說明了大數據的強大價值,但價值雖大,若不好好利用,被人拿去作惡,大數據對人們的傷害也將是巨大的。大數據行業仍處於發展的早期,一顆老鼠屎就能壞了整個行業,為此,為行業樹立更加明確的法律法規將勢在必行。當然,對於企業而言,要記住一點:別犯法,莫作惡。否則,眾叛親離是小,被判坐牢才得不償失。
墨客星球交流社群開始招募啦,本社群目前下轄「人工智慧」以及「區塊鏈」兩大專業社群。
歡迎對「人工智慧」或「區塊鏈」感興趣的同學,在墨客星球公眾號對話界面回復關鍵字「交流群」,獲取入群方式;
歡迎轉發至朋友圈
為行業人提供有價值的產業內容
墨客星球