網絡小爬蟲莫墮落成小扒手

2021-01-09 同花順財經

蔡恩澤

10月21日,杭州警方對51信用卡委託外包催收公司涉嫌尋釁滋事等犯罪開展調查。有媒體披露,外包催收公司通過恐嚇、滋擾等軟暴力催收的過程中,數據爬蟲公司違規獲取的通訊錄、地址定位等個人敏感信息也是主要幫兇。

近日,多家大數據風控服務商被查。9月6日,杭州的魔蠍數據科技有限公司監管部門查處。數日後,公信寶的運營公司杭州存信數據科技有限公司被公安機關查封,聚信立的運營公司上海誠數信息科技有限公司下發暫停爬蟲業務的通知。

此輪監管風暴正值2019年國家網絡安全宣傳周9月16日開幕的前夕。中央網信辦官員楊春豔披露,截至目前,已收到8000條針對APP違法違規收集使用個人信息的舉報,其中實名舉報佔到近1/3。

聚信立官網顯示,截至目前,其用戶總量1.5億+,覆蓋人群14億+,合作機構3300+,日均查詢220萬+,總查詢10億+,還精心建立了黑名單庫1200萬+。聚信立合作的商戶有30家,包括百度、小米、萬達、京東數科、點融網、浦發銀行信用卡、興業消費金融、中銀消費金融。巨大的灰色利益鏈條隱藏於龐大的數據業務之中。

公信寶被查,就是因為非法收集支付寶、微信、京東、淘寶、信用卡帳單、芝麻信用分、學信數據等,恣意盜竊網民的信息,特別是交易用戶敏感數據。公信寶流傳在市場上的一份2018年產品價格服務表明碼標價,清清楚楚地介紹了不同數據的等級和單價,聯手與P2P平臺合作,從中牟利。

在大數據防控公司中,低成本獲取數據的捷徑是爬蟲技術。追溯爬蟲的發展歷史,20年前,搜尋引擎、數據分析、聚合導航等業務,都是爬蟲技術發揮作用,這是爬蟲技術的榮耀。但榮耀不能陶醉,甚至忘乎所以,要守得住法律底線。

爬蟲技術本身並不是「害蟲」,正像搜尋引擎一樣,作為一種計算機技術,具有技術中立性,因而,在法律上爬蟲技術一向游離於法律禁區之外。問題是這個技術由誰來掌握,有沒有得到用戶授權,把「爬」來的數據用在什麼地方。而眼下一些「小爬蟲」為了商業利潤鋌而走險,處心積慮突破監管紅線。像APP欺詐經營,「下載即發紅包」,這已成為欺詐的廣告詞,條件是你必須慷慨地允許它偷看暱稱、頭像等個人敏感信息,甚至厚顏無恥地要求讓其瀏覽相冊等,十足的流氓性。

在數據安全存在嚴重漏洞的網際網路大環境中,爬蟲技術往往成為信息來源違法、濫用等問題的打手,危害社會,擾亂金融秩序。

眼下,多數網貸公司選擇爬蟲來做風控,爬一次1-3元,大多用在用戶失聯後來催款,有的甚至施加暴力,像51信用卡委託外包催收公司涉嫌尋釁滋事。本次警方對數據行業的高壓調查,與近半年各省市集中打擊「套路貸」也有很大關係。

大數據風控公司提供借貸人的信息,從法律角度上講,其實是要負連帶責任。如果那些信息不是通過授權爬得,更是要負直接法律責任。道理很明白,「公開的數據,你去爬那是撿,但是私密的數據,你去爬那就是偷。」

網絡小爬蟲一旦墮落為「小扒手」就要吃官司。《網絡安全法》規定,未經授權爬取用戶手機通訊錄超過50條記錄,公司法人最高可獲刑3年;未經授權讀取用戶公積金社保記錄超過5萬條的,公司法人最高可獲刑7年。

有鑑於此,大數據防控公司的小爬蟲一定要注意,合規才能生存,如果淪為「小扒手」,不僅名聲難當,還要進班房。小爬蟲們一定要從51信用卡委託外包催收公司涉嫌尋釁滋事案中汲取教訓。

來源: 證券時報

相關焦點

  • 使用Scrapy網絡爬蟲框架小試牛刀
    說人話就是只要是搞爬蟲的,用這個就van事了,因為裡面集成了一些很棒的工具,並且爬取性能很高,預留有很多鉤子方便擴展,實在是居家爬蟲的不二之選。qiushibaike注:此時,我們已經創建好了一個爬蟲項目,但是爬蟲項目是一個文件夾進入爬蟲項目如果想要進入這個項目,就要cd進這個目錄,如上上圖所示,先cd <項目>,再創建蜘蛛項目目錄結構解析此時,我們就已經進入了項目,結構如下,有一個和項目名同名的文件夾和一個scrapy.cfg文件scrapy.cfg
  • 小爬蟲工具的由來
    小爬蟲是一款在線生成網站地圖的工具,只需要輸入域名,系統就可以對網站進行爬行,最後生成完整的網站地圖。用戶只需下載網站地圖,上傳到網站根目錄,然後在網站首頁做連結,並且到百度站長平臺提交連結即可。提交網站地圖可以加速網站內容的收錄,對SEO有非常積極的作用。
  • 浪跡都市的小爬蟲
    滑板車風靡全世界,都市爬蟲正是他們當中的佼佼者,它那優越的性能和獨特的外形使其它眾多的滑板車黯然失色。不知道從什麼時候開始,一些五顏六色的小東西載著一個個陽光少男少女在街道上「爬」過,成為一道別致的風景。這些小車就是今天要給大家介紹的「都市爬蟲」系列的電動滑板車,和一般的電動車比,它們的個頭小、色彩鮮豔。  還有小爬蟲自行車,車把還有座位都可以摺疊,甚至車框都可以!
  • 網絡爬蟲作用有哪些?如何構建網絡爬蟲?
    而網絡爬蟲則是數據採集的主要方法。下面具體為大家介紹網絡爬蟲作用有哪些?如何構建網絡爬蟲?什麼是網絡爬蟲?網絡爬蟲是一種網際網路機器人,它通過爬取網際網路上網站的內容來工作。它是用計算機語言編寫的程序或腳本,用於自動從Internet上獲取任何信息或數據。機器人掃描並抓取每個所需頁面上的某些信息,直到處理完所有能正常打開的頁面。
  • 小爬蟲的人生史
    小爬蟲出生了,在一個美麗的春天裡,媽媽告訴它要向上,陽光才美好,那是窮人與富人的區別,窮人只會天天不向上,一輩子懶惰而向人乞憐,於是美麗的小爬蟲天天
  • 廁所中的小飛蟲,小爬蟲要怎樣清除?
    廁所裡由於潮溼會生很多的小飛蟲和小爬蟲,樣子有點象飛蛾、很小、黑黑的會到處飛。用手一拍手上牆上就會留下一個個小黑點,非常的煩心。廁所中的小飛蟲、小爬蟲要怎樣清除?廁所消毒:如果廁所裡出現小飛蟲和小爬蟲,就要給廁所消消毒了。先用潔廁劑把廁所內的各個角落都要搞的乾乾淨淨,刷得潔白如新。尤其是地漏和通便管道都要用潔廁劑刷一下。
  • 在搜尋引擎領域,有哪些常用的網絡爬蟲?
    網絡爬蟲也有人叫做網絡蜘蛛。 Web Spider,是一個很形象的名字,把網際網路比喻成一個蜘蛛網,那麼Spider就是在網上爬來爬去的蜘蛛。但業界內很少叫蜘蛛的,一般都叫做網絡爬蟲,Spider只是個別爬蟲的名稱。 網絡爬蟲是一個自動提取網頁的程序,它為搜尋引擎從Internet網上下載網頁,是搜尋引擎的重要組成。
  • 網絡爬蟲設計中需要注意的幾個問題
    「網絡爬蟲」又叫網絡蜘蛛,實際上就是一種自動化的網絡機器人,代替了人工來獲取網絡上的信息。許多公司的業務和戰略都需要很多數據進行多維度分析,這也使爬蟲越來越受大家青睞。爬蟲說起來是件簡單的事情。但是往往簡單的事情要做到極致就需要克服重重困難。
  • Python新手爬蟲,簡單製作抓取廖雪峰的教程的小爬蟲
    Python 數據處理 Python編程從入門到實踐 核心編程基礎教程 網絡爬蟲入門書籍 python視頻編程從入門到精通 程序設計教材人民郵電¥72.2領3元券話不多說,先來看看整個爬蟲過程吧!整個爬虫部分很簡單,複雜的部分是處理各種標籤及標籤下的其他內容,最後寫入文件因為不需要排版,反而簡單了。歡迎大家來找我一起交流,完善代碼!
  • 【科創課程】一年一班科學小實驗「自製彈力球」和「爬蟲機器人」
    實驗目的:1、了解電機及電機的應用;2、了解齒輪傳動和曲柄傳動模擬爬行;實驗原理:按下爬蟲機器人的開關後,電路形成通路,電能轉化成機械能,馬達旋轉使前車軸快速轉動。實驗器材:螺絲刀、剪刀、打火機、毛根、泡沫球、電池盒、馬達支架、長U鐵、小窗板、彎軸、鐵軸、橡膠圈、皮帶輪、軸套、馬達、眼睛👀、4mm螺絲、6mm螺絲。
  • 超高清探頭在杭州主城區鋪開 能看清扒手包上的商標
    人一多,扒手們估計樂了。不過,如此形勢,發案不升反降,剛剛出爐的數據顯示,今年1到2月相比去年同期,扒竊案下降了19%。高清探頭配合湖濱反扒隊立功了,民警沈益濤帶領的反扒隊已經抓了11個扒手加拎包賊。這些高清探頭啊,真是高大上,能看清人臉不用說了,扒手拎包上的小商標都看得到,反扒隊員順藤摸瓜,跟蹤抓捕。高清探頭在杭州主城區多條主幹道,包括地鐵裡已經陸續鋪開了。
  • 今天給大家帶來了python抓取b站小視頻的小爬蟲
    首先打開小視頻 的網頁url = http://vc.bilibili.com/p/eden/rank#/?因為我們要依次保存mp4格式的視頻文件,所以這裡我提供給大家一個小函數,用於剔除文件名中的不規範符號,用了re模塊!
  • 全球十大扒手最多的城市
    歐洲城市包辦前十     歐洲經濟低迷連帶影響治安,全球扒手最多的前十名城市都是歐洲包辦,尤其南歐許多城市扒手猖獗。在前十名城市中西班牙佔了4個。    羅馬也是二度名列亞軍,去年羅馬市政府聲稱TripAdvisor網站數據不客觀,不過網站使用者不買帳,今年仍照樣封羅馬是扒手次多的觀光城市
  • Python視頻教程網課編程零基礎入門數據分析網絡爬蟲全套Python...
    Python視頻教程網課編程零基礎入門數據分析網絡爬蟲全套Python視頻教程 2020年07月08日 11:00作者:黃頁編輯:黃頁 本課程為
  • Python爬蟲是什麼意思有啥用 python爬蟲原理實例介紹
    據華為中國官方消息,今日,華為中國發文《小白看過來,讓Python爬蟲成為你的好幫手》,文中詳細介紹了Python爬蟲的工作原理,我們來看一下吧。  以下為《小白看過來,讓Python爬蟲成為你的好幫手》全文:  隨著信息化社會的到來,人們對網絡爬蟲這個詞已經不再陌生。
  • 如何快速學會Python爬蟲(入門篇)
    Python爬蟲實戰二之爬取百度貼吧帖子3. Python爬蟲實戰三之實現山東大學無線網絡掉線自動重連4. Python爬蟲實戰四之抓取淘寶MM照片5. Python爬蟲實戰五之模擬登錄淘寶並獲取所有訂單6.
  • 反扒民警老穆:抓過2000多名扒手 胸懷天下無賊夢
    所以,當扒手成為慣偷後,他往往要「活到老,偷到老」,在老穆的抓捕記錄中,年齡最大的扒手75歲。「偷癮」並非杜撰,在心理學上它叫「病理性盜竊」。慣偷「小驢」租了兩間儲藏室當窩點,當老穆找上門時,發現門都推不開,「滿滿當當,無所不有,簡直就是個超市。」
  • Python,爬蟲開發的不二選擇
    網際網路是由一個個站點和網絡設備組成的大網,我們通過瀏覽器訪問站點,站點把HTML、JS、CSS代碼返回給瀏覽器,這些代碼經過瀏覽器解析、渲染,將豐富多彩的網頁呈現我們眼前。如果我們把網際網路比作一張大的蜘蛛網,數據便是存放於蜘蛛網的各個節點,而爬蟲就是一隻小蜘蛛,沿著網絡抓取自己的獵物(數據)。爬蟲指的是:向網站發起請求,獲取資源後分析並提取有用數據的程序。
  • 第7天|10天搞定Python網絡爬蟲,Scrapy爬更快
    說了好幾天用requests進行網絡爬蟲編程了,是時候換成專業,高效率的爬蟲庫--Scrapy了。我之所以一開始用requests,就想告訴你,網絡爬蟲,方法挺多的,合適就行。還有在之前說的各種解析庫,在Scrapy中,也會經常用到,特別是Lxml的XPath。如果之前不說,留到現在還得說。
  • 基於社交網絡爬蟲分析人物興趣屬性(三)
    本文所有代碼都已經發布在github項目主頁上https://github.com/smityliu/spider微博模擬登錄、推特模擬登錄久等了各位夥伴們,本篇文章是我們社交網絡人物畫像的第三篇,也是我們爬蟲最技術含量最為豐富的一篇,之前的兩篇文章基於社交網絡爬蟲分析人物興趣屬性(