「爬蟲」相關罪名分析(上篇)——「爬蟲」犯了什麼罪?

2020-11-14 李明亮律師

前言:

幾日前,一篇《只因寫了一段爬蟲,公司200多人被抓!》文章引起各界關注。在這篇文章出來之前,已經有多家做「數據」的公司被調查處理:其中包括:

1、該文章所涉的公司「巧達科技」,該公司號稱是中國最大的用戶畫像關鍵數據服務提供商,專注於大數據及人工智慧領域前瞻性產品研發,客戶覆蓋網際網路行業及泛金融領域。

2、中國電信控股的子公司「天翼徵信」,其總經理、副總經理以及市場人員被警察帶走,原因是與其合作的大數據公司被警方調查。

3、新顏科技CEO黃向前被警方帶走。

4、魔蠍科技公司CEO周江翔涉事被查。

5、公信寶公司門口被貼了封條。

6、知名第三方數據服務公司聚信立宣布將暫停對外提供用戶授權的運營商爬蟲服務。

7、國內大數據風控平臺龍頭同盾科技也被曝爬虫部門已解散。

……

《只因寫了一段爬蟲,公司200多人被抓!》,網址:https://smile.blog.csdn.net/article/details/102597598,2019年10月24日瀏覽。

近日,51信用卡也被警方調查,傳言可能涉及委託外包催收公司尋釁滋事犯罪(警方披露的信息已證實)、非法獲取公民個人信息犯罪(未經警方證實,但警方通報中「等犯罪行為」是否包括此種行為暫不可知),其中「非法獲取公民個人信息犯罪」,也涉及「爬蟲」問題,再一次把「爬蟲」問題推至風口浪尖。

一位當地互金企業高管告訴記者,調查或與近期對爬蟲業務的整治行動有關,這一消息目前尚未得到進一步證實。

——51信用卡遭調查 業內人士:或與爬蟲業務整治行動有關,新浪科技:https://tech.sina.com.cn/i/2019-10-21/doc-iicezuev3673711.shtml

一、何為爬蟲?

網絡爬蟲,又稱為網頁蜘蛛,網絡機器人,是一種按照一定的規則,自動地抓取網絡信息的程序或者腳本。「在大數據風控行業中,以網絡爬蟲獲取信息數據的做法最為盛行」。

從本質上看,「爬蟲」就是一種「技術工具」。一般而言,技術工具本身並無是非對錯,是否違法犯罪,要看使用人利用該「爬蟲」技術做什麼事。

有人認為,「爬蟲技術」主要分為公開爬蟲和授權爬蟲,但從《只因寫了一段爬蟲,公司200多人被抓!》這篇文章來看,受害公司因遭爬蟲爬取,導致被害公司的客戶信息被抓取,這就既不屬於公開爬蟲,也不屬於授權爬蟲了。因此,此種分類沒有必要或不夠全面。從其所抓取的「信息」作為對象來看,爬蟲所爬取的信息,可以分為以下幾類:

1、公開信息,如公開發布的法律文件、司法判例、工商信息、用戶評論信息等;

2、非公開信息,如某人在某網站註冊的個人電話號碼、郵箱、身份證號碼等信息,該網站不應也不能公開,如果爬蟲非法抓取了該類信息,便屬於爬取非公開信息,如《只因寫了一段爬蟲,公司200多人被抓!》文中所涉及的爬蟲公司。

據筆者的研究,不論是爬取公開信息,還是爬取非公開信息,都有可能構成違法犯罪行為。因此,「技術中立」的抗辯,往往因實際上使用人非法使用爬蟲而變得無效。不然,就會像孟子所諷刺的那樣:「是何異於刺人而殺之,曰:『非我也,兵也。』」

二、爬蟲所涉違法犯罪問題

不論是爬取公開信息,還是爬取非公開信息,都有可能構成違法犯罪。爬蟲主要涉及的違法犯罪問題如下:

爬蟲非法侵入國家事務、國防建設、尖端科學技術領域的計算機信息系統的,可能構成「非法侵入計算機信息系統罪」;爬蟲規避網站經營者設置的反爬蟲措施非法獲取信息的,可能涉嫌「非法獲取計算機信息系統數據罪」;如幹擾被爬網站正常運營的,可能構成「破壞計算機信息系統罪」;如果是提供專門用於侵入、非法控制計算機信息系統的爬蟲,或者明知他人實施侵入、非法控制計算機信息系統的違法犯罪行為而為其提供爬蟲,可構成「提供侵入、非法控制計算機信息系統程序、工具罪」。

此外,雖然是爬取公開信息,但利用爬蟲程序非法從同類企業網站獲取公開信息(如評論信息),並用於自己網站進行宣傳的,可能構成不正當競爭、虛假宣傳、虛假廣告等違法犯罪行為。

對於爬取非公開信息的(如公民的姓名、身份證件號碼、通信通訊聯繫方式、住址、帳號密碼、財產狀況、行蹤軌跡等個人信息),有可能構成非法獲取公民個人信息的違法、犯罪;如將該非法獲取的公民信息無償提供或出售給他人,又可能構成非法提供公民個人信息犯罪。

相關焦點

  • 「爬蟲」相關罪名分析(下篇)——爬蟲相關商業模式的刑事合規
    一、與「爬蟲」相關的商業模式企業與外部、企業內部之間存在各種各樣的交易關係和連接方式,人們將此成為商業模式。舉例來說,代工的工廠通過代工賺錢,律師通過提供法律服務賺錢,金融機構通過資金存貸賺取利差營利,軟體開發公司通過開發軟體賺錢;再如傳銷,其商業模式就是通過收取人頭費賺錢,本身就是一種非法甚至犯罪的商業模式;再如民間借貸,其以出藉資金賺取利息為商業模式,少量的民間借貸暫不為法律所禁止,而以從事民間借貸為業的行為,根據最新的司法解釋,可能構成非法經營罪。
  • 乾貨|玩「爬蟲」可能觸犯的三宗罪
    02數據爬蟲主要涉及的三類罪名對爬蟲技術應用不當的企業,可能涉及的罪名有三個:一、侵犯公民個人信息罪1.爬取的數據信息屬於公民個人信息範疇公民個人信息,是指以電子或者其他方式記錄的,能夠單獨或者與其他信息結合識別特定自然人身份
  • 【法學匯】網絡爬蟲的入罪標準與路徑研究
    網絡爬蟲(Web Crawler),又稱網絡蜘蛛或者網絡機器人,是一種按照一定規則自動抓取網際網路信息的程序。在大數據時代,網絡爬蟲已成為網際網路抓取公開數據的常用工具之一,可以實現對文本、圖片、音頻、視頻等網際網路信息的海量抓取。網絡爬蟲相關訴訟糾紛引發了學界在私法層面對大數據權益屬性、權益分配的諸多法律爭議,以及在公法層面對網絡爬蟲刑法規制路徑的諸多探討。
  • 【耿檢轉播】【法學匯】網絡爬蟲的入罪標準與路徑研究
    網絡爬蟲(Web Crawler),又稱網絡蜘蛛或者網絡機器人,是一種按照一定規則自動抓取網際網路信息的程序。在大數據時代,網絡爬蟲已成為網際網路抓取公開數據的常用工具之一,可以實現對文本、圖片、音頻、視頻等網際網路信息的海量抓取。網絡爬蟲相關訴訟糾紛引發了學界在私法層面對大數據權益屬性、權益分配的諸多法律爭議,以及在公法層面對網絡爬蟲刑法規制路徑的諸多探討。
  • 網貸領域爬蟲,既非原罪者也非無辜者
    而通過分析爬蟲的工作原理可得,不法獲取信息和獲取信息後的不當利用與爬蟲本身並無直接因果關係,爬蟲在上述過程中充當的只是一個中立的步驟角色。不過,網貸爬蟲也面臨相關法律風險。在刑法上可能構成網絡犯罪的幫助犯,此外即使獲得了信息授權,也可能因無效授權而侵犯用戶權益。在關涉第三方時,爬蟲被授權獲取的信息可能涉及合同違約和侵權等法律責任。所以法律仍應對爬蟲充分關注,網貸爬蟲從業者也需做好合規工作。
  • 一文讀懂個人信息爬蟲技術合規風險—基於爬蟲相關侵權案件的梳理
    一、爬蟲的定義網絡爬蟲(Web Crawler)(簡稱"爬蟲"),也被稱為網絡蜘蛛、蜘蛛爬蟲(Web Spider)或網絡機器人(Web Robot),是網際網路時代一項運用非常普遍的網絡信息搜索技術。
  • 爬蟲學得好,監獄進得早——兼談遊戲推廣中如何合法使用爬蟲技術
    要說爬蟲技術為何會被查處,筆者認為應當從如何使用該技術、技術採集的是什麼內容兩方面進行分析。robtes.txt,也稱為爬蟲協議、機器人協議等,全稱是「網絡爬蟲排除標準」(Robots Exclusion Protocol),是國際網際網路界為了兼顧保障搜索技術服務於人類,逐步確立起的通行的道德規範。
  • 爬蟲爬的好,牢飯吃到飽?
    程式設計師張強(化名),回憶起這兩天來的經歷,仍心有餘悸。張強,在一家大數據風控公司擔任爬蟲工程師,每當看到網上的段子,爬蟲學得好,監獄進得早,他總是莞爾一笑,心想:關我毛事啊,我只是個程式設計師,要坐牢也是老闆去坐吧,我又沒拿數據去賣錢。
  • Python爬蟲是什麼意思有啥用 python爬蟲原理實例介紹
    但什麼是爬蟲,如何利用爬蟲為自己服務,這些在ICT技術小白聽起來又有些高入雲端。不用愁,下面一文帶你走近爬蟲世界,讓即使身為ICT技術小白的你,也能秒懂使用Python爬蟲高效抓取圖片。  什麼是專用爬蟲?  網絡爬蟲是一種從網際網路抓取數據信息的自動化程序。
  • Python——爬蟲
    一、什麼是網絡爬蟲在隨著大數據時代的到來,網絡爬蟲在網際網路中的地位也越來越重要。而網際網路中的數據是海量存在的,那麼我們如何自動高效地獲取網際網路中我們感興趣的信息並為我們所用就成了一個重要的問題,而爬蟲技術就是為了解決這些問題而產生的。
  • 爬蟲,從入門到入獄?
    由此,大數據業務的合規合法問題、爬蟲技術的合理應用問題,引起了大數據和金融科技行業的特別重視。這樣導致網上流傳一個順口溜:爬蟲玩得好,監獄進得早。數據玩得溜,牢飯吃個夠。那什麼是爬蟲呢?爬蟲技術到底違規嗎?
  • Python爬蟲很難,那是你沒有掌握爬蟲的思想,看看大神如何來分析
    我們大神們通常有一種解決思路(或者說是流程),如果你看到有些大神直接跳過了這些流程,是因為它一眼就能夠分析出這一步需不需要(也就是說,其實他還是思考過這一個步驟的,只是思考之後迅速排出了而已。)1.什麼是爬蟲爬蟲,即網絡爬蟲,大家可以理解為在網絡上爬行的一隻蜘蛛,網際網路就比作一張大網,而爬蟲便是在這張網上爬來爬去的蜘蛛咯,如果它遇到資源,那麼它就會抓取下來。想抓取什麼?這個由你來控制它咯。
  • Python 爬蟲入門
    爬蟲的作用主要有以下幾點:市場分析:電商分析、商圈分析、一二級市場分析等;市場監控:電商、新聞、房源監控、票房預測、股票分析等;商機發現:招投標情報發現、客戶資料發掘、企業客戶發現等;數據分析:對某個 App 的下載量跟蹤、用戶分析、評論分析,虛擬貨幣詳情分析……三、爬蟲基礎知識補充
  • 楊志瓊:數據時代網絡爬蟲的刑法規制 | 比較法研究202004
    私法賦權和公法規制形成了當前各國數據保護體系,這啟發我們將網絡爬蟲的司法規制建立在數據權利的譜系分析之上,而網絡爬蟲的違法性判斷恰恰源於數據主體的上述權利安排,並與數據的開放程度和訪問權限密切相關。而我國刑法對網絡爬蟲涉及的非法獲取計算機信息系統數據罪、侵犯公民個人信息罪中「行為不法」的「獲取」要件規定得過於簡單,相關司法解釋也未能給予進一步的規定,導致上述罪名對網絡爬蟲的解釋力和涵攝力大大降低而難以作出準確評價。其次,未能對不同類型數據確立不同的獲取、利用規則。數據的公開方式多種多樣,帶來的風險也不盡相同,所體現的法益侵害與責任輕重也不相同,應將數據開放與受限公開、託管訪問等進行分類保護。
  • 爬蟲入門到放棄01:什麼是爬蟲
    之前給同事普及爬蟲的時候,自己動手做了人生中的第一個PPT,所以爬蟲系列文章將圍繞著這個PPT來開展。系列結構目錄如圖,將從四個方面來介紹爬蟲。爬蟲入門:主要包括爬蟲的基本概念、技術棧、爬蟲程序的開發等。反爬技術:主要是講述常見的反爬蟲技術以及應對方法。Scrapy框架:目前最好的爬蟲框架,也是本系列文章的重點內容。
  • 精通 Python 網絡爬蟲:網絡爬蟲學習路線
    隨著大數據時代的到來,人們對數據資源的需求越來越多,而爬蟲是一種很好的自動採集數據的手段。那麼,如何才能精通Python網絡爬蟲呢?學習Python網絡爬蟲的路線應該如何進行呢?在此為大家具體進行介紹。
  • 網際網路人的法律科普課之用「爬蟲」真的合法麼?
    除了傳統模式,信息管理人員的違法洩漏外,更多的是通過爬蟲技術,爬取你在網上留下的痕跡,然後進行分析和利用。數據時代,爬蟲技術水漲船高。但是,你手頭的爬蟲工作真的合法嗎?我想,這是很多人關心的問題。我的一個朋友小瑞就遇到過這樣的事情。他跟朋友合夥開發了一個軟體,提供免費的視頻觀看服務。視頻從哪兒來的呢?
  • 網絡爬蟲違法?扯!繼續學習我的第一個爬蟲
    隨著資訊時代的迭代更新,人工智慧的興起,Python程式語言也隨之被人們廣泛學習,Python數據分析、Python web全棧、Python自動化運維等等都很受歡迎,其中還包括了Python爬蟲。但是很對人覺得Python爬蟲是違法的行為,也在懷疑自己到底要不要學爬蟲,之前有一篇文章特別火,就是《 只因寫了一段爬蟲,公司200多人被抓!》
  • Python爬蟲與文本分析應用案例研討會
    會議主題Python爬蟲與文本分析應用案例研討會   會議目標   本課程將主要講解Python爬蟲技術採集數據,並使用文本分析的技術來解決一些市場研究,尤其是產品研究中的一些具體問題,比如產品提及、產品評價、品牌形象等。
  • 寫一段Python爬蟲前,需要準備什麼?
    了解爬蟲的工作原理爬蟲呢,其實就是模仿正常瀏覽者去自動獲取站點中我們需要的數據,對數據進行處理,方便以後的分析或別的用途。模仿正常瀏覽者,就需要知道正常的瀏覽者都帶有什麼標示,都有什麼習慣。直接訪問伺服器接口後,對數據進行結構分析(多試試不同條件下同一接口的數據結構),對每個欄位進行分析,得到每個欄位的含義。進行json=》對象的轉換後,我們就可以提取到有用的信息。