【耿檢轉播】【法學匯】網絡爬蟲的入罪標準與路徑研究

2020-09-14 耿馬檢察

網絡爬蟲(Web Crawler),又稱網絡蜘蛛或者網絡機器人,是一種按照一定規則自動抓取網際網路信息的程序。在大數據時代,網絡爬蟲已成為網際網路抓取公開數據的常用工具之一,可以實現對文本、圖片、音頻、視頻等網際網路信息的海量抓取。網絡爬蟲相關訴訟糾紛引發了學界在私法層面對大數據權益屬性、權益分配的諸多法律爭議,以及在公法層面對網絡爬蟲刑法規制路徑的諸多探討。對網絡爬蟲的刑法規制既影響到當前數據產業的資源利用和技術創新,也影響到國家決策層對數據行業的政策制定。因此,以何種標準、何種路徑來確定網絡爬蟲的入罪範疇,是當前我國數字經濟發展亟須解決的難題。



網絡爬蟲的危害性

網絡爬蟲雖具有技術中立性,但在目前的數據產業中仍涉及多重法律風險,主要體現在:


1.技術風險:抓取太快或太頻繁易導致ICP(網絡內容服務商)網站擁堵,影響伺服器正常運行甚至導致伺服器癱瘓,或者重複抓取相同文件易耗費伺服器資源等,因此產生了一些協議來緩和網絡爬蟲的抓取行為,告知搜尋引擎所允許和禁止抓取的範圍。當前,「爬蟲協議」成為國內外網際網路行業普遍遵循的技術規範。


2.法益侵害風險:抓取ICP網站管理後臺等內部數據易侵犯個人信息、商業秘密等數據信息安全。美國公眾輿論研究協會的研究報告指出,網絡爬蟲的數據抓取行為對數據所有權、數據管理、數據收集權、隱私保護以及其他數據保護提出了政策挑戰。這主要表現在:


(1)政府使用網絡爬蟲抓取個人數據侵害公民憲法權利。由於網絡爬蟲可以輕鬆抓取顯示網絡用戶政治、宗教和其他觀點的數據信息,一些國外政府機構已經採用網絡爬蟲來收集網絡論壇、個人博客、Twitter、Facebook和Tumblr等社交網站或Craigslist等公告板的數據,甚至從集會團體的網站收集數據來確定集會者的數量,並識別、追蹤特定集會者等。這些行為都可能侵犯公民受憲法保護的言論自由、結社自由甚至隱私權等。


(2)數據公司或研究機構使用網絡爬蟲抓取用戶個人數據,侵犯了用戶的隱私權、信息權等。不少數據企業從個人博客、社交媒體網站、論壇和其他用戶可以談論、公開其身份或偏好的網站收集大量用戶數據信息,但很少有規則來說明可以抓取什麼、何時何地抓取以及如何存儲、利用所抓取的用戶數據。



網絡爬蟲入罪的判斷標準

網絡爬蟲入罪的關鍵在於訪問、抓取數據行為是否獲得許可、授權,「未經授權」或者「超越授權」訪問、抓取數據可能侵犯網絡安全或者各類數據安全。網絡爬蟲客觀上有突破數據保護措施的行為,行為人主觀上有突破數據保護措施的故意,這是網絡爬蟲入罪的基本標準。


不法判斷

未經授權或超越授權


「未經授權」是指網絡爬蟲根本就沒有獲得數據網站的授權機制許可;「超越授權」是指網絡爬蟲超越了被授權範圍訪問、獲取數據,包括平行越權、垂直越權。其中,平行越權是指一個網絡用戶越權訪問了另一個網絡用戶才能訪問的資源;垂直越權是指低權限角色的用戶獲得了高權限角色所具備的權限,典型的是黑客通過修改Cookie或者參數中隱藏的標誌位,從普通用戶權限提升到管理員權限。


但是,對於「未經授權」或者「超越授權」不能僅作形式判斷。如果單純依據強行突破帳號登錄系統來進行入罪判斷,易導致技術授權和規範授權的判斷分歧。不能簡單地以是否需要帳號登錄來判斷網絡爬蟲是否「未經授權」。對此,還必須結合被抓取的數據類型來進行實質違法性判斷,考察網絡爬蟲抓取數據行為對法益的侵害或者威脅是否達到實質可罰的程度。


責任判斷

具有訪問、抓取數據的惡意


網絡爬蟲的入罪判斷除了考察客觀不法外,還必須對主觀罪責進行判斷,即考察主觀上是否具有突破網絡安全、數據安全保護措施並訪問、獲取相關數據的故意。網絡爬蟲可分為善意的網絡爬蟲和惡意的網絡爬蟲。善意的網絡爬蟲會遵守Robots協議,能夠增加網站的曝光度,給數據網站帶來流量;而惡意爬蟲則無視Robots協議,甚至採取破解措施對數據網站中某些深層次的、不願意公開的數據隨意抓取,導致網站伺服器過載或崩潰,影響計算機信息系統的正常運行。顯然,惡意網絡爬蟲認識到突破數據網站技術措施的行為違背了權利人的保護意願,仍基於自由意志而選擇繼續爬取數據,足以證明其具有犯罪故意。


在我國現有法律框架下,「白帽子」侵入網站並抓取數據行為的合法性備受爭議,易被認定為非法獲取計算機信息系統數據罪。「白帽子」通常不會破壞他人計算機信息系統,而是出於探索、實驗新技術等主觀目的,甚至出於善意,希望幫助他人發現和改善系統缺陷和漏洞,以提高計算機和網絡系統的安全性能。雖然「白帽子」所使用的測試軟體通常具有自動緩存數據的功能,但依行業慣例,抓取數據的行為是安全漏洞檢測必經的步驟,對於那些存在事先授權、事後認可、行業默契認可的「白帽子」抓取數據行為,因缺乏法益侵害性和主觀罪過,應依照國際慣例和國內行業規則,作為保護網絡安全的正當化事由予以出罪。



網絡爬蟲入罪的具體路徑

從技術原理來看,網絡爬蟲抓取數據涉及對計算機信息系統的訪問進入、對特定類型數據的抓取、對所獲取數據的使用三個階段,因此,網絡爬蟲的入罪路徑必須結合其具體行為進行情景化分析。


非法侵入行為可構成

非法侵入計算機信息系統罪


網絡爬蟲進入數據網站是訪問、抓取數據的前提。但如果未經授權進入涉及國家安全和國家秘密的政府內網、國防建設、尖端科學技術領域的計算機信息系統,則可構成非法侵入計算機信息系統罪。這取決於被侵入的計算機信息系統的性質以及訪問是否被授權。


非法抓取數據可能構成多種犯罪


隨著數據表徵權利客體的多樣化,網絡爬蟲未經授權或超越授權抓取數據行為,依據被抓取數據所表徵的不同法益,可構成不同罪名。


➤ 抓取「可識別性」個人數據,可構成侵犯公民個人信息罪。大數據時代,多數公民的個人信息都是以電子數據的形式存儲於計算機信息系統或者網絡之中,易被網絡爬蟲抓取。個人信息區別於普通數據的最大特徵在於其與信息主體存在某種關聯性、專屬性,能識別特定個人,具有侵犯信息自決權的隱憂。根據我國刑法第二百五十三條之一第三款規定,竊取或者以其他方法非法獲取公民個人信息的,構成侵犯公民個人信息罪。


抓取「創造性」數據可構成侵犯智慧財產權的犯罪。由於數據與智慧財產權的「無形財產」具有天然契合性,都卸下了物質載體這一「枷鎖」,以數字代碼形式儲存、利用、傳輸,因而幾乎所有的網絡智慧財產權都可以被網絡爬蟲抓取。然而,網絡智慧財產權具有不同於一般數據的典型特徵——創造性,其價值主要在於維護所有權人的專有控制力以及排他性處分、使用收益權能。未經權利人許可、授權而非法複製、下載等,可構成侵犯智慧財產權犯罪。如網絡爬蟲抓取在線小說行為可構成侵犯著作權罪。此外,通過網絡爬蟲抓取商業秘密的行為也可構成侵犯商業秘密罪。


抓取普通數據,可構成非法獲取計算機信息系統數據罪。根據刑法第二百八十五條第二款的規定,違反國家規定,侵入前款規定以外的計算機信息系統或者採用其他技術手段,獲取該計算機信息系統中存儲、處理或者傳輸的數據的行為,構成非法獲取計算機信息系統數據罪。


非法破壞計算機信息系統或數據

可構成破壞計算機信息系統罪


網絡爬蟲的技術風險還包括造成被爬取數據的網站擁堵甚至系統崩潰、對被爬取的數據進行破壞等。如果網絡爬蟲侵入計算機信息系統後,對計算機信息系統進行破壞、對數據進行破壞,或者對計算機信息系統安全措施進行暴力破解,甚至將爬蟲技術濫用為網絡攻擊方式等,都可能構成破壞計算機信息系統罪。


綜上,網絡爬蟲作為數據資源獲取和利用的重要手段,其「技術中立更多的是一種理念,現實生活中的技術通常都是行為的工具,通過技術實施的競爭行為與技術本身的中立性不能簡單畫等號。技術中立有利於技術創新,但技術創新仍有其法律邊界。」基於數據的流動性、共享性對數據的開放程度及其公共秩序的構建,成為當前我國規制網絡爬蟲的基點。


(作者劉豔紅、楊志瓊分別系東南大學法學院教授、東南大學人民法院司法大數據研究基地教授,東南大學人民法院司法大數據研究基地研究員)

(來源:最高人民檢察院微信公眾號)

相關焦點

  • 【法學匯】網絡爬蟲的入罪標準與路徑研究
    網絡爬蟲(Web Crawler),又稱網絡蜘蛛或者網絡機器人,是一種按照一定規則自動抓取網際網路信息的程序。在大數據時代,網絡爬蟲已成為網際網路抓取公開數據的常用工具之一,可以實現對文本、圖片、音頻、視頻等網際網路信息的海量抓取。網絡爬蟲相關訴訟糾紛引發了學界在私法層面對大數據權益屬性、權益分配的諸多法律爭議,以及在公法層面對網絡爬蟲刑法規制路徑的諸多探討。
  • 楊志瓊:數據時代網絡爬蟲的刑法規制 | 比較法研究202004
    【作者】 楊志瓊(東南大學法學院講師,法學博士,東南大學法學院網絡安全法治研究中心研究員)  【來源】北大法寶法學期刊庫《比較法研究》2020年第4期(文末附本期期刊要目)。因篇幅較長,已略去原文注釋。
  • Xpath語法-網絡爬蟲基礎
    前言這一章節主要講解Xpath的基礎語法,學習如何通過Xpath獲取網頁中我們想要的內容;為我們的後面學習Java網絡爬蟲基礎準備工作。備註:此章節為基礎核心章節,未來會在網絡爬蟲的數據解析環節經常使用,學會Xpath解析語法,可為未來爬蟲解析省去很多麻煩。Xpath簡介XPath即為XML路徑語言,它是一種用來確定XML(標準通用標記語言的子集)文檔中某部分位置的語言。
  • 「爬蟲」相關罪名分析(上篇)——「爬蟲」犯了什麼罪?
    近日,51信用卡也被警方調查,傳言可能涉及委託外包催收公司尋釁滋事犯罪(警方披露的信息已證實)、非法獲取公民個人信息犯罪(未經警方證實,但警方通報中「等犯罪行為」是否包括此種行為暫不可知),其中「非法獲取公民個人信息犯罪」,也涉及「爬蟲」問題,再一次把「爬蟲」問題推至風口浪尖。
  • 乾貨|玩「爬蟲」可能觸犯的三宗罪
    二、爬蟲技術只是中立的工具最近被查的大數據風控機構,都涉及爬蟲技術。一時間,網絡爬蟲技術被推到了風口浪尖。在大數據行業內被廣泛使用的網絡爬蟲技術,到底是什麼呢?其實,網絡爬蟲,是網際網路時代被普遍運用的一項網絡信息搜集技術。
  • 網絡誹謗入罪標準的細化科學合理
    原標題:網絡誹謗入罪標準的細化科學合理 隨著現代信息網絡的快速發展,網絡犯罪問題日益突出。其中,在信息網絡上捏造事實惡意損害他人名譽的網絡誹謗行為更是十分猖獗,嚴重影響了人們正常的社會生活。加強對網絡誹謗犯罪的治理勢在必行。
  • 推薦一條高效的Python爬蟲學習路徑!
    比如有的人認為學爬蟲必須精通 Python,然後哼哧哼哧系統學習 Python 的每個知識點,很久之後發現仍然爬不了數據;有的人則認為先要掌握網頁的知識,遂開始 HTMLCSS,結果入了前端的坑,瘁……但掌握正確的方法,在短時間內做到能夠爬取主流網站的數據,其實非常容易實現。但建議你從一開始就要有一個具體的目標,你要爬取哪個網站的哪些數據,達到什麼量級。
  • 精通 Python 網絡爬蟲:網絡爬蟲學習路線
    如何才能精通Python網絡爬蟲呢?學習Python網絡爬蟲的路線應該如何進行呢?在此為大家具體進行介紹。
  • 網貸領域爬蟲,既非原罪者也非無辜者
    根據上述規定,爬蟲作為一種單純獲取信息的工具,並不能構成違法的充分必要條件,需要有人身傷害和騷擾、威脅活動等犯罪行為,具有故意或過失,以及產生入罪後果才可定罪。綜上可知,警方通報的51信用卡涉及暴力催收尋釁滋事罪,與爬蟲自身關聯不大。那麼,爬蟲是否因為騷擾提供了可能條件而受譴責?通過分析51信用卡案例可得,爬蟲是在授權範圍內對用戶的信息進行搜集。
  • 爬蟲學得好,監獄進得早——兼談遊戲推廣中如何合法使用爬蟲技術
    robtes.txt,也稱為爬蟲協議、機器人協議等,全稱是「網絡爬蟲排除標準」(Robots Exclusion Protocol),是國際網際網路界為了兼顧保障搜索技術服務於人類,逐步確立起的通行的道德規範。
  • 【耿檢轉播】【法學匯】應關注對促進和解和服判息訴工作的評價
    全國民事訴訟法學研究會副會長記者就相關問題,採訪了全國民事訴訟法學研究會副會長、中國人民大學法學院教授、博士生導師湯維建。記者:開展檢察官業績考評,民事檢察工作有哪些特別之處需要給予特別關注?
  • 一文讀懂個人信息爬蟲技術合規風險—基於爬蟲相關侵權案件的梳理
    一、爬蟲的定義網絡爬蟲(Web Crawler)(簡稱"爬蟲"),也被稱為網絡蜘蛛、蜘蛛爬蟲(Web Spider)或網絡機器人(Web Robot),是網際網路時代一項運用非常普遍的網絡信息搜索技術。
  • 《法學研究》2020年總目錄
    《法學研究》2020年總目錄 1.人民法院改革取向的審視與思考 顧培東(1·3) 2.支持理論下民事訴訟當事人法律意識的實證研究 馮晶(1·27)
  • 侵犯商業秘密罪降低入罪標準!
    加大刑事打擊力度,研究降低侵犯智慧財產權犯罪入罪標準,提高量刑處罰力度,修改罪狀表述,推動解決涉案侵權物品處置等問題」。司法實踐中,隨著社會經濟發展,智慧財產權犯罪新類型案件不斷湧現,智慧財產權刑事案件,特別是侵犯商業秘密案件,爭議問題較多,亟需出臺相關司法解釋予以明確和規範。
  • 尋覓網絡法學方法論
    網絡犯罪猖獗,如何從法律上看待新興的網絡司法案件?網絡安全堪虞,如何從法律上界定網絡平臺的管理義務?結論合理與否,首先要考慮思維方法問題。思維方法的科學性一定程度上決定了結論的合理性。如何看待網絡技術、行為與法律的關係,採取何種評價網絡新事物的法學方法,這是網絡法學方法論所要解決的問題。
  • 《中國法學》2020年總目錄
    》已加入「北大法寶」法學期刊資料庫,請登錄www.pkulaw.com查看期刊全文。  湛中樂1-49  9.黨政聯合發文的信息公開困境與規則重塑:基於司法裁判的分析  張力1-67  10.論農民進城落戶後集體土地「三權」退出  高海2-30  11.現貨與期貨交易的界分標準與法律規制  吳越2-48  12.合規制度的公司法設計及其實現路徑  趙萬一2-
  • 「兩高」聯合發文調整侵犯商業秘密入罪標準
    中新社北京9月13日電 (記者 朱晨曦 張素)中國最高人民法院、最高人民檢察院13日聯合發布的一份司法解釋,將因侵犯商業秘密違法所得數額,因侵犯商業秘密導致權利人破產、倒閉等情形納入入罪門檻,並將入罪數額調整至三十萬元人民幣以上。
  • 網絡爬蟲違法?扯!繼續學習我的第一個爬蟲
    ,文章裡寫了因為一名技術人員因爬取數據被抓,那麼爬蟲真的違法嗎?今天我們來探索一下。1網絡爬蟲犯法嗎?Robots協議Robots協議(爬蟲協議)的全稱是「網絡爬蟲排除標準」(Robots Exclusion Protocol),網站通過Robots協議告訴搜尋引擎哪些頁面可以抓取,哪些頁面不能抓取。該協議是國際網際網路界通行的道德規範,雖然沒有寫入法律,但是每一個爬蟲都應該遵守這項協議。
  • 設疏忽照顧兒童罪 需嚴格入罪標準
    就必須秉持科學立法的要求,嚴格入罪標準。  最近,來自安徽的律師孔維釗關注到本地幾起兒童意外傷害案例,背後都是家長疏忽照顧所致,作為全國律協未成年人保護專業委員會委員,他呼籲在刑法中引入疏忽照顧兒童罪。  要不要對那些導致兒童意外傷害案發生的「馬大哈」家長治罪的呼聲由來已久。此番提出在刑法中設立疏忽照顧兒童罪的建議,得到了多位專家學者的支持。但要設立疏忽照顧兒童罪,就必須秉持科學立法的要求,嚴格入罪標準。
  • 網絡爬蟲(一)基礎知識
    我們今天講的爬蟲呢,其實也是一種網絡檢索,就是用一個「爬蟲」來代替我們去檢索。從爬蟲這個名字我們就可以想像到它就是通過編程實現的一隻「小蟲子」在整個網際網路上爬來爬去。我們可以編寫不同的小蟲子,讓它在網絡上替我們搜集我們想要的資源。