網際網路人的法律科普課之用「爬蟲」真的合法麼?

2020-08-28 架構管理馬車夫


平常生活中,我們經常會接到一些騷擾電話,開口就是「張先生」、 「李女士」,接著就是「您想看看XX的房源嗎? 」、 「您需要XX的汽車售後服務嗎? 」,不僅知道你的姓名、電話,連你最近的行程記錄都了如指掌。

因為這些人神機妙算嗎?當然不是,自然是信息和數據的問題。除了傳統模式,信息管理人員的違法洩漏外,更多的是通過爬蟲技術,爬取你在網上留下的痕跡,然後進行分析和利用。數據時代,爬蟲技術水漲船高。但是,你手頭的爬蟲工作真的合法嗎?我想,這是很多人關心的問題。

我的一個朋友小瑞就遇到過這樣的事情。他跟朋友合夥開發了一個軟體,提供免費的視頻觀看服務。視頻從哪兒來的呢?他們購買了愛奇藝的VIP帳號,然後爬蟲所有的視頻並下載下來,再放到他們的軟體上免費看。視頻不收費,那麼收益從哪裡來呢?自然是軟體流量的廣告費用。

小瑞他們心裡美滋滋,覺得自己只是「分享」愛奇藝的視頻,應該不算違法。這豈不是既不犯法、又能賺錢的美事兒?正準備繼續大幹一場時,他們收到了愛奇藝的律師函,小瑞這才慌了。

那麼,小瑞當初的想法到底對不對呢?

用VIP帳號爬蟲了視頻資源分享,並不直接賣錢,會違法嗎?

如果未經授權獲取信息,合法嗎?

如果信息是公開免費的,就一定可以爬蟲獲取嗎?

再或者是,合法爬取的信息,就可以任意使用了嗎?

這些「如果」,應該也是你很關心的問題。同樣的,我們先來學幾個可能涉及的法律知識,再來分析這些情況。

法律知識

首先我來解釋跟信息相關的兩個重要概念。

開頭說到的騷擾電話,主要是因為獲取了我們的一些個人信息,也就是法律上所講的「公民個人信

息」。公民個人信息,指以電子或者其他方式記錄,能單獨或結合其他消息,識別出某人身份或者反映某人活動情況的信息,包括姓名、身份號碼、各種聯繫方式、住址、帳號密碼、財產狀況和行蹤軌跡等。

第二個概念,侵犯公民個人信息罪,任何單位和個人,違反國家有關規定,獲取、出售或者提供公民個人信息,情節嚴重的,都構成犯罪。而且罪名判定跟是否獲利無關,只要你提供給了別人,不管你有沒有獲利,情節嚴重的都屬於刑事犯罪。

如果是在履行職責或者在提供服務的過程中,獲取到的個人信息,再出售或者提供給別人,更是會從重處罰。

接下來,我們來看商業方面的一個概念,不正當競爭。不正當競爭的定義來自於《反不正當競爭法》,指經營者違反本法規定,損害其他經營者的合法權益,擾亂社會經濟秩序的行為。

需要注意的是,不正當競爭的定罪對象是「經營者」,不管你是否有合法的營業執照,只要從事商品經營或者營利性服務的單位和個人,都屬於這個範圍。

情景分析

回過頭來看我們開頭說到的兩個例子。第一個,騷擾電話的信息問題。這些信息的獲得,除了傳統模式,也就是管理人員的違法洩漏外,更多的是利用網站漏洞,通過爬蟲獲取,然後傳播或者出售。

這種「爬蟲」的出發點就是為了獲利,被不法分子用來推銷或詐騙,而且信息本身也都屬於隱私,顯然構成了侵犯公民個人信息罪。

事實上,作為開發者,如果你明知別人讓你編寫程序,是為了套取信息獲利,你可能構成共犯;如果你自己爬取信息,然後賣給詐騙犯罪份子,甚至可能會成為詐騙的共犯,更加嚴重。

根據最新的司法解釋,定罪門檻大幅降低。一般人提供50條高度敏感信息就可以定罪,如果是從事金融、電信、醫療等部門的人員,提供工作中獲得的高度敏感信息的, 25條就夠定罪了。基本上觸碰獲利就可能構成犯罪,所以作為技術人員,提供技術服務還是要有足夠的警覺啊。

第二個,小瑞的故事。小瑞用軟體傳播愛奇藝的付費視頻,利用的是愛奇藝的市場資源。他們基本不用付出什麼成本,就憑藉著提供跟愛奇藝相同的視頻體驗,獲得了內容上的競爭優勢。

他們雖然沒有直接把視頻賣錢,但是未經愛奇藝的授權獲取了視頻資源,並且他們獲得的流量和廣告費用,也都是基於這種優勢。這種行為顯然違背了誠實公平的商業倫理,也破壞了市場秩序,搶佔了愛奇藝的市場機會,損害其利益。所以小瑞他們的行為已經屬於不正當競爭。

當然,因為小瑞軟體的規模和流量還比較小,所以愛奇藝在勒令停止後,並沒有進一步的追責。其實正是愛奇藝的及時發現並制止的行為,挽救了小瑞。小瑞如果不剎車,接下來的行為就可能涉嫌犯罪了(比如侵犯著作權罪,這個會在專欄裡專門講述)。

事實上,不是所有人都像小瑞這麼幸運,一些知名公司已經因為數據信息問題被告上了法庭,也有很多人為此承擔刑事責任。

思維

爬蟲在我看來,本質仍是一種工具,一種用機器人代替人手操作、搜集信息提高效率的工具。既然是工具,就像我在前面說到過的「菜刀無罪」的例子,技術本身沒問題。究竟是怎麼獲取到的數據,獲取數據範圍是什麼,以及把數據用來做什麼,才是爬蟲與信息的合法性問題的關鍵。

那麼,根據《中華人民共和國網絡安全法》和一些相應的案例,在這裡簡單總結一下我的看法。

第一,如果你爬取信息,嚴格遵守「Robots協議」,沒有任何越權的行為,搜集的也是公開可以查詢的非隱私級的信息。那麼,你的行為基本不會違法。其實很多網站也很希望數據被抓取,比如被百度或

者Google的爬蟲採集。

另外,需要強調的是, 「Robots協議」本身並沒有法律效力,但在行業內大家基本都會遵守,法院的判案也越發看重這一點。所以這類爬蟲不難理解,沒有惡意,也並不攫取非公開類的信息,雖然有時會遭到反感,但是並不違法,也是網際網路發展必須的技術。

第二,如果你爬蟲獲取信息,是為了證明被爬公司的數據造假,其獲取的數據也都是通過公開渠道可以查詢的,那麼,在獲取信息後公布於眾的行為並不違法,也不侵犯被爬公司的民事權益。但是,如果你爬取公開免費的信息,是用來進行違法操作,比如造假、誹謗等,就有隱患了。

第三,如果你利用爬蟲獲取其他公司的公開信息數據,用於自身公司的經營。而被爬公司的信息是投入了大量人力、財力,經過常年積累獲得的,並且被爬公司本身也採取了反爬措施。這種情況下,雖然信息是公開的,但信息本身具有較高的商業價值,能夠給使用者帶來商業利益,此時的爬蟲也是違法的。

第四,如果你未經平臺授權,強行突破反爬措施,導致被爬網站的運行受到嚴重影響,這種行為明顯是違法的,這裡涉及的就是我們上一個技術篇講到的破解犯罪了。

第五,如果你是第三方應用,想要通過開放平臺獲取用戶信息時,更要注意授權問題。從用戶對平臺的授權、平臺對第三方的授權、再到用戶對第三方的授權,三重關卡都要通過才合法。

這些都是常見的爬蟲使用和獲取信息的問題。其實,除了技術人員的非法獲取,我們自身信息被洩露的情況很是惡劣,購房信息、網購信息、住宿記錄、車輛信息等都可能會遇到。

我們也要增強個人信息的保護意識,比如:

不要隨便點擊電腦或者手機上的陌生連結;

網購時儘量使用化名,丟棄外包裝時,儘量消除上面的個人信息;

不要隨意辦理會員,如果不是特別正規或者沒有很大的優惠,儘量不要辦理。

雖然網絡讓生活越發透明,但還是希望你能保護好自己的隱私,也不要用技術去侵犯他人的隱私和商業秘密。對於今天所學,你有哪方面特別深刻的經歷和體會嗎?歡迎留言和分享,也歡迎你轉發給身邊的朋友。

相關焦點

  • 網際網路人的法律科普課之非法集資真的離我們身邊很遠麼
    非法吸收公眾存款罪非法吸收公眾存款,也就是俗稱的「非吸」,是指沒有經過中國人民銀行批准,面向社會大眾而不是特定的人吸收資金,並且出具憑證,承諾會在一定期限內,還本金、付利息,或是支付其他有價值的財產。也就是說,你想要向社會大眾徵集錢財,必須要有中國人民銀行的批准,才是合法的。另外注意,這裡說到的是中國人民銀行,可不是中國銀行或者其他哪家銀行。
  • 網際網路人的法律科普課之假結婚假離職的風險你真的了解麼
    如果不是親自辦案,我也想不到,這樣的小聰明會被用在法律上。真證件、假意願的結婚離婚上面我們說的是假證的情況,其實身邊人裡,無知或者自以為是到去挑戰假證的並不太多,更常見的可能是,我們所說的真證件、假意願的情況,也就是帶引號的「假」結婚、離婚問題。我們都知道,在法律上只有真證、假證的問題,其實並不存在結婚和離婚的真假之說。
  • 網際網路人的法律科普課之你真的了解遺產繼承麼?
    同樣的,我們要先了解一下,遺產繼承相關的幾個法律概念。法律知識繼承我們首先來看「繼承」這個概念。某人死亡後,把自己的財產、債務、可以世襲的官位等轉移給別人,就叫做繼承。在繼承中,死亡的這個人叫做被繼承人,被轉移的東西也就是我們通常所說的遺產,而繼承遺產的也就是繼承人。繼承人可以是一人,也可以是多個人。
  • 網際網路人的法律科普課你真的知道清楚「受賄」的界定範圍麼
    後來,由於對結果不滿意,老張的行為被其中一個賄賂的人揭發,還告上了法庭。老張的行為其實並不少見,甚至不少人習以為常,覺得沒什麼。那麼,法律究竟是怎麼規定的呢?老張到底會受到什麼懲罰呢?老規矩,我們先來了解一些基本的法律知識。
  • 網際網路人的法律科普課之瀏覽黃色動作片違法麼?
    在網際網路剛興起那幾年,有一句流傳很廣的話:在網際網路上,沒人知道你是一條狗。不過,網絡從來不是法外之地。一旦涉及色情內容,相關人員可能會犯這些罪:傳播淫穢物品罪、傳播淫穢物品牟利罪、賭博罪、詐騙罪等等。是不是聽起來很嚇人?就比如說,我們今天的主人公小趙。小趙是個微信重度使用者,本人特別活潑,善於交際。為了方便跟同事的交流,他建了一個同事微信群。
  • 爬蟲學得好,監獄進得早——兼談遊戲推廣中如何合法使用爬蟲技術
    爬蟲技術的使用不僅僅在風控行業,據筆者了解,遊戲行業在推廣產品時亦會使用爬蟲技術獲取用戶信息,了解用戶喜好,從而提高遊戲推廣的精準度。本文主要討論運用爬蟲技術抓取數據行為的法律邊界,兼談遊戲行業在推廣中應如何合法使用爬蟲技術。
  • 網際網路人的法律科普課之信用卡的透支和盜刷,你真的清楚麼
    不過,雖然每天會用到,你真的清楚了解它的規則和風險嗎?我估計答案是否定的,畢竟每年的銀行卡糾紛案子,可真不少見。使用規則主要涉及經濟領域,我就不多說了,我今天想講的,正是銀行卡的風險和法律問題,畢竟保管不善或者使用不當,都可能讓你的銀行卡陷入危機。正式開講之前,我想先糾正一種常見的錯誤看法,就是那些認為銀行卡一旦被盜刷,很難被追回的觀點。
  • 網際網路人的法律科普課之「套路貸」就在你我身邊,你留意過麼?
    其實,套路貸這個詞,並不是法律上的概念,只不過太常見了,我們就起了這麼個名字來稱呼。在我看來,套路貸的重點在於惡劣的套路,說白了就是這麼幾個特點:打著「民間借貸」的旗號;用無抵押、放款快、低利息等名義吸引客戶;用虛增債務、虛假資金流水、虛假借款手續、虛假訴訟、暴力威脅催收款等套路;結果一定是,大量侵吞借款人的財產。
  • 一段爬蟲引起的風暴,大數據公司史上最大「危機」
    真的是應了最近網上流傳的那句話:「爬蟲玩得好,監獄進得早。數據玩得溜,牢飯吃個夠。」不過這句話並非是危言聳聽,畢竟前車之鑑就擺在那裡,被有關部門請過去喝茶的也不是小人物。前些天有一篇《只因為寫了一段爬蟲,公司200多人被抓!》
  • 解密遊走於法律邊緣的爬蟲技術
    一位接近監管層的人士向《中國新聞周刊》透露,「如何界定個人數據的法律性質,仍然是一個需要探討的問題。」   暫停爬蟲業務   這一輪強監管從深圳、杭州、上海等地開始,已經迅速席捲了整個大數據風控行業。整頓力度之大,令業內和相關合作方人人自危。
  • python-做爬蟲,如何避免牢獄之災
    隨著數據資源的爆炸式增長,網絡爬蟲的應用場景和商業模式變得更加廣泛和多樣,網絡爬蟲技術為數據收集者提供了極大的便利,也給專業網絡爬蟲公司帶來巨大的收益。但是與之相伴的是許多人好奇的一件事——爬蟲是否違法?
  • 網貸領域爬蟲,既非原罪者也非無辜者
    在《信息授權服務協議》中,51平臺可以通過電商平臺等獲取用戶聯繫人地址。因此,即使爬蟲為上述活動提供了一定條件,也是在用戶授權範圍內進行的,該過程在形式上是合法的。可能構成犯罪行為的是獲得信息後採取的傷害、滋擾等活動,而並非獲取信息本身的行為。不過該授權是否合法有效,以及在無合法授權的情況下是否構成其他網絡犯罪的幫助犯,本文將在下面詳細分析。2. 非法侵入系統並非爬蟲之罪。
  • 網際網路人的法律科普課之拖欠工資以破壞源碼刪庫報復行為違法麼
    「從刪庫到跑路」,大概是技術人,無人不知無人不曉的段子。你可能會心一笑,可能哈哈大笑,但是,這個幾秒鐘的簡單操作,真的能像玩笑那麼輕鬆嗎?當然不。你可能覺得這是玩笑,但是國外真有人這麼幹過。荷蘭的一家雲主機商Verelox,就曾經歷過這樣的慘劇,離職工程師把客戶資料庫給刪了,公司幾經修復,也不能恢復全部數據,最終造成了巨大的損失。
  • 網絡爬蟲違法?扯!繼續學習我的第一個爬蟲
    2019年不管是程式語言排行榜還是在網際網路行業,Python一直備受爭議,到底是Java熱門還是Python熱門也是一直讓人爭吵的話題
  • 知名數據公司被查,你的爬蟲會送老闆進監獄嗎?
    圖片來自 pexels以上是前幾天技術圈傳播的一則新聞,又一家數據公司被調查,很多數據從業者、爬蟲開發者發出了「感嘆」 —— 「爬蟲用得好,XX 進得早;數據玩得溜,XX 吃個夠」。爬蟲作為一種計算機技術,具有技術中立性,爬蟲技術在法律上從來沒有被禁止。
  • 網際網路時代的到來,爬蟲的危害又有哪些,你知道嗎?
    現如今我們全球都已經開始正是步入網際網路時代了,我們的生活也是因為網際網路的出現變得更加美好,但是有很多人對網際網路都有非常厭煩的共同點,那就是網際網路上面出現的那一些廣告,還有就是自己的信息經常都會被洩露出去,這就是所有人都非常頭疼的事情了,雖然網際網路確實給我們帶來了非常多的便利事情,但是你們對於網際網路本身的缺陷又有多少了解呢
  • 網絡爬蟲——Requests,GET和POST
    (一)、爬蟲背後的法律風險我們都知道在爬取網上數據時,爬取個人信息是不合法的。2、合法收集使用個人信息: 網絡運營者收集、使用個人信息,應當遵循合法、正當、必要的原則,公開收集、使用 規則,明示收集、使用信息的目的、方式和範圍,並經被收集者同意。不得收集與其提供的 服務無關的個人信息,不得違反法律、行政法規的規定和雙方的約定收集、使用個人信息, 並應當依照法律、行政法規的規定和與用戶的約定,處理其保存的個人信息。
  • 爬蟲行業史
    爬蟲真的是「爬到你底褲都不剩」?自由和暴富,你選哪個?如果你搜索爬蟲技術,知乎上一個「零基礎如何學爬蟲技術」的問答,瀏覽達到了120多萬的瀏覽量。網際網路公司需要用到大量的數據分析,那這些數據哪裡來?總不能是員工一個指頭一個指頭敲出來的吧。這就用到了爬蟲技術。最簡單的理解就是:利用機器模擬人的行為抓取網絡數據。所以說,爬蟲就是一門成熟的技術而已。
  • 網際網路人的法律科普課之酒駕為什麼量刑那麼重
    這是對法律有多大的誤會啊,才會覺得「救命酒」能鑽得了法律的空子。我估計不少人都聽過這樣的法子,甚至有人實踐。事實上,如果你酒駕被查住後,當著警察的面喝酒,真的能躲過處罰嗎?如果不能,又會怎樣呢?我們需要先來了解最基本的幾個法律知識。法律知識2011年的5月1日,對很多酗酒分子並不那麼友好。因為《刑法》再一次修正了,因為醉酒駕車正式入刑了。
  • Python爬蟲大數據採集與挖掘教與學(教學大綱)
    教學內容安排 (按32學時共計16周,具體到每節課內容):第一周:第1節課:網際網路大數據採集概念、重要性、應用現狀等;第2節課:網際網路大數據採集的技術體系、法律與技術邊界、技術展望。第二周:第1節課:HTML語言規範;第2節課:網頁編碼、正則表達式。第三周:第1節課:Web伺服器、應用架構、Robots;第2節課:HTTP協議、狀態保持技術。