平常生活中,我們經常會接到一些騷擾電話,開口就是「張先生」、 「李女士」,接著就是「您想看看XX的房源嗎? 」、 「您需要XX的汽車售後服務嗎? 」,不僅知道你的姓名、電話,連你最近的行程記錄都了如指掌。
因為這些人神機妙算嗎?當然不是,自然是信息和數據的問題。除了傳統模式,信息管理人員的違法洩漏外,更多的是通過爬蟲技術,爬取你在網上留下的痕跡,然後進行分析和利用。數據時代,爬蟲技術水漲船高。但是,你手頭的爬蟲工作真的合法嗎?我想,這是很多人關心的問題。
我的一個朋友小瑞就遇到過這樣的事情。他跟朋友合夥開發了一個軟體,提供免費的視頻觀看服務。視頻從哪兒來的呢?他們購買了愛奇藝的VIP帳號,然後爬蟲所有的視頻並下載下來,再放到他們的軟體上免費看。視頻不收費,那麼收益從哪裡來呢?自然是軟體流量的廣告費用。
小瑞他們心裡美滋滋,覺得自己只是「分享」愛奇藝的視頻,應該不算違法。這豈不是既不犯法、又能賺錢的美事兒?正準備繼續大幹一場時,他們收到了愛奇藝的律師函,小瑞這才慌了。
那麼,小瑞當初的想法到底對不對呢?
用VIP帳號爬蟲了視頻資源分享,並不直接賣錢,會違法嗎?
如果未經授權獲取信息,合法嗎?
如果信息是公開免費的,就一定可以爬蟲獲取嗎?
再或者是,合法爬取的信息,就可以任意使用了嗎?
這些「如果」,應該也是你很關心的問題。同樣的,我們先來學幾個可能涉及的法律知識,再來分析這些情況。
法律知識
首先我來解釋跟信息相關的兩個重要概念。
開頭說到的騷擾電話,主要是因為獲取了我們的一些個人信息,也就是法律上所講的「公民個人信
息」。公民個人信息,指以電子或者其他方式記錄,能單獨或結合其他消息,識別出某人身份或者反映某人活動情況的信息,包括姓名、身份號碼、各種聯繫方式、住址、帳號密碼、財產狀況和行蹤軌跡等。
第二個概念,侵犯公民個人信息罪,任何單位和個人,違反國家有關規定,獲取、出售或者提供公民個人信息,情節嚴重的,都構成犯罪。而且罪名判定跟是否獲利無關,只要你提供給了別人,不管你有沒有獲利,情節嚴重的都屬於刑事犯罪。
如果是在履行職責或者在提供服務的過程中,獲取到的個人信息,再出售或者提供給別人,更是會從重處罰。
接下來,我們來看商業方面的一個概念,不正當競爭。不正當競爭的定義來自於《反不正當競爭法》,指經營者違反本法規定,損害其他經營者的合法權益,擾亂社會經濟秩序的行為。
需要注意的是,不正當競爭的定罪對象是「經營者」,不管你是否有合法的營業執照,只要從事商品經營或者營利性服務的單位和個人,都屬於這個範圍。
情景分析
回過頭來看我們開頭說到的兩個例子。第一個,騷擾電話的信息問題。這些信息的獲得,除了傳統模式,也就是管理人員的違法洩漏外,更多的是利用網站漏洞,通過爬蟲獲取,然後傳播或者出售。
這種「爬蟲」的出發點就是為了獲利,被不法分子用來推銷或詐騙,而且信息本身也都屬於隱私,顯然構成了侵犯公民個人信息罪。
事實上,作為開發者,如果你明知別人讓你編寫程序,是為了套取信息獲利,你可能構成共犯;如果你自己爬取信息,然後賣給詐騙犯罪份子,甚至可能會成為詐騙的共犯,更加嚴重。
根據最新的司法解釋,定罪門檻大幅降低。一般人提供50條高度敏感信息就可以定罪,如果是從事金融、電信、醫療等部門的人員,提供工作中獲得的高度敏感信息的, 25條就夠定罪了。基本上觸碰獲利就可能構成犯罪,所以作為技術人員,提供技術服務還是要有足夠的警覺啊。
第二個,小瑞的故事。小瑞用軟體傳播愛奇藝的付費視頻,利用的是愛奇藝的市場資源。他們基本不用付出什麼成本,就憑藉著提供跟愛奇藝相同的視頻體驗,獲得了內容上的競爭優勢。
他們雖然沒有直接把視頻賣錢,但是未經愛奇藝的授權獲取了視頻資源,並且他們獲得的流量和廣告費用,也都是基於這種優勢。這種行為顯然違背了誠實公平的商業倫理,也破壞了市場秩序,搶佔了愛奇藝的市場機會,損害其利益。所以小瑞他們的行為已經屬於不正當競爭。
當然,因為小瑞軟體的規模和流量還比較小,所以愛奇藝在勒令停止後,並沒有進一步的追責。其實正是愛奇藝的及時發現並制止的行為,挽救了小瑞。小瑞如果不剎車,接下來的行為就可能涉嫌犯罪了(比如侵犯著作權罪,這個會在專欄裡專門講述)。
事實上,不是所有人都像小瑞這麼幸運,一些知名公司已經因為數據信息問題被告上了法庭,也有很多人為此承擔刑事責任。
思維「法」寶
爬蟲在我看來,本質仍是一種工具,一種用機器人代替人手操作、搜集信息提高效率的工具。既然是工具,就像我在前面說到過的「菜刀無罪」的例子,技術本身沒問題。究竟是怎麼獲取到的數據,獲取數據範圍是什麼,以及把數據用來做什麼,才是爬蟲與信息的合法性問題的關鍵。
那麼,根據《中華人民共和國網絡安全法》和一些相應的案例,在這裡簡單總結一下我的看法。
第一,如果你爬取信息,嚴格遵守「Robots協議」,沒有任何越權的行為,搜集的也是公開可以查詢的非隱私級的信息。那麼,你的行為基本不會違法。其實很多網站也很希望數據被抓取,比如被百度或
者Google的爬蟲採集。
另外,需要強調的是, 「Robots協議」本身並沒有法律效力,但在行業內大家基本都會遵守,法院的判案也越發看重這一點。所以這類爬蟲不難理解,沒有惡意,也並不攫取非公開類的信息,雖然有時會遭到反感,但是並不違法,也是網際網路發展必須的技術。
第二,如果你爬蟲獲取信息,是為了證明被爬公司的數據造假,其獲取的數據也都是通過公開渠道可以查詢的,那麼,在獲取信息後公布於眾的行為並不違法,也不侵犯被爬公司的民事權益。但是,如果你爬取公開免費的信息,是用來進行違法操作,比如造假、誹謗等,就有隱患了。
第三,如果你利用爬蟲獲取其他公司的公開信息數據,用於自身公司的經營。而被爬公司的信息是投入了大量人力、財力,經過常年積累獲得的,並且被爬公司本身也採取了反爬措施。這種情況下,雖然信息是公開的,但信息本身具有較高的商業價值,能夠給使用者帶來商業利益,此時的爬蟲也是違法的。
第四,如果你未經平臺授權,強行突破反爬措施,導致被爬網站的運行受到嚴重影響,這種行為明顯是違法的,這裡涉及的就是我們上一個技術篇講到的破解犯罪了。
第五,如果你是第三方應用,想要通過開放平臺獲取用戶信息時,更要注意授權問題。從用戶對平臺的授權、平臺對第三方的授權、再到用戶對第三方的授權,三重關卡都要通過才合法。
這些都是常見的爬蟲使用和獲取信息的問題。其實,除了技術人員的非法獲取,我們自身信息被洩露的情況很是惡劣,購房信息、網購信息、住宿記錄、車輛信息等都可能會遇到。
我們也要增強個人信息的保護意識,比如:
不要隨便點擊電腦或者手機上的陌生連結;
網購時儘量使用化名,丟棄外包裝時,儘量消除上面的個人信息;
不要隨意辦理會員,如果不是特別正規或者沒有很大的優惠,儘量不要辦理。
雖然網絡讓生活越發透明,但還是希望你能保護好自己的隱私,也不要用技術去侵犯他人的隱私和商業秘密。對於今天所學,你有哪方面特別深刻的經歷和體會嗎?歡迎留言和分享,也歡迎你轉發給身邊的朋友。