網絡爬蟲怎麼管?最新研究報告在滬發布,強調場景化治理

2020-12-05 澎湃新聞

被稱為「網絡爬蟲」的自動數據採集技術該如何管理?11月28日,在CIS 2019網絡安全創新大會上發布的一份《數據爬取治理報告》提供了思路。

CIS 2019網絡安全創新大會現場

《數據爬取治理報告》是上海數據治理與安全產業發展專業委員會的最新研究成果。報告指出,數據爬取作為數據採集的一種高效實現形式,是國內外諸多網際網路企業極為通常甚至賴以生存的手段。但是隨著圍繞數據自動化技術進行爬取和挖掘行為急劇增多,帶來了數據權屬、智慧財產權和商業機密保護、個人信息隱私界限、不正當競爭、計算機信息系統安全等方面巨大爭議。尤其是近期在金融、內容、電商等各類場景的數據爬取案件頻發,這一「灰色地帶」必將被提上數據治理議程,已成為非常緊迫的現實問題。

《報告》根據現實法律環境剖析了數據爬取在訪問進入、數據類型和數據使用三個環節可能的法律風險,總結髮現數據爬取治理的七大難點,並針對性提出五項治理原則,包括重視場景化治理、消除過度的數據壁壘等具備實操性的建議。最後,《報告》梳理了九個近年國內外較為典型的數據爬取司法判例,旨在給政府相關產業和監管部門、大數據企業和廠商、法律界以及社會公眾提供全面客觀的認知支持。

上海數據治理與安全產業發展專業委員會今年在上海市經信委和上海市委網信辦等部門的指導下,由上海信息服務業行業協會、上海社會科學院網際網路研究中心等機構共同發起成立。

上海市經信委軟體和信息服務業處處長劉山泉表示,上海智慧城市建設高度重視大數據技術和產業的發展,公共數據開放水平居於國內前列,大數據技術生態初步形成,未來高水平、高質量的數據產業將成為上海信息服務業高質量發展的重要引擎。

對此,上海數據治理專委會應在原有工作基礎上,重點做好三個方面的工作:第一,密切關注全球和國內數據治理發展的新動態;第二,重點關註上海社會經濟和產業發展核心領域的數據治理問題;第三,高度關注人工智慧、5G、工業網際網路、區塊鏈等技術發展中可能帶來的數據安全治理問題。

中共上海市委網絡安全和信息化委員會網絡安全處處長王靜認為,數據時代面臨的各種安全風險和挑戰不斷凸顯,從公民個人隱私數據被違法收集、洩露到關鍵信息技術設施數據遭受勒索、盜竊,甚至到大國之間的博弈,數據安全已經不單單是網絡安全問題,而且成為關係社會穩定發展的全局性問題。

相關焦點

  • 網絡爬蟲怎麼管?最新研究報告:強調場景化治理
    來源:澎湃新聞原標題:網絡爬蟲怎麼管?最新研究報告在滬發布,強調場景化治理被稱為「網絡爬蟲」的自動數據採集技術該如何管理?11月28日,在CIS 2019網絡安全創新大會上發布的一份《數據爬取治理報告》提供了思路。
  • 網絡爬蟲的法律規制
    隨著數據資源的爆炸式增長,網絡爬蟲的應用場景和商業模式變得更加廣泛和多樣,較為常見的有新聞平臺的內容匯聚和生成、電子商務平臺的價格對比功能、基於氣象數據的天氣預報應用等等。一個出色的網絡爬蟲工具能夠處理大量的數據,大大節省了人類在該類工作上所花費的時間。網絡爬蟲作為數據抓取的實踐工具,構成了網際網路開放和信息資源共享理念的基石,如同網際網路世界的一群工蜂,不斷地推動網絡空間的建設和發展。
  • 法學匯|網絡爬蟲的入罪標準與路徑研究
    網絡爬蟲(Web Crawler),又稱網絡蜘蛛或者網絡機器人,是一種按照一定規則自動抓取網際網路信息的程序。在大數據時代,網絡爬蟲已成為網際網路抓取公開數據的常用工具之一,可以實現對文本、圖片、音頻、視頻等網際網路信息的海量抓取。網絡爬蟲相關訴訟糾紛引發了學界在私法層面對大數據權益屬性、權益分配的諸多法律爭議,以及在公法層面對網絡爬蟲刑法規制路徑的諸多探討。
  • 網絡爬蟲作用有哪些?如何構建網絡爬蟲?
    根據We Are Social和Hootsuite的2018年全球數字新報告,全球網際網路用戶數量剛剛超過40億,比2017年增長7%。人們正在以前所未有的速度轉向網際網路,我們在網際網路上做的很多行為產生了大量的「用戶數據」,比如評論,微博,購買記錄等等。
  • 《文化藍皮書:中國文化發展研究報告(2017~2020)》發布
    中國社會科學院中國文化研究中心與社會科學文獻出版社近日聯合發布《文化藍皮書:中國文化發展研究報告(2017~2020)》(以下簡稱《報告》)。《報告》聚焦於黨的十八大以來中國文化產業發展的新特點和政策的相應變遷,對當前文化發展形勢進行全面分析,並對文化產業未來的發展提出建設性意見,具體內容涉及區域文化產業、文化金融、文化消費、公共文化服務體系、文化企業、不同類別的文化產業、國際文化產業等多個方面。新華網文化頻道聯合中國社會科學院中國文化研究中心、社會科學文獻出版社,摘登《報告》部分內容,希冀與網友一起總結經驗、共謀未來。
  • 專家熱議數據安全犯罪:網絡爬蟲未必構成犯罪,對流量造假應推進...
    2020年,疫情的巨大挑戰和數字經濟的蓬勃發展共同構成了網絡空間治理的大背景,針對數據爬取、流量灰黑產、個人數據保護等方面的新問題,刑法學應該如何作出回應?來自清華大學、中國政法大學、浙江大學等機構的專家和網際網路企業代表就此展開了討論。整體保護框架需要改進公民個人信息保護與大數據產業發展之間、信息自由與信息安全之間該如何尋求平衡?
  • 艾媒諮詢|2020中國智慧場景服務專題研究報告
    傳統基建也逐漸向「新基建」轉型,如今的商圈、出行、社區、工業園等場景開始向智慧化靠攏。近三年的《國務院政府工作報告》多次提到推進數字社會建設。iiMedia Research(艾媒諮詢)數據顯示,2019年,中國線下零售金額佔社會消費品零售總額75%,線下消費仍然是國內居民的主流消費方式,蘊藏著巨大的市場增長空間。大數據實際用戶畫像更加精準,新零售進一步推動線上線下一體化進程,助力打造智慧場景。
  • 京東商城修改robots 屏蔽一淘網搜尋引擎爬蟲
    京東商城修改爬蟲規則新浪科技訊 10月25日上午消息,京東商城與阿里巴巴集團旗下比價購物搜索一淘網的暗戰出現最新進展,京東商城已通過技術手段在www.360buy.com/robots.txt頁面中加入「User-agent: EtaoSpider Disallow: /」
  • 《文化藍皮書:中國文化發展研究報告(2017~2020)》提出——
    □本報記者 孫海悅  中國社會科學院中國文化研究中心與社會科學文獻出版社日前在京聯合發布《文化藍皮書:中國文化發展研究報告(2017~2020)》(以下簡稱藍皮書)。藍皮書聚焦黨的十八大以來中國文化產業發展的新特點和政策的相應變遷,對當前文化發展形勢進行全面分析,並對文化產業的未來發展提出建設性意見。
  • 網絡爬蟲哪些數據可以採集哪些不可以,不看可別後悔
    可能在抓取的時候我們不太明白專利侵權這些範圍怎麼去界定。專利只是用來聲明發明的所有權。圖片、文字和任何信息本身不能獲得專利權。雖然有些專利(比如軟體專利)並不像我們通常理解的「發明創造」那樣是有形的,但是要注意,獲得專利權的是這些無形的東西(技術),而不是專利報告中的內容。
  • 重磅發布|國家郵政局發展研究中心發布 《中國郵政快遞業綠色發展...
    「 10月23日,在2020年中國郵政快遞業生態環保研討暨綠色供給展會上,國家郵政局發展研究中心發布了《中國郵政快遞業綠色發展報告(2019-2020年)》。
  • 世界氣象組織發布報告強調 應對氣候變暖面臨更大挑戰
    人民日報駐比利時記者 張朋輝世界氣象組織日前發布的最新氣候預測報告指出,2019年是全球有氣溫記錄以來第二熱的年份,僅次於2016年。由於溫室氣體水平持續上升,新的「史上最熱年度」可能在5年內出現。世界氣象組織警告稱,實現應對氣候變化《巴黎協定》確定的溫控目標面臨巨大挑戰。
  • 《全球人工智慧治理年度觀察2019》英文版發布—新聞—科學網
    據悉,該報告由上海市科學學研究所團隊牽頭,聯合國際合作夥伴共同完成。   上海市科學學研究所所長石謙介紹說,該報告是全球首份由全球業內頂級專家共同參與撰寫的人工智慧治理報告,也是首份由我國智庫發起、全球參與的人工智慧治理報告。
  • [頭版]上海交通大學健康長三角研究院發布最新報告——實體醫院...
    日前舉行的上海交通大學健康長三角研究院年度論壇發布的一份最新調查顯示,超七成醫生反饋所在醫院已經或正在推進網際網路醫院建設;公眾對網際網路醫療的認知和使用率快速提升;網際網路「首診」將在一定的疾病領域和場景逐步開放;實體醫院主導的網際網路醫療將快速壯大,第三方平臺發展將面臨挑戰。2020年2月7日,國家衛生健康委發布通知,要求在疫情防控期間,大力開展網際網路診療服務。
  • 2019中國未來商業消費趨勢研究報告發布 成都各項指標表現出色
    6月10日,《2019中國未來商業消費趨勢研究報告》在未來商業館發布,總結出未來商業五大發展趨勢,即需求個性化、場景多元化、零售無界化、商品數位化以及萬物互聯化。圖片來源:成都市商務局  作為2019年成都全球創新創業交易會新經濟應用場景展中的一個,未來商業館的主題為「數字商業 共創未來」。展館按照「1+4」模式進行布局,設置一個1個主題序展和「產品定製化」「渠道場景化」「流量精準化」「用戶情感化」4個未來商業場景展,「交易金融」貫穿場景展進行整體呈現,全景式描繪未來商業發展新趨勢、新技術與新模式。
  • 加州發布輕型加氫站經濟性研究報告草案
    據國外媒體報導:日前,加州空氣資源委員會(California Air Resources Board, CARB)已經完成了一份報告草案,詳細闡述了輕型加氫站的經濟性研究。自給自足將表明加氫網絡不再需要政府的扶持和補貼(例如AB 8贈款和低碳燃料標準計劃的適用規定)。因此,自給自足的研究評估了加氫站的經濟性,評估了最終可能實現自給自足加氫站數量,並預估了實現自給自足的時間。該報告是一項為期五年的研究和評估工作的總結,該工作始於2016年,與加利福尼亞能源委員會合作完成了廣泛的行業調查和訪談諮詢。
  • 還有人不知道網絡爬蟲是什麼吧
    就像Koster(Koster,1995)所注意的那樣,爬蟲的使用對很多工作都是很有用的,但是對一般的社區,也需要付出代價。使用爬蟲的代價包括: 網絡資源:在很長一段時間,爬蟲使用相當的帶寬高度並行地工作。 伺服器超載:尤其是對給定伺服器的訪問過高時。 質量糟糕的爬蟲,可能導致伺服器或者路由器癱瘓,或者會嘗試下載自己無法處理的頁面。
  • 嚴格按照景區化管理!今天,劉任遠對這兩個項目提出了要求
    他強調,要堅定踐行習近平生態文明思想,秉承公園城市營城理念,堅持久久為功,一錘接著一錘敲的工作方法,多管齊下推進好鹿溪河流域水生態治理工作,嚴格按照景區化管理的標準和思路,提高新區重大項目服務群眾的品質,為新區重大項目高質量投用奠定基礎。
  • 赤尾新品USB保險套發布,場景化帶來行業新顛覆
    10月10日,號稱「黑科技保險套」的赤尾發布新品USB系列,據了解,此款產品堪稱「顛覆性」保險套,USB通過產品特性、產品包裝、以及產品附加價值等全面打造USB概念,碾壓市面上的眾多保險套,更具激情與刺激性。
  • 野生救援發布最新報告
    2014年8月5日北京:野生救援協會今天發布的一份最新報告顯示,隨著中國公眾的保護意識日趨增強,魚翅的價格和銷量不斷下降。在與北京麗思卡爾頓酒店聯合舉行的「我與魚翅說再見」新聞發布會上,野生救援協會創始人兼理事長奈彼德發布了《中國魚翅消費趨勢最新報告》。