【洞見】美創CTO周杰:如何保護流動的數據

2021-02-15 雷鋒網

▲點擊上方 雷鋒網 關注

不知道你們有沒有這種感覺,一堆騷擾、推銷電話時常扎堆打過來,清淨一段時間後,又開始如被鞭屍般撈起來繼續被「騷擾」。

讓人有種恍如隔世的感覺:我的信息到底是在哪個環節洩露的?

住過萬豪酒店的朋友們應該能體會雷鋒網編輯的這種想法,2018 年 3.83 億預訂喜達屋酒店客戶的詳細個人信息遭到洩露。今年 7 月,這家公司被英國罰款 1.24 億美元。

畢竟 1.24 億美元的罰款也不會被平分給這些被洩露信息的受害者,說來也沒什麼可高興的。它只發出了一個嚴重警告的信號:出來混,洩露信息,是要挨罰的。

聽起來有點嚴重,前陣子,中國一些涉及非法爬蟲業務的所謂「大數據風控」企業日子不好過,被抓的傳聞四起,這兩天的一個消息是,江蘇淮安警方依法打擊了 7 家涉嫌侵犯公民個人信息犯罪的公司,涉嫌非法緩存公民個人信息 1 億多條,其中,拉卡拉支付旗下的考拉徵信涉嫌非法提供身份證返照查詢 9800 多萬次,獲利 3800 萬元。

因此,考拉徵信服務有限公司及北京黑格公司的法定代表人、董事長、銷售、技術等 20 餘名涉案人員被警方一起帶走了。

看上去,這些「主動」把個人信息拿來賺錢的企業果然沒有好下場。但對「被動挨打」也要認,被人盯上數據的企業就只能渾渾噩噩過日子了嗎?

並不是。按照一個樸素的道理,如果一個人抱著金銀珠寶上街,起碼也要配備一兩個保鏢,如果是拍賣公司運貨,可能配上的是一個安保公司全方位的服務。

當然,還有一些本來就有錢有勢的「大富豪」,可能直接出手成立一家專為自己服務的安保公司。

這種樸素的理念映射到現代企業保護自己的各類數據或者資料庫,也很好理解:有錢有人的大公司自己有安全部門、安全人員,甚至自己研發了保護工具,一般企業還是購買專業方案,也就是購買「安保公司的服務」。

由於對數據的保護實在迫在眉睫,一家專業數據「安保公司」美創甚至將之前主打的「資料庫安全」增長到「數據安全」,他們做出這個決定是在兩年前。

為什麼會有這種變化?保護數據的思路應該是什麼樣?雷鋒網與美創公司的 CTO 周杰聊了聊。

口述:周杰 | 整理:李勤


我所指的數據安全是指要防止數據被惡意洩漏,或者是被惡意拖庫、撞庫、弄壞、被加密等。資料庫防火牆、資料庫審計、防水壩、加解密、防勒索、業務安全審計、脫敏等肯定是我們的主流產品,當然,災備也不可能丟掉,任何系統都需要做災備,災備嚴格來講也屬於安全產品。現在線下遷移到線上,上雲的態勢很猛,異構的資料庫遷移產品很重要。

不過,有些公司對數據安全的理解就等同於只有資料庫災備,我理解的是,就算你只用災備產品,也不應局限在資料庫災備上,它應該是全業務的災備。

比如,一個企業可能除了主系統,還有很多微服務,應用系統宕機後,切換是很困難的,如果有100個微服務,備份順序如何?是否能實時備份?這是很複雜的情況。

國內很多數據安全廠商是從傳統安全廠商轉型而來,他們的防護理念是從外到內的,他們從黑客的角度出發想問題,並沒有明確的保護對象,是在梳理攻擊者的攻擊路徑,保護程度可能比較淺,從 IP 到埠就完了。沒有實時阻斷,可能只有旁路阻斷,實際上旁路阻斷是偽命題,它不可能實現100%阻斷,流量一大,肯定無法阻斷危險操作。

我們的思路是從內而外出發,有明確的保護對象,也就是數據。

我們首先會定義「有什麼東西」,梳理核心資產,從保護對象出發,可以精確了解攻擊方式,從而縮小攻擊面。比如,對一個資料庫的破壞有哪些形式?用勒索病毒加密、物理拷貝、 通過 SQL 語句刪除數據或竊取數據等。

除了縮小攻擊面,還要儘量隱藏攻擊面。

比如,MySQL 的默認連接埠是3306,如果把 MySQL 的 3306 埠變成了 3308,就可以在黑客撒網式批量掃描過程中增加一些免疫的效果,雖然只是一點點,但它是有作用的。如果我們的敏感資產不會被發現,自然受攻擊的可能性大大減小。

我們還可以在 3306 的埠上放個陷阱,模擬 MySQL,把攻擊流量引入陷阱,用於來分析或定位黑客。

很多廠商的思路是,「漏報」比「誤報」好,如果當下對一個「威脅」不能確定,會先放過,等問題上報、分析、檢測這一套漫長的運營流程下來後,事情就可能已經發生了,傷害已經造成,要有什麼效果也只能等到下一次。

面對核心資產,不能放過任何一個危險操作。美創的理念還是實時阻斷,採取動態的策略,知白守黑。好人是可被窮盡的,壞人是不可被窮盡的。

比如,做 PDF 防篡改,能夠編輯 PDF 的軟體有多少?95% 的企業用的都是同一種,我們只要做出一個畫像,確定了關鍵指標,別人想偽造這個軟體也很難,只有具有合法身份的訪問才被允許。

安全要上馬,對用戶來說,也不是一件容易的事情。

我們在和用戶交流中,常常發現他們有這樣的疑慮:上了安全系統是否會影響業務系統?業務系統可能在 99% 的時間保持工作狀態,安全系統可能是在 1% 的時間裡抵禦攻擊,所有的安全系統都是為了保障業務的正常進行,不能上了一套系統把業務搞癱了。

所以,我們研究數據安全防護必須儘量取得平衡。

首先,安全策略要儘可能動態化,減少對用戶正常工作的打擾。引入自學習,讓策略更加聰明。

其次,當安全系統真出現異常的時候,讓安全系統從串行變成旁路,保證業務系統正常運行,讓業務系統先好好幹活,稍微閒餘時再抓包分析。

我們始終認為,安全應該是一個防護鏈,而不是某個點。

在數位化轉型的大背景下,數據一直在流動,也就導致了數據所處的位置是不同的。根據數據所處位置的不同,可以把數據分為三類:在數據中心、在流動路上、在終端上。

對不同位置上的數據,保護策略不一樣。

對於在數據中心的數據,因為對「雲廠商」天然的不信任,對數據進行加密災備是必須的。數據中心的數據本來就是供人訪問的,要進行數據交換,因此在校驗身份上沒那麼簡單,進行多因子身份認證是必須的,對這一點,各家都有自己的方案。

我們的思路是,除了驗證最基本的帳號和密碼,還要驗證訪問者的作業系統,用何種應用程式連接,如果說我們只是解析協議,得到的信息是有限的,因此我們可能需要在訪問者的終端上安裝一個代理,報告進程的哈希值或者籤名,從源頭上控制訪問端,排除惡意軟體的連接。

確認身份後,還需要分析上下文的語境,弄清楚為什麼這個訪問者需要訪問,為什麼是這個時間段,在這個地址發起訪問。對於工作時間以及常用地址之外的訪問,我們會先判斷有風險。

總之,還是儘可能地描述訪問者的畫像,並在數據中心進行相應的防護。從不信任,永遠驗證。

審計也是很重要的一環,把所有的操作都審計下來,有助於事後的分析,回溯。

因為數據是流動的,我們要對敏感數據進行脫敏,對脫敏之後數據進行全鏈路加密。

所謂脫敏,就是去掉敏感信息,保留原來數據一定特徵,即保持數據原有的可用性。也是說對數據進行脫敏過程中,得到的結果一定是這個數據還是可以用的,能保持原有的特徵,能讓數據共享方獲得的數據仍然可以用、可以處理、可以提取相應的特徵價值,從而獲得原有對數據的要求。

脫敏分為靜態脫敏和動態脫敏。

靜態脫敏往往是線下的、旁路的;動態脫敏往往是線上的、活的數據。

靜態脫敏一般用在非生產環境,把數據批量離線做脫敏,把生產環境裡結構化數據、非結構化數據進行脫敏之後,加載到非生產環境使用。用於開發測試等。動態脫敏是實時脫敏,一般應用環境是生產環境,訪問敏感信息時再脫敏。根據場景、權限、角色不一樣,對同一個敏感信息時有可能進行統一的屏蔽,也可能不同的屏蔽,根據場景操作。

此外,大家都在提數據水印,就是防止在數據的流轉中洩密而找不到流失源頭。

我們一直想實現的是一種透明水印,使用者看不到,但一旦洩密,可以通過水印逮到洩露者,這種靈感來源於「藏頭詩」:如果我發給你10000 行記錄,在第一行某個地方寫一個字,在其他行寫一個字,用戶對此是無感知的。

數據安全技術還會有這些趨勢:

第一,隱私計算,我們經常有一些數據需要流動和外發,不可能把所有的數據進行脫敏,有些數據的脫敏程度不高的話,復原也不是難事。

數據隱私的保護手段,主要分為可信硬體和密碼學兩個流派。硬體方面主要是可信執行環境(Trusted Execution Environment,TEE),而密碼學方面有同態加密(Homomorphic Encryption),安全多方計算(Multi-party Computation)和零知識證明(Zero-knowledge Proof, ZKP)。

TEE 可能會是個方向,但是 TEE 這條路大家也是剛開始走。基於硬體的方案也有問題,比如升級困難。當MPC,同態加密等有重大突破的時候,TEE 會退休。

第二,就是雲化和大數據化,我們在這裡也要做很多東西,未來的數據安全在雲端。

第三,自適應安全架構。以一些安全策略為例,如果安全策略定得太寬鬆,沒什麼用,定得太細緻則會干擾正常業務,所以我們要讓策略根據情況調整。

第四,資料庫加解密也是方向之一,資料庫加解密一直是個業界難點。國內很多企事業單位用的加密算法是國外算法,在過保上可能會遇到一些問題,現在有國密算法,在安全可控的大背景下,資料庫加解密支持國密算法大有可為,但國產替代會是一個比較長期的過程。

▎華為與小米的 「冰與火之歌」

▎突發!YC 將從中國撤出分支,陸奇已啟動第一個創業項目品牌

▎中國工程院院士王堅,是如何煉成的?

▎餘承東:華為不會進入家電領域;劉強東稱將對不幸員工子女負責;羅永浩被解除限制高消費

創立於2017年的「AI最佳掘金案例年度榜單」,是業內首個人工智慧商業案例評選活動。雷鋒網從商用維度出發,尋找人工智慧在各個行業的最佳落地實踐。

第三屆評選已正式啟動,掃描下圖底部二維碼,進行報名。詳情可諮詢微信號:xqxq_xq

相關焦點

  • 全新架構全速發展美創科技新一代數據安全架構正式發布
    10月23日,美創科技數據安全產品架構升級發布會在杭州成功召開。會上,美創科技正式發布新一代數據安全架構。浙江省網絡空間安全協會常務副理事長宋皆榮、美創科技總經理柳遵梁及公司代表、各研究單位、媒體機構、合作夥伴等一同見證新一代安全架構的亮相。
  • 美創科技與星環科技大數據平臺完成兼容互認證!
    近日,杭州美創科技有限公司(簡稱:美創科技)旗下數據脫敏產品與星環信息科技(上海)有限公司旗下星環大數據平臺TDH完成產品兼容互認證。
  • 強強聯手 中嘉博創與洞見智慧科技攜手打造區塊鏈與隱私計算行業生態
    來源:挖貝網近兩年來,"隱私計算"作為熱門詞彙被頻頻提及,隱私計算技術在滿足數據安全與隱私保護的前提下能夠充分利用數據價值產生全局智能,因而網際網路巨頭、數據服務商、初創企業等紛紛加入行業賽道,國內隱私計算產業呈現迸髮式增長態勢。
  • 數據驅動之下如何保護隱私
    數據驅動之下如何保護隱私在有關教學、安全、領導力和管理、公平的對話中,數據是對話的焦點。數據可以提供言之有據的見解,但這種努力也伴隨著風險和挑戰,可能會造成災難性的後果,甚至會阻礙創新。因此,他們必須了解數據隱私問題,知道如何以及何時保護數據。教育工作者和學校系統必須應對一套複雜的、往往是多層次的有關教育數據隱私的法律。這些法律要求往往會因地區和國家而異。在美國,學校必須考慮聯邦和州的法律,技術和法律環境也在不斷變化。
  • 論道:數據共享 v.s. 隱私保護
    而共享的數據很大程度上已經深度涉及到隱私數據,這些隱私數據如果非法使用,將帶來不可估量的後果。如何處理數據共享和隱私保護之間的矛盾成為當前熱議話題。7月15日, AI Time舉辦第四期沙龍,邀請了明略集團首席科學家吳信東教授、清華大學朱小燕教授、清華大學的徐葳副教授,以及微眾銀行人工智慧部的吳海山副總經理,一起論道「數據共享開放與隱私保護」。
  • 周杰的成名史及「冤屈」往事
    在這樣幸福的家庭中年幼的周杰過著無比幸福的生活,從小受父親影響,年少的周杰喜愛看歷史人文的東西,嚴謹的父親時常給他講一些人文歷史及做人的道理,告訴周杰一定要真誠,不可以撒謊。在4歲時候周杰偷吃餅乾,父親察覺桌上的餅乾見少,更可氣的是父親發現自己皮鞋裡面藏著一塊塊的小餅乾,周杰是害怕父親把餅乾藏起來,偷偷把餅乾藏在了皮鞋裡,被父親發現後倔強的周杰打死不承認餅乾是自己藏的,父親很生氣,生氣並不是因為周杰偷吃餅乾,是因為周杰撒謊,父親再三詢問餅乾是你藏的嗎,周杰還是死不承認,說是老鼠偷得。
  • 疫情下的數據利用和個人信息保護再權衡
    相關的應用包括實時監測車輛、人口動態信息,或利用大數據開展人員流動監測,為研判疫情態勢提供技術支持;包括面向公眾的「同程排查」服務,用戶輸入行程日期、車次和地區,即可查詢已被披露的新冠肺炎確診患者同行的火車、飛機和地鐵等等。北京、天津、江蘇等地方主管部門公布「病例發病期間活動過的小區或場所」,幫助市民及時了解疾病線索,便於社區有針對性地開展疫情防控工作。
  • 數據安全有序流動支撐產業轉型 海南將做好「五個一」機制的落地
    如何讓「數字石油」更好的完成作為生產要素配置市場資源的價值,讓數據可用不可見,才能真正意義打破數據孤島,促進數據開放共享、確權、流轉和交易實現。近日在杭州算力智庫和巴比特主辦了「隱私計算·讓數據安全有序流動起來」的大會,主要圍繞隱私計算作為大數據的鍊金術等話題展開。
  • 林心如吐槽周杰舌吻!十幾年後周杰終吐真相!
    只有一個人,他本人很少出現在我們視線裡,但是他的表情包卻被我們用爛了,他就是周杰。說起周杰,就不得不說闢謠了一遍又一遍的「舌吻」、「口臭」的事情。事情的起因是林喜怒在臺灣的一個綜藝節目上,主持人問「第一場吻戲有沒有掙扎過」林心如回答「有,周杰啊,很想死,很辛苦,他可能想嘗試投入一點,就很不喜歡就對了」
  • 滴滴出行CTO張博:建設大數據團隊是網約車決勝重要原因
    早在2013年1月份,我開始組建大數據的團隊,當時我們的數據還挺少的 ,為什麼那麼早開始組建?這在當時還是很超前的想法。我在那時候已經意識到滴滴未來是大數據和算法驅動的公司,大數據團隊的建立,讓滴滴現在可以回溯到2013年的數據,這為後面很多發展也起到很關鍵的作用。
  • 林心如周杰罵戰未果,臺灣節目卻這樣評價周杰惹怒觀眾
    小編一直秉持著這樣的態度,那就是林心如與周杰肯定有一方錯了,那麼就請錯了的一方主動站出來給另一方道歉,這事也就算過去了,沒必要你來我往,鬧的娛樂圈腥風血雨,也弄得網友們猶豫不決不站錯了隊被打臉。下面,一起來看看臺灣的某節目主持人以及請來的嘉賓是如何聊林心如與周杰事件的,態度不要太明顯,言語不要太刻薄,攻擊性也不要太高。
  • 協創數據現金流連負兩年 淨利長期不敵逾期應收帳款
    ,持有協創數據41.84%的股份。 公司存貨佔流動資產的比例分別為18.72%、24.93%、31.64%和26.73%,佔資產總額的比例分別為15.60%、21.57%、25.85%和19.68%。 報告期內,協創數據存貨周轉率分別為8.99次、7.15次、4.65次和4.85次,存貨周轉天數分別為40天、50天、77天和75天,存貨周轉天數有所延長。
  • 以課程思政重塑大數據與智能時代的數據科學思維體系
    本文探討在大數據與智能時代如何引導學生構建數據科學思維體系,以重塑數據科學思維體系的「心」「腦」「體」為著力點,實現專業課教學向理想信念教育、學術能力培養、社會責任培育等多向度的延伸。本文以東北大學計算機技術專業碩士研究生必修課「數據科學思維與大數據智能分析技術」的課程思政建設為例,探討了在大數據與智能時代如何引導學生構建數據科學思維體系,如何實現專業課教學向理想信念教育、學術能力培養、社會責任培育等多向度的延伸,回應了高等教育「培養什麼人、怎樣培養人、為誰培養人」這一根本問題。
  • 如何在MacOS上安裝VeraCrypt以跨平臺拷貝及保護數據
    亦或還有一種場景:公司為您配置的電腦安裝的是Windows 10作業系統,而您家裡的個人電腦如小編一樣是Macbook Air之類的蘋果公司產品,使用的是不同的MacOS作業系統,我們有一些公事上或私事上的敏感數據文件,需要用某種方式進行保護且在這兩種不同作業系統中互相拷貝。那如何解決這個需求呢?
  • 周杰《立場》:撕下大眾標籤化,是周杰最真實的複雜和矛盾
    在李小璐17歲出演《天浴》後,其實鮮有代表作;易姐問起郭敬明:作為一個抄襲者,跑去保護智慧財產權,兩者有沒有矛盾?郭敬明身體表情地尷尬遠要比嘴裡的話誠實的多。易立竟在優酷的一期採訪中說,她做這檔節目的目的,是希望呈現被採訪者的立場,而這種立場,應該是撕下公眾認知範圍內的各種標籤後,最為真實的立場,或許黑暗,隱秘甚至是醜陋。
  • 周杰強吻林心如:我站周杰,他才是內地被黑最慘的男演員
    當年還不流行老公,可探班的迷妹能把劇組圍的水洩不通,最焦點的就是爾康周杰了。周杰認為大陸的「窩心」,跟臺灣的意義完全不同,建議改成「開心」,不懂拐彎的周杰還說,「瓊瑤阿姨說可以改」。導演怒了,覺得他不懂尊重,越級報告更是輕視自己,堅持讓周杰念「窩心」,周杰也倔,就是不改,NG了二十幾次……
  • 西湖峰會雲直播 | 天堂矽谷:聚焦行業 洞見未來
    近日,由浙江省金融業發展促進會、天堂矽谷聯合主辦的「聚焦行業 洞見未來」線上直播分享課順利舉辦。本次雲直播為第六屆全球私募基金西湖峰會的線上預熱活動,天堂矽谷高級合伙人周鑫,合伙人周旼、許賓、羅清分別圍繞「數據時代的投資機會」、「新能源汽車的遠大目標如何照進當下困局」、「健康中國,創新驅動」、「後疫情時代的消費投資」四大主題,聚焦信息技術、智能製造、醫療健康、大消費四大行業進行深度分析和講解。
  • 明星藏家-周杰-淪落藝術圈後現狀如何
    周杰周杰自創了一種叫「口和兒」品牌的紅酒,也讓他的紅酒生意被大眾知曉,除了這些,周杰還延伸到了農業。創建了「周先生」農業產品品牌,主打綠色有機農業產品,主要包括大米和水等。周杰承包土地種大米這事,是知名主持人戴軍首先爆出來的。
  • 2021.1.9《洞見-世界最富創意的廣告公司》
    作者:菲爾杜森伯裡 美《洞見-世界最富創意的廣告公司》(以下簡稱洞見)一書共有13章,整本書看下來我還是很滿意的,最起碼這本書我是漸漸有味的花了4個小時看完。(在這裡也想提一嘴,有人說我看書快,只是我專一罷了,我的習慣是看書的時候手機直接設置勿擾,我要求自己全身心投入到與作者的交流中,基本不分心做其他任何事。)
  • 譚崔的洞見
    越少文明,越原始,那個人就越活生生。當你變得越文明,你就變得越僵化,你就變成人造的,你就變得越有教養了,你就喪失了你在大地的根。譚崔說:要找到真實的人,你必須去到根部。譚崔的美,他結合了相反的兩極,結合了那個對立的、矛盾的。譚崔不是嚴肅的,譚崔是遊戲的。是的,他很真誠,但是不嚴肅,它非常喜悅。