2019年8月30日,《信息安全技術數據安全能力成熟度模型》(GB/T 37988-2019)簡稱DSMM(Data Security Maturity Model)正式成為國標對外發布,並已於2020年3月起正式實施。
DSMM將數據按照其生命周期分階段採用不同的能力評估等級,分為數據採集安全、數據傳輸安全、數據存儲安全、數據處理安全、數據交換安全、數據銷毀安全六個階段。DSMM從組織建設、制度流程、技術工具、人員能力四個安全能力維度的建設進行綜合考量。DSMM將數據安全成熟度劃分成了1-5個等級,依次為非正式執行級、計劃跟蹤級、充分定義級、量化控制級、持續優化級,形成一個三維立體模型,全方面對數據安全進行能力建設。
DSMM三維立體模型
在此基礎上,DSMM將上述6個生命周期進一步細分,劃分出30個過程域。這30個過程域分別分布在數據生命周期的6個階段,部分過程域貫穿於整個數據生命周期。
數據生命周期安全過程域
隨著《中華人民共和國數據安全法(草案)》的公布,後續DSMM很可能會成為該法案的具體落地標準和衡量指標,對於中國企業而言,以DSMM為數據安全治理思路方案選型,可以更好的實現數據安全治理的制度合規。
本系列文將以DSMM數據安全治理思路為依託,針對上述各過程域,基於充分定義級視角(3級),提供數據安全建設實踐建議,本文作為本系列第二篇文章,將介紹數據採集安全階段的數據採集安全管理過程域(PA02)。
01定義
數據採集安全管理,DSMM官方描述定義為在採集外部客戶、合作夥伴等相關方數據的過程中,組織應明確採集數據的目的和用途,確保滿足數據源的真實性、有效性利最少夠用等原則要求,並明確數據採集渠道、規範數據格式以及相關的流程和方式,從而保證數據採集的合規性、正當性、一致性。
DSMM標準在充分定義級對數據採集安全管理要求如下:
組織建設
組織應設立數據採集安全管理的崗位和人員,負責制定相關的數據採集安全管理的制度,推動相關要求、流程的落地,並對具體業務或項目的風險評估提供諮詢和支持。
制度流程
1)應明確組織的數據採集原則,定義業務的數據採集流程和方法;
2)應明確數據採集的渠道及外部數據源,並對外部數據源的合法性進行確認;
3)應明確數據採集範圍、數量和頻度,確保不收集與提供服務無關的個人信息和重要數據;
4)應明確組織數據採集的風險評估流程,針對採集的數據源、頻度、渠道、方式、數據範圍和類型進行風險評估;
5)應明確數據採集過程中個人信息和重要數據的知悉範圍和需要採取的控制措施,確保採集過程中的個人信息和重要數據不被洩漏;
6)應明確自動化採集數據的範圍。
技術工具
1)應依據統一的數據採集流程建設數據採集相關的工具,以保證組織數據採集流程實現的一致性,同時相關系統應具備詳細的日誌記錄功能,確保數據採集授權過程的完整記錄;
2)應採取技術手段保證數據採集過程中個人信息和重要數據不被洩漏。
人員能力
負責該項工作的人員應能夠充分理解數據採集的法律要求、安全和業務需求,並能夠根據組織的業務提出針對性的解決方案。
02實踐指南
組織建設
組織機構在條件允許的情況下可以設立兩個數據採集安全團隊,其中一個團隊為數據採集安全管理團隊,主要負責為公司制定整體的數據採集安全合規管理制度,同時推動相關要求、制度、流程的真正落地;另一個數據採集安全團隊為數據採集風險評估團隊,主要負責為公司的業務部門提供針對不同業務或項目場景的數據安全評估服務支持,並制定相應的改進方案。
理論上數據採集安全管理團隊應該提供對數據採集風險評估團隊的諮詢和支持,但若是組織機構沒有設立兩個數據採集安全團隊的條件,可以將兩個團隊的職責合併在一起,僅僅只設立一個數據採集安全團隊,既負責制定合規制度、又負責提供對項目的風險評估服務。
人員能力
針對該項工作的相關人員,需要熟悉國家網絡安全法律法規以及組織機構所屬行業的政策和監管要求,在採集數據的過程中嚴格按照《網絡安全法》、《個人信息安全規範》等相關國家法律法規和行業規範執行,同時還需要相關人員熟悉組織機構的業務特徵,了解業務線的政策方向和戰略調整,具備良好的數據採集安全風險意識,能夠根據組織機構內不同的業務場景提出針對性的風險評估報告以及相應解決方案,能夠確保項目實施過程中的數據分析能夠順利有序地進行。
落地執行性確認
針對組織建設和對應人員能力的實際落地執行性確認,可通過內部審計、外部審計等形式以調研訪談、問卷調查、流程觀察、文件調閱、技術檢測等多種方式實現。
制度流程
1)基本原則
進行數據採集活動時,應遵循合法、正當、必要的原則,具體包括:
權責一致——採取技術和其他必要的措施保障個人數據和重要數據的安全,對數據處理活動,對數據主體合法權益造成的損害承擔責任;
目的明確——具有明確、清晰、具體的信息處理目的;
選擇同意——向數據主體明示信息處理目的、方式、範圍等規則,徵求其授權同意;
最小必要——只處理滿足數據主體授權同意的目的所需的最少數據類型和數量。目的達成後,應及時刪除所採集的數據;
公開透明——以明確、易懂和合理的方式公開處理數據的範圍、目的、規則等,並接受外部監督;
確保安全——具備所面臨過的安全風險相匹配的安全能力,並採取足夠的管理措施和技術手段,保護數據的保密性、完整性、可用性;
主體參與——向數據主體提供能夠查詢、更正、刪除其信息,以及撤回授權同意、註銷帳戶、投訴等方法。
2)數據採集源
大數據採集主要有4種來源:
管理信息系統:管理信息系統是指企業、機關內部的信息系統,如事務處理系統、辦公室自動化系統,主要用於經營和管理,為特定用戶的工作和業務提供支持。數據的產生既有終端用戶的始輸入,又有系統的二次加工處理。系統的組織結構是專用的,數據通常是結構化的。
Web信息系統:Web信息系統包括網際網路中的各種信息系統,如社交網站、社會媒體、系統引擎等,主要用於構造虛擬的信息空間,為廣大用戶提供信息服務和社交服務。系統的組織結構是開放式的,大部分數據是半結構化或者無結構的。數據的產生者主要是在線用戶。
物理信息系統:物理信息系統是指關於各種物理對象和物理過程的信息系統,如實時監控、實時檢測,主要用戶生產調度、過程控制、現場指揮、環境保護等。系統的組織結構是封閉的,數據由各種嵌入式傳感設備產生,可以是關於物理、化學、生物等性質和狀態的基本測量值,也可以是關於行為和狀態的音頻、視頻等多媒體數據。
科學實驗系統:科學實驗系統實際上也屬於物理信息系統,但其實驗環境是預先設定的,主要用於學術研究等,數據是有選擇的、可控的,有時可能是人工模擬生成的仿真數據。數據往往具有不同的形式。
3)數據採集方式
數據採集的目的是獲得數據,數據採集的方式包括但不限於:
網絡數據採集;
系統日誌採集;
其他數據採集。
4)數據採集周期
數據採集周期可根據數據狀態分為以下兩種:
對於實時檢測數據,應按照實際工作條件制定數據採集周期。例如系統連續進行10次採集,10次採集時間的平均值作為系統的數據採集周期;
對於系統生產基礎數據採用固定期限加動態調整的方式進行採集。例如變化不大的數據信息採集周期可為6個月,涉及數據信息變動的調整的可根據需要動態調整。
5)數據採集法律要求
採集的數據及採集過程嚴格按照《網絡安全法》、《個人信息安全規範》等相關國家法律法規和行業規範執行。
6)數據採集安全策略
組織開展數據採集活動的過程中應遵循如下基本要求,確保採集過程中的個人信息和重要數據不被洩露:
定義採集數據的目的和用途,明確數據來源、採集方式、採集範圍等內容,並制定標準的採集模板、數據採集方法、策略和規範;
遵循合規原則,確保數據採集的合法性、正當性和必要性;
設置專人負責信息生產或提供者的數據審核和採集工作;
對於初次採集的數據,需採用人工與技術相結合的方式進行數據採集,並根據數據的來源、類型或重要程度進行分類;
最小化採集數據,僅需要完成必須工作即可,確保不收集與提供服務無關的個人信息和重要數據;
對採集的數據進行合理化存儲,依據數據的使用狀態進行及時銷毀處理;
對採集的數據進行分級分類標識,並對不同類的級別的數據實施相應的安全管理策略和保障措施,對數據採集環境、設施和技術採取必要的安全管理措施。
7)數據採集風險流程評估
在對數據進行採集的過程中,應組織風險評估小組,對採集過程進行風險評估,評估內容包括但不限於合規安全性、技術安全性等。
8)技術工具簡述
針對數據採集和數據防洩漏,目前均有多種解決方案。數據採集根據採集的數據類型和數據源不同,也會有不同的技術工具。目前主要有三類數據:資料庫數據、網絡數據、系統日誌數據,根據數據類型的不同,主要有三類數據採集系統。數據防洩漏目前主要有數據加密技術、權限管控技術及基於內容深度識別的通道防護技術。
數據採集系統
1)資料庫採集系統
在政府、企業、高校中,目前絕大部分業務相關的數據都採用結構化的方式保存在後端的資料庫系統中,資料庫系統主要包含2大塊,一塊是關係型資料庫,如oracle、sql server、mysql。另一塊是非關係型資料庫如mongodb,redis。針對此種源數據,主要有3種實現數據採集的方式:直接數據源同步、生成數據文件同步、資料庫日誌同步。
2)網絡數據採集
通過網絡爬蟲或網站公開API等方式從網站上獲取數據信息的過程。
3)系統日誌採集
不管是業務系統、作業系統、資料庫系統每天都會產生大量的日誌數據,針對此類日誌,目前有多款開源工具可實現數據採集功能,如Hadoop的Chukwa、Cloudera的Flume、Facebook的Scribe等,這些工具均採用分布式架構,能滿足每秒數百兆字節的日誌數據的採集和傳輸需求。
數據防洩漏技術
1)數據加密技術
數據加密包含磁碟加密、文件加密、透明文檔加解密等技術路線,目前以透明文檔加解密最為常見。
2)權限管控技術
數字權限管理(Digital Right Management,
DRM)是通過設置特定的安全策略,在敏感數據文件生成、存儲、傳輸的瞬態實現自動化保護,以及通過條件訪問控制策略防止敏感數據非法複製、洩漏和擴散等操作。
3)基於內容深度識別的通道防護技術
基於內容的數據防洩漏(Data Loss Prevention,DLP)概念最早源自國外,是一種以不影響用戶正常業務為目的,對企業內部敏感數據外發進行綜合防護的技術手段。
受限於篇幅,此處技術工具不進行進一步展開,下圖為數據採集安全管理的技術工具進行數據採集作業的基本流程圖。
數據採集流程圖