#個人的想法形成文章,借鑑或參考請註明出處,謝謝合作
基於區塊鏈的醫療數據共享系統I. Abstract
隨著大數據時代的到來,數據已經成為重要的資源,發揮數據價值的關鍵在於數據流通。但是,由於隱私洩漏等問題,各行業的數據共享發展緩慢,可以說,解決數據流通面臨的問題迫在眉睫。本文提出了一種基於聯盟區塊鏈的以用戶為中心的數據共享方案,以解決當前各參與方之間的數據孤島問題,同時我們考慮了GDPR合規和社會道德問題,在滿足法律要求的前提下應用於實際的生產。
II. Introduction
近年來,網際網路技術的發展使人類社會活動中的越來越多的內容被數位化記錄,同時,大數據技術的發展提升了對存量數據資源的加工效率。在此背景下,存儲於某個系統中存量數據可能成為其他外部信息系統所需的數據資源,並且數據資源的價值可以在流通後再次得到應用,從而產生更多的應用價值。因此數據共享成為了業界的共識。如何確保數據流通的過程的安全、合法是數據大數據行業發展中遇到的另一個難點問題,尤其在保護個人隱私信息方面是必須解決的問題。本文提出了一種基於聯盟區塊鏈的以用戶為中心的通用數據共享方案,旨在滿足GDPR合規性前提下實現多個參與方的數據共享,有利於解決當前數據共享面臨的一些困境如隱私洩露,利益協調等,並有望應用於現實的交通,醫療等數據共享中去,讓數據真正歸還於用戶。
III. Background
A.區塊鏈
區塊鏈是一種按照時間順序將數據區塊以順序相連的方式組合成的一種鏈式數據結構, 並以密碼學方式保證的不可篡改和不可偽造的分布式帳本。它最早應用在比特幣上,按權限劃分為公有鏈,聯盟鏈和私有鏈。 區塊鏈核心技術包括:
• P2P技術: 點對點數據傳輸,沒有中心的伺服器。
• 共識算法:區塊鏈能夠保證不可篡改,數據可信的核心。
• 橢圓加密算法,公私鑰體系,數字籤名等密碼學算法。
• 智能合約:是一種旨在以信息化方式傳播、驗證或執行合同的計算機協議。智能合約允許在沒有第三方的情況下進行可信交易,這些交易可追蹤且不可逆轉
在本文中我們重點關注的是聯盟區塊鏈。聯盟區塊鏈是指管理著多個組織的區塊鏈,它僅允許系統內的機構讀取,寫入數據和發送交易。 由於節點有限,聯盟區塊鏈具有交易速度快,權限控制強,交易成本低等優點,在保留利益差異的同時更容易尋求共同點。 因此,聯合體區塊鏈更符合企業級要求,同時聯盟區塊鏈還可以在企業應用市場中最大化區塊鏈技術的數據管理特性,從而降低數據共享場景下不同單位的非信任環境中交易的信任成本。
B.GDPR
歐盟的「通用數據保護條例」(GDPR,General Data Protection Regulation)於2018年5月25日生效。這項條例賦予歐盟公民更多的個人數據控制權,另外對那些收集、處理和存儲個人數據的公司提出更高的責任要求,特別是數據洩露。在數據共享和流通的過程中要考慮的一些關鍵GDPR原則包括:
• 完整性:使用適當的技術和組織安全措施保護和保護個人數據。
• 合法性:除其他事項外,組織必須確保其具有處理個人數據的法律依據,並以公平,透明的方式處理該數據。
• 限制使用:只能出於特定,明確或合法目的收集個人數據。
• 數據最小化:僅收集與預期用途相關且必要的數據。
• 準確性:個人數據必須準確且是最新的。
• 存儲限制:除相關例外情況外,僅在必要且合理的時間內保留個人數據。
法國數據保護監管機構CNIL日前按照歐洲《通用數據保護條例》(GDPR)規定,對谷歌開出5700萬美元(約合5000萬歐元)罰單。這家監管機構稱,在安卓(Android)新用戶設置新手機並按照安卓系統的引導流程操作時,谷歌沒有遵守GDPR。
IV. Main body
(This is your work, so make sure you change the title)
Sub-sections
(This is also your work, so make sure you change the titles)
A. 系統模型
This article uses the medical data sharing scenario as an example
如圖1所示,本文提出的數據共享系統由數據持有方,數據需求方,市場運營方、及相關第三方、審計監管方等參與角色構成:
• Data consumer:發起共享數據的請求
• Management:轉發數據消費者的請求,身份認證,系統管理,由於區塊鏈的匿名性質,聯盟區塊鏈的成員認證服務(CA,Certification Authority)由市場運營者主持,負責區塊鏈成員準入認證和身份綁定,提高流通市場的穩定性和數據的品質。
• Data holder:數據的持有方,有數據共享的決定權。數據計算在隱私安全的環境例如可信執行環境下進行。
• Third party services:提供算力,算法等技術服務
• Audit & supervision:對數據共享進行追溯審計
B. 工作流程:
數據各參與方接入聯盟區塊鏈,數據需求方通過區塊鏈發布智能合約,向數據持有方發起合作邀約。而數據持有方通過本地區塊鏈節點接收、批准和執行合約。合約生效前需要各方用戶達成一致的內容包括但不限於:數據內容、數據量、數據使用限制、交易期限、計費方式等。數據授受雙方通過合約執行數據核驗、數據計算、結果提交和放行等,並由市場運營方、審計監管方規範合約履行過程。數據計算由鏈下的安全計算環節來完成,第三方為缺少相關能力的數據需求方提供軟硬體支持,在鏈上完成結果匯總。這一安全計算在數據持有方認可的保密執行環境中完成,避免計算過程數據外流或失竊。
C.合規討論
整個系統是滿足GDPR合規要求的,首先對於數據持有方,系統是滿足數據處理的安全性以保證數據隱私,因為在區塊鏈平臺上公開的數據身份僅包含數據指紋、數據持有方ID等關鍵的概要信息。其次數據實體的核心記錄僅存儲在數據提供者認定的安全計算環境中,即實體本身並未在區塊鏈公開,以保證持有者的隱私不洩漏。
除此之外,本文提出的系統保證了數據主體的權利,整個過程的操作透明可監督,從數據流通的發起,即區塊鏈智能合約的發起,都必須經過數據持有方的應答和審批,滿足GDPR「合法性和同意」的要求。流通過程中的操作都根據合約中約定的策略依次自動執行,並進行鏈內共識、記錄。數據持有方可從區塊鏈中讀取批准合約的操作記錄,以實現監控、核驗和審計,便於日後的問責。
系統使用區塊鏈可為數據共享引入廣泛的市場參與者,實現有效的競爭生態,區塊鏈智能合約的靈活性還可實現數據的交叉融合,為不同數據的自由組合及運用創造了條件。這有利於削弱市場中數據壟斷,從而促進數據共享和高效使用。
因為數據實體特殊的易複製性、敏感性,數據流通中的各方會面臨更多的信用挑戰和安全挑戰,不管怎樣作為頂層設計者,在設計數據共享系統的時候,都需要遵守現有法律法規的約束,以應對諸多不確定因素和法律風險。我們認為在收集、使用個人信息時都要確保數據不被濫用以實施各種犯罪,其次我們不能超出初始收集目的和業務範疇的再使用,包括提供給合同之外的第三方的使用(即流通)等,都會危害到公民的人身和財產利益。同時,數據資源共享也需考慮可流通範圍、流通對象合法性、流通過程的安全保障、使用授權等一系列安全問題。
V. Summary
本文我們主要關注的是數據共享問題,我們提出了一種基於聯盟區塊鏈的以用戶為中心的通用數據共享方案,同時我們總結了系統的工作流程並對其安全性能和GDPR合規內容進行了分析,最後我們就數據共享中的社會法規和道德問題進行了討論。我們希望通過數據共享能發揮和利用數據的價值,讓數據的主權真正歸屬於數據的擁有者。
References
[1] I. Makhdoom, I. Zhou, M. Abolhasan, et al. 「Privacy Sharing: A Blockchain-based Framework for Integrity and Privacy-preserving Data Sharing in Smart Cities」 ICETE (2),pp.363-371,2019.
[2] S. Nakamoto, 「Bitcoin: A Peer-to-Peer Electronic Cash System」 Online Available: http://bitcoin.org/bitcoin.pdf, 2008.
[3] GDPR, Online Available::https://www.logmeininc.com/zh/gdpr/what-is-gdpr
[4] https://www.theregister.co.uk/2019/03/14/more_than_200000_gdpr_cases_in_the_first_year_55m_in_fines/