不一樣的歐美版「健康碼」 一種去中心化的,具有隱私保護的疫情...

2020-12-22 中國網科學頻道

【前言】當地時間2020年4月10日,蘋果與谷歌宣布將聯手推出一項方案,利用藍牙技術幫助政府和衛生機構減緩病毒蔓延,這項方案也被國內媒體解讀為歐美版「健康碼」。對於「健康碼」這個概念,相信在國內的大家已經很熟悉了,疫情期間成為了防控工作的一個有效工具。當歐美版這個「健康碼」新聞出來的時候,我們第一時間也關注到了這個新聞,第一反應是美國的網際網路公司終於「抄作業」了。不過從我們對蘋果和谷歌的技術細節進行深入了解之後,我們發現這個歐美版的「健康碼」並不是直接抄作業,而是根據歐美國家的國情做了很不一樣的設計,本文也將通過分析這項技術方案的設計原則來講解歐美版的「健康碼」到底哪裡不一樣。

筆者註:本文的技術分析基於蘋果和谷歌官方技術文檔,以及開源項目。DP-3T (Decentralized Privacy-Preserving Proximity Tracing)開源項目跟蘋果和谷歌沒有直接聯繫,DP-3T是由一群歐洲的科學家所發起的疫情追蹤開放式協議,不過DP-3T所倡導的大部分設計思想已被蘋果和谷歌採納,因此本文的大部分內容都來源於DP-3T開源項目的白皮書。

國內版「健康碼」

首先讓我們來看看國內目前健康碼大體的一個技術架構。根據我們對所見到的健康碼分析研究,我們認為國內健康碼大多採取的是中心化的大數據收集和分析模式,其具備以下幾個特點:

·中心化存儲所有用戶的行程和身份信息,方便統一進行大數據分析和調控。

·沒有確診的用戶數據也會上傳,確保出現疫情的時候能夠快速通知到密切接觸人群。

·收集的用戶信息包含了身份信息,行程信息等敏感數據,方便進行數據關聯分析。

·數據生命周期不太明確,超過一定天數的數據是否刪除掉沒有統一標準。

基於以上幾個特點,國內的健康碼實行起來可以達到高效快速甄別密切接觸人群的目的,不過一定程度上用戶數據的隱私沒有徹底的保護,數據被濫用的可能性也存在。那麼,讓我們看看國外是怎麼設計的吧。

歐美版「健康碼」

設計目標

由於歐美國家的對於數據隱私保護上有很強的監管,因此在設計疫情監控方案的時候,需要充分考慮到數據隱私保護的影響。同時,歐美民眾天然對政府和大型企業缺乏信任,過度中心化的架構在做疫情監控上也會有不少主力,因此谷歌和蘋果在提出他們的疫情監控方案時候,在同時滿足能夠快速確定密切接觸人群的同時,需要滿足一下幾點數據隱私保護要求:

·最小化收集的數據量。疾控部門應該儘可能的減少對數據收集的要求,同時確保數據匿名化,也就是脫敏。數據只保留能夠快速追蹤密切接觸人群的最必要部分,任何機構都沒法從這個數據裡面獲取敏感個人信息。

·不上傳沒有確診用戶數據。用戶在沒有確診的時候,在沒有徵得用戶授權之前,數據不能上傳到疾控部門那裡,數據會一直留在用戶自己的手機裡面。

·過期數據定期刪除。所有數據應該有一個固定的過期時間,超過這個時間數據應該刪除,進一步降低數據洩露的風險。

·儘可能杜絕數據濫用。因為收集的數據量是極少的,而且在發送給後端之前已經進行了匿名化處理,數據被大規模濫用的可能性也會降到最低。

基於上述數據隱私保護要求,我們來看看歐美版的「健康碼」,是如何具體設計的。

技術細節

簡單來講,歐美版的「健康碼」採用藍牙的BLE(Bluetooth Low Energy)廣播技術,這項技術可以讓設備通過低功耗藍牙協議,向周圍的近距離其他藍牙設備進行廣播信息。由於目前智慧型手機基本具備藍牙功能,因此這個技術方案設計了一個在近距離接觸其他設備時候的信息收集方式,讓我們來看看是他們怎麼做的。

首先,每個設備都需要生成Ephemeral IDs(臨時身份標示符)。EphID生成是依賴某種密碼學算法,因此需要一個私鑰SK。這個私鑰為了確保安全,是需要每天進行更換,當天的私鑰是根據前一天的私鑰的某種哈希值而生成:

另外為了進一步確保EphID的匿名性,該設計要求每天需要生成若干個新的EphIDs,根據相應的時間間隔進行輪換。這個輪換的時間間隔是可以按照分鐘進行配置,假如是30分鐘,那麼每天需要生成48個EphIDs以供輪換。生成EphIDs的算法如下:

PRF是個偽隨機函數(例如:HMAC-SHA256),「broadcast key」是個固定公開的字符串,PRG是一個流加密函數(例如:AES CTR模式)產生n個16 bytes的EphIDs。然後設備可以將這個生成的n個EphIDs隨機打亂順序,然後依次進行使用。這些生成的EphIDs都會存在設備本地,以供後續使用。

當設備有了這些EphID來表示自己的身份之後,會在設備開啟過程中持續向周圍安裝了同樣服務的設備廣播自己的EphID,因此這些設備在運行過程中都會存儲除了自己的 EphID之外的,收到的其他人的EphID,以及一些包含了收到時間的輔助信息。這些設備本地會有一個數據過期時間的配置,例如14天,超過這個時間窗口的數據會被自動清除。我們可以算出來,如果一個人每天接觸100個人,每個人每天有100個EphIDs,14天窗口內,可能需要存儲140k個EphID,EphID的存儲代價是32bytes,因此總體數據量是 4.2 MB,這是一個非常小的數據量了。

那麼,當一個患者確診之後的流程又是怎樣的呢,我們可以參考上圖:

1.患者主動或者被動(根據所在國政策)上傳具有傳染性第一天的私鑰信息到後端伺服器。這個後端伺服器可以是網際網路公司的雲,也可以是政府機構的機房。

2.後端伺服器在收到信息之後會廣播確診患者的私鑰信息,給所有使用該伺服器的設備。這種廣播可以是通過推送的方式進行,也可以是手機設備通過定期輪詢抓取的方式進行。

3.手機收到相關患者私鑰信息之後,會在本地進行一些計算,以確認感染風險,如果感染風險高於閾值,會觸發手機報警。

4.對於高於風險閾值的密切接觸者,可以選擇將自己與患者的接觸信息,包括次數,相對時間等脫敏後的匿名數據,上傳給疾控部門或者流行病學家。這種上傳可以是定期批量上傳,以節省手機的資源消耗。當然很重要的一點是,用戶也可以選擇不上傳。

5.確診患者在確保已完成私鑰上傳之後,需要重新隨機生成一個全新的私鑰,這樣的話確保之後的隱私不會被侵犯。

根據以上的確診患者的數據上報流程,我們可以總結這套設計方案有以下幾個特點:

·後端伺服器扮演的是一個通信媒介的作用,本身不做大規模的數據存儲和分析。這樣就算是後端伺服器被黑或者被濫用,也可以將隱私洩露的風險降到最低。

·對於是否要分享自己的信息給疾控中心相關人員,用戶有自己的選擇權。對於不想共享這部分數據的用戶,可以在自己的手機上關閉。

·疾控中心收到的所有用戶分享的數據全部匿名化脫敏處理,而且數據量非常有限。因此無法從收到的數據裡面探知具體的位置信息,真實身份信息等等。

兩種「健康碼」比較

從上面我們對於兩種「健康碼」技術架構的分析來看,歐美版的「健康碼」在隱私保護上的確有下足功夫,具體可以表現為以下幾個優勢:

·數據收集量很小,每個人每天的數據量<1MB。

·無敏感數據收集,數據匿名化處理,用密碼學方法保證隱私性。

·超過一定時間的數據會被清除。

·未確診患者數據無需上傳,用戶在數據上傳上有選擇權。

·去中心化架構為主,中心化伺服器只作為通信媒介。

不過,從我們對實際運行情況了解來看,這套方案在現實推廣中也會遇到不少問題,總結來說我們認為會有以下幾個劣勢:

·設備如果未開啟藍牙、藍牙功能缺失或者遇到手機沒有電,這部分工作就完全無法進行。

·藍牙傳輸協議的安全性有待商榷,已知已有多種針對藍牙傳輸協議的安全攻擊。

·在人口密集區域,這套廣播協議對設備電量損耗和實際傳輸成功效率都會有不少影響。

·如果很大一部分用戶不積極主動上傳數據給疾控部門,疫情防控工作效率會大打折扣。

·如果被不懷好意的人利用這套協議惡意提交錯誤數據,比如提交錯誤的接觸數據等,會造成一定程度的錯誤判斷。

所以,具體運行過程中這套協議是否能夠有效,非常取決於所在地的國情,我們將繼續觀察這套技術協議在落地過程中的情況。

總結

本篇文章,我們介紹最近推出的歐美版「健康碼」的技術架構和一些細節。我們可以看到國外的模式非常注重隱私和去中心化,這點值得學習。不過這套技術方案是否真正可行和效率高,還需要實際運行檢驗,我們希望在國外技術公司和政府部門努力下,這套模式能有個好的最終落地結果。(作者:方建,續科天下(北京)科技有限公司CTO)

相關焦點

  • 美國科技巨頭擬推出「健康碼」:和中國版區別在哪 效果會如何?
    該項目目前仍面臨隱私保護、有效性等方面的質疑,但很多人對這次合作充滿期待。國內媒體的解讀也往往將其與國內的「健康碼」相聯繫,將其喻為全球最大健康碼項目。我們深度比較後,發現二者從運作理念、技術原理、覆蓋範圍、推進方式,效果考察等方面存在較大差異。
  • 數字法治|寧園:健康碼運用中的個人信息保護規制
    然而,健康碼的實際運行卻基本不受知情同意原則的約束。儘管健康碼為自願申領,但由於目前個人復工、出行尤其是跨區域流動均要求出示健康碼,健康碼的使用具有現實強制性,個人信息主體實則無作出是否同意提交個人信息之決定的空間。實踐中,大多數省市在健康碼申領程序中並未設置任何知情同意、隱私保護條款。除此之外,健康碼的劃分標準和算法規則並不透明,尤其是賦碼規則全然處於暗箱之中。
  • 孫立林:在疫情防控和流調中 如何最大限度地保護個人隱私
    對於逝去生命的傷痛與疫情擴散的恐慌之下,科學與技術的作用也被放大到公眾視野,從疫苗的研發到小小健康碼的使用都會是不同視角的焦點,引發不同層面的爭議。在疫情之初始: 從武漢封城之初各地尋找與感染者同一輛列車的乘客信息、到武漢市社區沉降行動期間公布感染者及疑似感染者名單;到開始逐步恢復生產和流動:從各地健康碼的普遍發行與認定、到無所不在的人臉識別甚至是戴口罩的人臉識別。
  • 疫情期間,我的隱私誰來保障?
    想必大家都發現了自疫情出現以來,進入公共場合總是要掃健康碼出示自己的行蹤軌跡那麼就有人問了這樣的行為是不是在侵犯我的隱私權呢?這樣是不是會洩露自己的隱私呢?主播法官:贛州經開區法院綜合審判庭負責人陳瑜青陳法官:現如今疫情防控進入了常態化階段,走哪都要掃健康碼,那麼,就有人問,我還有隱私嗎?尤其是,前段時間,成都確診女孩的身份證號碼、家庭住址等個人信息在社交媒體上被洩露。那麼,今天我們就來說明一下,疫情期間的隱私保護。
  • 「散裝碼」成兩會熱詞 丁佐宏提交隱私保護提案得網友點讚
    疫情期間,為加強防控,維護人員健康,各類健康碼、地方碼、行業碼、公司碼、商場碼、社區碼等層出不窮,但疫情爆發期過去後,在常態化防疫形勢下,各種「散裝碼」卻引發了社會對於所存個人信息被濫用的擔憂。隱私信息暴露的風險防範得到了網友們的很多網友認為,一次出行經常很碰到多次掃碼及填寫個人資料,且互不通用、互不相認。
  • 「深度」一個人六個碼,健康碼為什麼這麼難統一?
    就杭州而言,判定標準主要與三個維度有關:一是空間維度,某人所在地區的疫情風險程度;二是時間維度,某人去過疫區的次數和時間長短;三是人際關係維度,某人密切接觸人員的狀態等。這些指標量化打分,最終形成三色碼。跟據杭州政府披露的數據,杭州健康碼上線四天後,有近3萬人申請健康碼覆核。
  • 調查報告丨疫情之後,我們是否仍然需要健康碼?
    圖:健康碼在疫情防控中發揮的作用健康碼一是在局地疫情背景下「解決了跨區安全有序流動問題」(59.41%),能夠保證疫情不向外擴散的情況下,維持正常的人員流動和經濟流動;二是「為網格化治理提供了抓手」(46.47%),助力社區疫情防控工作的同時也完善網格化功能,檢驗社區基層治理現代化的成果。
  • 國際版健康碼有什麼不一樣 國際版健康碼橙黃綠三色分別代表什麼意思
    國際版健康碼今天(3月16日)下午3點,浙江省新型冠狀病毒感染的肺炎疫情防控工作新聞發布會舉行第36場。鑑於新冠病毒潛伏期較長、存在無症狀感染者等情況,對疫情嚴重國家和地區入境的發熱或有呼吸道症狀人員、密切接觸者進行核酸檢測,並結合大數據篩查,確保早發現、早報告、早隔離、早治療。另一方面,充分兼顧入境人員合理關切,使來自低風險國家和地區的人員儘可能順暢通關,讓健康人員避免交叉感染。不少僑胞近期是從其他城市入境,繼而前來浙江。
  • 關於「健康碼」的思考
    從那之後我們開始逐漸認識二維碼,也正因為微信和支付寶軟體的安裝率,讓「掃碼」成為了一件稀鬆平常的事情,也正是在這樣的環境下,二維碼作為信息儲存方式,被運用于越來越多的場景,掃個碼可以打卡網頁、掃個碼可以查看火車票信息、掃個碼可以看視頻聽音樂……而今年的疫情讓「二維碼」作為一種信息儲存格式最原本的作用發揮得淋漓盡致,通過「健康碼」,依賴微信和支付寶本身的實名驗證渠道,實現了公民健康信息的記錄與識別功能
  • 北京老人不用手機也能出示健康碼
    老年人不用手機,也能「亮」出健康碼。 近日,記者從市經信局獲悉,北京市試點老年人刷養老助殘卡就能完成「北京健康寶」健康狀態查詢、來訪登記等功能,整個過程像坐公交車刷卡一樣簡單便捷。
  • 衛健委通知:推進健康碼全國一碼通行,低風險地區一般人不查驗
    通知中要求各地按照國家制定發布的統一技術標準規範,加快推進居民電子健康碼規範應用;要求各地落實健康碼信息互認機制和規則,明確跨地區流動人員健康碼信息在各地區可信可用,實現防疫健康碼統一政策、統一標準、全國互認、一碼通行。在低風險地區,除特殊場所和特殊人員外,一般不應查驗健康碼。
  • 國際版健康碼是什麼 國際版健康碼有哪些不同?
    3月16日,浙江省政府新聞辦舉行新冠肺炎疫情防控工作新聞發布會。浙江省防控工作領導小組辦公室常務副主任、省政府副秘書長陳廣勝在發布會上表示,現在針對返浙華人、華僑、留學生及其他外籍人士實際情況,推出健康碼國際版,與國內版適當區分,實行橙黃綠三色分類。
  • 隱私洩露是不是更長遠的一種疫情?
    進入冬季,疫情的發展果然如人們擔心的一樣,這不,連很久沒有本土確診病例的四川成都都在本周一、周二(7日、8日)接連通報了6名新增本土病例和一名無症狀感染者。然而,人們關注成都,除了疫情本身,還有一位20歲的確診病例趙某個人信息被公然洩露的細節,一張帶有趙某真實姓名、身份證號碼、家庭住址、活動軌跡等隱私信息的圖片在網上流傳。
  • 國際版健康碼怎麼回事 國際版健康碼有什麼作用 國際版健康碼在...
    中新網杭州3月16日電(記者 張斌)針對返浙華人華僑、留學生及其他外籍人士實際情況,浙江已推出健康碼國際版。為與國內版適當區分,健康碼國際版實行橙、黃、綠三色分類。截至16日12時,該省已累計發放健康碼7209.2萬張,其中國際碼3.1萬張。
  • 觀察丨使用「健康碼」能平衡個人信息保護和使用嗎?
    疫情期間,為了便於對個人的健康狀況進行查詢和驗證,各地陸續上線了健康碼服務。健康碼是一個數位化的健康評估證明,在此次疫情防控和復工復產中得到廣泛應用。當前,健康碼正在被廣泛應用,也出現了一些社區、學校、企業等自建、使用免費工具或委託開發健康碼相關系統的情況,這勢必導致標準不一,管理水平不一等現狀,不利於個人信息保護和數據互認互通。
  • 龍江健康碼小程序系統平臺
    但是,他們在上課之前,仍然會堅持認真備課,反覆鑽研教材、教參,做到對本堂課的內容瞭若指掌,還會提前到實驗室去,親手準備每一樣藥品和儀器,甚至親自動手再操作,不懈怠任何一個環節,以確保實驗演示時萬無一失。有了如此充分的準備,再加上自身的點擊進入申領龍江健康碼隨申碼的工作原理是什麼?
  • 疫情大數據回顧系列三:數據隱私保護向左還是向右?
    收集或掌握個人信息的機構要對個人信息的安全保護負責,採取嚴格的管理和技術防護措施,防止被竊取、被洩露。交通部在1月30日發布緊急通知,要求依法嚴格保護個人隱私和個人信息安全,除因疫情防控需要,向衛生健康等部門提供乘客信息外,不得向其他機構、組織或者個人洩露有關信息、不得擅自在網際網路傳播。
  • 國際版健康碼公眾號
    防疫健康碼國際版是目前比較流行的健康碼,那麼這個健康碼該怎麼申請怎麼用呢,下面說下具體操作。中國民用航空局、中華人民共和國海關總署關於中國籍旅客乘坐航班回國前填報防疫健康信息的公告:防疫健康碼國際版使用技巧點擊下方文字進入申請國際版健康碼↓↓↓↓得到別人幫助的作文  你把最好的給予別人,就會從別人那裡獲得最好的,幫助他人就是幫助自己。你幫助的人越多,你得到的也越多。你越吝嗇,就越一無所有。
  • 衛健委要求健康碼全國一碼通行,破除多碼並存互不通用信息壁壘
    特別是在疫情防控期間,各地創新線上服務模式,為支撐疫情精準防控、避免聚集交叉感染、促進人員有序流動和復工復產等發揮了重要作用。為總結推廣實踐中湧現出的典型做法,進一步聚焦人民群眾看病就醫的「急難愁盼」問題,持續推動「網際網路+醫療健康」便民惠民服務向縱深發展,國家衛生健康委、國家醫保局、國家中醫藥局決定在全行業深化「五個一」服務行動。
  • 獨家| ChinaLedger白碩:區塊鏈中的隱私保護
    他認為,在區塊鏈隱私問題上,目前技術的發展程度對隱私的保護還很差,但也不能認為這就是區塊鏈的固有局限,它還有可以改進的空間。隱私保護是很重要的,而且有現實的需求;如果說馬上就要實現,等不得那些非常完美的方案,就要兼顧隱私強度和去中心化的程度,根據自身的應用場景找一個適當的平衡。