不一樣的歐美版「健康碼」 一種去中心化的,具有隱私保護的疫情...

2020-12-12 中國網科學頻道

【前言】當地時間2020年4月10日,蘋果與谷歌宣布將聯手推出一項方案,利用藍牙技術幫助政府和衛生機構減緩病毒蔓延,這項方案也被國內媒體解讀為歐美版「健康碼」。對於「健康碼」這個概念,相信在國內的大家已經很熟悉了,疫情期間成為了防控工作的一個有效工具。當歐美版這個「健康碼」新聞出來的時候,我們第一時間也關注到了這個新聞,第一反應是美國的網際網路公司終於「抄作業」了。不過從我們對蘋果和谷歌的技術細節進行深入了解之後,我們發現這個歐美版的「健康碼」並不是直接抄作業,而是根據歐美國家的國情做了很不一樣的設計,本文也將通過分析這項技術方案的設計原則來講解歐美版的「健康碼」到底哪裡不一樣。

筆者註:本文的技術分析基於蘋果和谷歌官方技術文檔,以及開源項目。DP-3T (Decentralized Privacy-Preserving Proximity Tracing)開源項目跟蘋果和谷歌沒有直接聯繫,DP-3T是由一群歐洲的科學家所發起的疫情追蹤開放式協議,不過DP-3T所倡導的大部分設計思想已被蘋果和谷歌採納,因此本文的大部分內容都來源於DP-3T開源項目的白皮書。

國內版「健康碼」

首先讓我們來看看國內目前健康碼大體的一個技術架構。根據我們對所見到的健康碼分析研究,我們認為國內健康碼大多採取的是中心化的大數據收集和分析模式,其具備以下幾個特點:

·中心化存儲所有用戶的行程和身份信息,方便統一進行大數據分析和調控。

·沒有確診的用戶數據也會上傳,確保出現疫情的時候能夠快速通知到密切接觸人群。

·收集的用戶信息包含了身份信息,行程信息等敏感數據,方便進行數據關聯分析。

·數據生命周期不太明確,超過一定天數的數據是否刪除掉沒有統一標準。

基於以上幾個特點,國內的健康碼實行起來可以達到高效快速甄別密切接觸人群的目的,不過一定程度上用戶數據的隱私沒有徹底的保護,數據被濫用的可能性也存在。那麼,讓我們看看國外是怎麼設計的吧。

歐美版「健康碼」

設計目標

由於歐美國家的對於數據隱私保護上有很強的監管,因此在設計疫情監控方案的時候,需要充分考慮到數據隱私保護的影響。同時,歐美民眾天然對政府和大型企業缺乏信任,過度中心化的架構在做疫情監控上也會有不少主力,因此谷歌和蘋果在提出他們的疫情監控方案時候,在同時滿足能夠快速確定密切接觸人群的同時,需要滿足一下幾點數據隱私保護要求:

·最小化收集的數據量。疾控部門應該儘可能的減少對數據收集的要求,同時確保數據匿名化,也就是脫敏。數據只保留能夠快速追蹤密切接觸人群的最必要部分,任何機構都沒法從這個數據裡面獲取敏感個人信息。

·不上傳沒有確診用戶數據。用戶在沒有確診的時候,在沒有徵得用戶授權之前,數據不能上傳到疾控部門那裡,數據會一直留在用戶自己的手機裡面。

·過期數據定期刪除。所有數據應該有一個固定的過期時間,超過這個時間數據應該刪除,進一步降低數據洩露的風險。

·儘可能杜絕數據濫用。因為收集的數據量是極少的,而且在發送給後端之前已經進行了匿名化處理,數據被大規模濫用的可能性也會降到最低。

基於上述數據隱私保護要求,我們來看看歐美版的「健康碼」,是如何具體設計的。

技術細節

簡單來講,歐美版的「健康碼」採用藍牙的BLE(Bluetooth Low Energy)廣播技術,這項技術可以讓設備通過低功耗藍牙協議,向周圍的近距離其他藍牙設備進行廣播信息。由於目前智慧型手機基本具備藍牙功能,因此這個技術方案設計了一個在近距離接觸其他設備時候的信息收集方式,讓我們來看看是他們怎麼做的。

首先,每個設備都需要生成Ephemeral IDs(臨時身份標示符)。EphID生成是依賴某種密碼學算法,因此需要一個私鑰SK。這個私鑰為了確保安全,是需要每天進行更換,當天的私鑰是根據前一天的私鑰的某種哈希值而生成:

另外為了進一步確保EphID的匿名性,該設計要求每天需要生成若干個新的EphIDs,根據相應的時間間隔進行輪換。這個輪換的時間間隔是可以按照分鐘進行配置,假如是30分鐘,那麼每天需要生成48個EphIDs以供輪換。生成EphIDs的算法如下:

PRF是個偽隨機函數(例如:HMAC-SHA256),「broadcast key」是個固定公開的字符串,PRG是一個流加密函數(例如:AES CTR模式)產生n個16 bytes的EphIDs。然後設備可以將這個生成的n個EphIDs隨機打亂順序,然後依次進行使用。這些生成的EphIDs都會存在設備本地,以供後續使用。

當設備有了這些EphID來表示自己的身份之後,會在設備開啟過程中持續向周圍安裝了同樣服務的設備廣播自己的EphID,因此這些設備在運行過程中都會存儲除了自己的 EphID之外的,收到的其他人的EphID,以及一些包含了收到時間的輔助信息。這些設備本地會有一個數據過期時間的配置,例如14天,超過這個時間窗口的數據會被自動清除。我們可以算出來,如果一個人每天接觸100個人,每個人每天有100個EphIDs,14天窗口內,可能需要存儲140k個EphID,EphID的存儲代價是32bytes,因此總體數據量是 4.2 MB,這是一個非常小的數據量了。

那麼,當一個患者確診之後的流程又是怎樣的呢,我們可以參考上圖:

1.患者主動或者被動(根據所在國政策)上傳具有傳染性第一天的私鑰信息到後端伺服器。這個後端伺服器可以是網際網路公司的雲,也可以是政府機構的機房。

2.後端伺服器在收到信息之後會廣播確診患者的私鑰信息,給所有使用該伺服器的設備。這種廣播可以是通過推送的方式進行,也可以是手機設備通過定期輪詢抓取的方式進行。

3.手機收到相關患者私鑰信息之後,會在本地進行一些計算,以確認感染風險,如果感染風險高於閾值,會觸發手機報警。

4.對於高於風險閾值的密切接觸者,可以選擇將自己與患者的接觸信息,包括次數,相對時間等脫敏後的匿名數據,上傳給疾控部門或者流行病學家。這種上傳可以是定期批量上傳,以節省手機的資源消耗。當然很重要的一點是,用戶也可以選擇不上傳。

5.確診患者在確保已完成私鑰上傳之後,需要重新隨機生成一個全新的私鑰,這樣的話確保之後的隱私不會被侵犯。

根據以上的確診患者的數據上報流程,我們可以總結這套設計方案有以下幾個特點:

·後端伺服器扮演的是一個通信媒介的作用,本身不做大規模的數據存儲和分析。這樣就算是後端伺服器被黑或者被濫用,也可以將隱私洩露的風險降到最低。

·對於是否要分享自己的信息給疾控中心相關人員,用戶有自己的選擇權。對於不想共享這部分數據的用戶,可以在自己的手機上關閉。

·疾控中心收到的所有用戶分享的數據全部匿名化脫敏處理,而且數據量非常有限。因此無法從收到的數據裡面探知具體的位置信息,真實身份信息等等。

兩種「健康碼」比較

從上面我們對於兩種「健康碼」技術架構的分析來看,歐美版的「健康碼」在隱私保護上的確有下足功夫,具體可以表現為以下幾個優勢:

·數據收集量很小,每個人每天的數據量<1MB。

·無敏感數據收集,數據匿名化處理,用密碼學方法保證隱私性。

·超過一定時間的數據會被清除。

·未確診患者數據無需上傳,用戶在數據上傳上有選擇權。

·去中心化架構為主,中心化伺服器只作為通信媒介。

不過,從我們對實際運行情況了解來看,這套方案在現實推廣中也會遇到不少問題,總結來說我們認為會有以下幾個劣勢:

·設備如果未開啟藍牙、藍牙功能缺失或者遇到手機沒有電,這部分工作就完全無法進行。

·藍牙傳輸協議的安全性有待商榷,已知已有多種針對藍牙傳輸協議的安全攻擊。

·在人口密集區域,這套廣播協議對設備電量損耗和實際傳輸成功效率都會有不少影響。

·如果很大一部分用戶不積極主動上傳數據給疾控部門,疫情防控工作效率會大打折扣。

·如果被不懷好意的人利用這套協議惡意提交錯誤數據,比如提交錯誤的接觸數據等,會造成一定程度的錯誤判斷。

所以,具體運行過程中這套協議是否能夠有效,非常取決於所在地的國情,我們將繼續觀察這套技術協議在落地過程中的情況。

總結

本篇文章,我們介紹最近推出的歐美版「健康碼」的技術架構和一些細節。我們可以看到國外的模式非常注重隱私和去中心化,這點值得學習。不過這套技術方案是否真正可行和效率高,還需要實際運行檢驗,我們希望在國外技術公司和政府部門努力下,這套模式能有個好的最終落地結果。(作者:方建,續科天下(北京)科技有限公司CTO)

相關焦點

  • 健康碼是否存在數據安全風險?專家:未授權掃碼或會洩露信息
    在後疫情時代,健康碼的使用已經成為我們的日常。在採集了很多個人信息之後,健康碼是否存在數據安全的風險?10月13日,2020小蠻腰科技大會在廣州舉行。在南都承辦的「深謀遠慮·後疫情時代的大數據應用與隱私保護」分論壇上,中國電子技術標準化研究院信息安全研究中心數據安全部主任胡影作了題為《健康碼數據安全指引》的演講。中國電子技術標準化研究院信息安全研究中心數據安全部主任胡影。攝/南都記者 馮宙鋒新冠疫情以來,健康碼助力疫情防控和復工復產,發揮了非常大的作用。
  • Zoom危機與「健康碼」抗疫:新冠大流行下,你願意讓渡多少隱私?|...
    於是,包含了個人隱私的數據被商品化。當下的消費行為不僅僅需要交出貨幣,同樣意味著要交出隱私。  可以預料的是,未來這種衝突只增不減。 2.疫情之下,危機的塑造力 而現在,冠狀病毒疫情正在讓高度數位化的未來提前到來。
  • 健康碼後臺如何生成與運行的?能不能保護個人信息?答案來了!
    健康碼收集的個人信息經過編碼加密,很難直接識別。」中國人民大學民商事法律科學研究中心研究員寧園在知網論文《健康碼運營中的個人信息保護規制》中提到。健康碼有哪些優勢?「健康碼」在全國範圍內推行時,每個擁有智慧型手機且具有出行需求的個人都被要求使用。對於沒有智慧型手機的兒童和老年人,「健康碼」可以以添加家人的方式獲得專屬「健康碼」。
  • 粵澳健康碼秒轉背後,「黑科技」區塊鏈如何發揮作用?
    健康碼轉換,如何符合兩地隱私保護的法律法規?按照規定,兩地的隱私數據不能出境,兩地機構如何在數據不直接傳輸的情況下驗證對方居民的健康信息?加密過的數據,如何確認其可信與真實性?區塊鏈技術為跨境數據互通和居民隱私保護提供了解決方案,至今已有1700萬人次持健康碼通關。為此,南方日報記者採訪了粵澳健康碼互認系統的各建設方,解碼區塊鏈技術為大灣區深度融合和跨境合作提供了快速建立連接的秘密。
  • 谷歌蘋果聯手,美版健康碼「真香」上線,但推廣是個問題……
    谷歌蘋果罕見聯手,論「監視」他們才是專業的中國的健康碼系統,大多數時候是「手動操作」的:用戶在前往某一公共場所時,掃描該場所的二維碼,將「無異常」的結果出示給值守人員後獲準進入,同時留下在某一時段訪問某場所的記錄,一旦疾控中心發現確診患者曾到訪某地,就能藉助這個系統查找到可能有過密切接觸的人員。
  • 譚作鈞調研大連健康碼推廣使用工作
    #抗擊疫情大連在行動#3月10日,省委常委、市委書記、市新冠肺炎疫情防控指揮部總指揮譚作鈞前往我市部分酒店、社區、交通樞紐和市大數據中心,調研檢查大連健康碼推廣使用等工作。他強調,當前,疫情防控形勢依然嚴峻,復工復產工作刻不容緩,要大力宣傳推廣普及大連健康碼,利用科技手段精準助力疫情防控和復工復產,加快恢復我市正常生產生活秩序。市領導熊博力、靳國衛參加。「在用健康碼過程中遇到什麼困難?」「對推廣應用健康碼有什麼建議?」
  • 「深度」一個人六個碼,健康碼為什麼這麼難統一?
    就杭州而言,判定標準主要與三個維度有關:一是空間維度,某人所在地區的疫情風險程度;二是時間維度,某人去過疫區的次數和時間長短;三是人際關係維度,某人密切接觸人員的狀態等。這些指標量化打分,最終形成三色碼。跟據杭州政府披露的數據,杭州健康碼上線四天後,有近3萬人申請健康碼覆核。
  • 健康碼萬「碼」奔騰 離一「碼」走天下還有多久?
    四川在線記者 寇敏芳 田姣疫情的發生讓大健康產業進入到蓬勃發展的風口。10月10日-11日舉行的天府健談·CHS2020第五屆中國健康產業升級峰會上,大健康行業的數位化升級成為關注重點。數位化技術飛速發展,幫助疫情防控解決了大問題,但另一方面,在小小的一張健康碼上,也反映出技術和制度方面很多亟待解決的問題。萬「碼」奔騰問題的背後,是大數據在醫療領域共建共享不足的體現。
  • 衛健委通知:推進健康碼全國一碼通行,低風險地區一般人不查驗
    通知中要求各地按照國家制定發布的統一技術標準規範,加快推進居民電子健康碼規範應用;要求各地落實健康碼信息互認機制和規則,明確跨地區流動人員健康碼信息在各地區可信可用,實現防疫健康碼統一政策、統一標準、全國互認、一碼通行。在低風險地區,除特殊場所和特殊人員外,一般不應查驗健康碼。
  • 國際版健康碼有什麼不一樣 國際版健康碼橙黃綠三色分別代表什麼意思
    國際版健康碼今天(3月16日)下午3點,浙江省新型冠狀病毒感染的肺炎疫情防控工作新聞發布會舉行第36場。鑑於新冠病毒潛伏期較長、存在無症狀感染者等情況,對疫情嚴重國家和地區入境的發熱或有呼吸道症狀人員、密切接觸者進行核酸檢測,並結合大數據篩查,確保早發現、早報告、早隔離、早治療。另一方面,充分兼顧入境人員合理關切,使來自低風險國家和地區的人員儘可能順暢通關,讓健康人員避免交叉感染。不少僑胞近期是從其他城市入境,繼而前來浙江。
  • 國際版健康碼是什麼 國際版健康碼有哪些不同?
    3月16日,浙江省政府新聞辦舉行新冠肺炎疫情防控工作新聞發布會。浙江省防控工作領導小組辦公室常務副主任、省政府副秘書長陳廣勝在發布會上表示,現在針對返浙華人、華僑、留學生及其他外籍人士實際情況,推出健康碼國際版,與國內版適當區分,實行橙黃綠三色分類。
  • 健康碼是個被忽視的奇點事件
    2020年2月11日,疫情最嚴重的時候,健康碼在杭州率先推出,用「紅黃綠」三色二維碼作為數位化健康證明,居民和來杭人員只需上釘釘或支付寶領取,綠碼可憑碼通行,紅碼和黃碼需按規定隔離並健康打卡。健康碼的出現,居民不再需要重複填報健康表格,高速路口和小區卡口工作人員也更加便利,實現了「無接觸式」查驗,降低了感染風險。
  • 【健康生活】健康碼使用最新要求!
    行動通知要求,各地要依託全國一體化政務服務平臺,落實「健康碼」信息互認機制和規則,明確跨地區流動人員「健康碼」信息在各地區可信可用,切實方便人員出行和跨省流動,實現防疫「健康碼」統一政策、統一標準、全國互認、一碼通行。在低風險地區,行動通知明確,除特殊場所和特殊人員外,一般不應查驗「健康碼」。
  • 健康碼,要大一統了!
    在看到衛健委12月10日發布《關於深入推進「網際網路+醫療健康」「五個一」服務行動的通知》(以下簡稱《通知》)指出,推進「一碼通」融合服務,破除多碼並存互不通用的信息壁壘,這一新聞之時,想必工作需要經常出差的朋友們第一時間都會想到開篇的那句歌詞。作為疫情期間被趕製出來的產品,健康碼在疫情防控工作中起到了重要的作用,更是被視為現代城市公共衛生醫療系統升級的新方案。
  • 北京「健康寶」:掃碼登記洩露隱私?信息「脫敏」保安全
    日前,隨著疫情防控常態化及「健康寶」的廣泛應用,驗碼出入已經成為市民日常生活中不可缺少的一部分,新增的掃碼登記功能在各大場所陸續推行,減輕了現場管理的壓力。市民可能會有這樣的疑慮,到哪裡都掃碼登記,我的個人信息會不會被洩露?
  • 健康碼上線百天:覆蓋10億用戶 或演化為「城市碼」
    中新網北京5月19日電(記者 吳濤)19日,騰訊防疫健康碼上線100天。騰訊官方公布,截至目前,累計訪問量達260億次、亮碼90億人次、共覆蓋全國10億人口、400多個市縣、5100多個村莊,成為疫情防控有力工具。
  • 「隱私權」擔憂之下 各國「健康碼」能否大一統?
    還記得早在3月份,《紐約時報》寫了一篇關於中國健康碼的報導,幾乎是以描述洪水猛獸的筆觸,揭露了「一種新型的對人身自由的鉗制」。但一些後發國家選擇了新的技術路線,比如以藍牙與加密技術為核心,也確實提高了對於個人隱私的保護水平。  這是一個越來越精細的過程,國家之間是可以互相學習,互相促進的。像《紐約時報》那樣還不了解,就開始大肆批評。現在回頭看像個笑話。  跨國旅行寬嚴  一國在本土推廣追蹤軟體尚且如此困難,更不要說追蹤跨國流動的人員了。
  • 山西健康碼 智慧化公共服務新模式的成功嘗試
    面對疫情防控和經濟社會發展的雙重考驗,諸多數位化、智能化的創新技術應用正在加速與生產生活融合。作為疫情防控期間重要的身份識別依據,短短二十餘天時間,山西健康碼註冊申領人數已達1032萬人。乘公交、赴景區、逛商場、去醫院……這枚手機裡的「二維碼」,作為我們每個人健康出行的安全保障,默默服務著百姓生活,越來越多的人對它從陌生到熟悉。
  • 健康碼全國一碼通行背景下:國辦健康碼人臉測溫一體機將發揮大作用
    在疫情防控常態化背景下,出入各醫院場所、學校、政企單位、農貿批發市場、機場、海關和各公共管理服務等風險場所都需強制落實查體溫、查身份證和防疫健康碼信息以確保健康安全。
  • 央行李偉:隱私保護刻不容緩 數字鴻溝問題依然存在
    特別是在當前國際疫情持續蔓延和全球經濟形勢嚴峻複雜的背景下,金融科技創新對於凝聚金融發展新動能、深化數位化轉型具有特殊重要意義,已成為引領產業變革、助力新經濟發展的核心力量。金融業要牢記有技術不能任性、有數據不能濫用,嚴格落實風險主體責任,不能突破制度約束,守住不發生系統性風險的底線。當前,我們要重點關注以下風險點。1.隱私保護刻不容緩。網際網路時代,數據安全與隱私保護已成為金融科技創新過程中不可迴避的問題,消費者數據被過度採集、非法共享、隨意濫用等現象層出不窮,金融隱私保護問題形勢嚴峻。