醫療做AI,不能不顧隱私

2021-01-11 手機鳳凰網

做AI,實際上就是讓計算機根據一小部分已知的數據,在人的「指揮」下,自我生成程序,進而能夠處理更多的數據。而事實上,AI訓練出程序的這個過程,所需的數據是需要達到一定數量,而且要經過人類的預處理的。

以AI領域截至目前突破最大的圖像處理領域為例,李飛飛在內的數位研究者和機構2009年共同搭建了ImageNet項目,其中包含了1400萬張、各種各樣、人類手工標註的圖片。其中不少圖片都是學術研究者拿自己為模特拍攝的圖片,完全不存在版權和隱私問題。

ImageNet對於AI圖像領域是至關重要的突破

也正是因為這些原始數據的存在,全世界的AI研究者才在之後研究出了ResNet在內的一系列專門針對圖像進行深度學習的神經網絡架構。

但當以AI計算力驅動的圖像分析技術,拓展到醫療領域時,卻出現了很尷尬的事情——儘管已經有了基礎性的圖片神經網絡、儘管有不少學術研究利用小樣本數據已經證明了應用的潛力,可實際的落地仍十分艱難。關鍵的阻礙就在於隱私。

醫療行業本身就在AI系統的準確度上要求更高,在AI學術研究時,幾十人的數據可能就足夠了,而到了實際的臨床應用,可能需要成百上千甚至數萬人。後一種情況下,同一個醫院顯然不可能總有那麼多的同類患者,跨醫院的數據分享幾乎是強制性的要求。原本只存儲在一家醫院的數據現在被迫在多家醫院之間穿梭,顯然隱私得不到保障。

這也不僅會觸犯到病患的隱私、有可能造成別人利用這種信息來牟利、更有可能直接打擊到普通消費者對於使用AI的決心,間接影響了AI在整個醫療領域的推廣。

而就在上一周,在深圳舉行行的全球最高端的醫學影像會議之一——MICCAI 2019大會上,英偉達和倫敦國王學院的研究人員就介紹了他們的最新技術成果:首個面向醫學影像的隱私保護型聯邦學習系統。

又要AI又要隱私的系統

此次英偉達發布的「面向醫學影像的隱私保護型聯邦學習系統」

先簡單解釋一下聯邦學習(federated learning),它是一種能夠讓開發者與各企業機構利用分散在多個位置的訓練數據對中心深度神經網絡(DNN)進行訓練的學習範式,該方法可以支持各企業機構針對共享模型開展協作,而無需共享任何臨床數據。

通過應用聯邦學習,數據是不用上傳了,但通過數據訓練出來的神經網絡依舊要上雲,這些神經網絡雖然不包括最直接的源數據,可通過對神經網絡進行分析和反推算,依舊能夠找出部分源數據,也就是說隱私依舊得不到保障。

這個時候我們就要祭出另外一項法寶技術:差分隱私。這項技術其實在2016年就被蘋果在WWDC上提出來說過一波。我找出了當時蘋果公司比較詳細的官方介紹——「這是一種利用概率學原理,在儘可能多地了解一個群體的情況下不去了解這個群體內的人。擁有了這項技術的蘋果,能夠利用他們手機和存儲的用戶數據反過來了解用戶言語、喜好、以及需求。」

用我當時自己的話說:這是一個弱化之後的用戶信息收集策略,關鍵在於不能從手機信息裡還原具體是誰,但同時能夠區分是哪一群體。整體步驟應該包括用戶數據的 「打碎」,並且降低不同碎片之間的關聯性。

舉個例子:

李雷放學之後,在學校門口的第三間書店見到了韓梅梅。然後在書店旁邊的電影院看了《魔獸世界》,最後在和韓梅梅道別之後回到了自己在學校旁邊的家裡。

而實際收集的數據卻 「很有可能」 是這樣的:

英偉達此次的研究邏輯同樣也是如此,在醫療影像進行聯邦學習之後,神經網絡上傳的這一步中,再對數據進行差分隱私,導入的噪聲信息就足以保障之前所擔心的隱私問題了。

最後但也是最重要的是,英偉達此次提出的這一整套深度學習系統並沒有局限於哪一個醫療範圍,而是所有涉及到醫療影像的應用都可以使用。其次,這個學習系統已經出現在了英偉達的Clara Train SDK中,後者本身就是英偉達為了簡化AI醫療應用所提供的軟體開發組件,這也意味著這一整套深度學習系統的應用將會無比簡單。

鑑於目前英偉達在多個AI應用領域都構建了相應的SDK套件,已經針對行業乃至賽道的針對性優化,假如別的場景中也需要「聯盟學習+差分隱私」這一套方案,相信也能夠很快的遷移、改造出來。

英偉達副總裁和科學家還說了啥?

NVIDIA醫療副總裁,Kimberly Powell

在本次MICCAI 2019現場,虎嗅其實也與NVIDIA醫療副總裁,Kimberly Powell,以及這項研究的作者之一NVIDIA資深研究科學家,Nicola Rieke進行了交流,以下是一些關鍵的問答內容。

問:就這個系統而言,使用「聯邦訓練」的考量可能是什麼,為什麼訓練神經網絡的數據不會被「反推」?

Kimberly Powell:在聯邦學習系統下,其實它實際的數據、其實是模型找數據,而不是數據找模型。模型找數據用的是本地的數據來進行訓練,所以在這個新的技術當中最大的突破,實際上就是我們在「回傳數據」。訓練完、數據回傳的時候,要保證最少的涉及到隱私的數據被回傳過來,所以我們只是回傳訓練後模型的那個數據,而不是原有的數據。

其實涉及到「聯邦學習」整個系統下面、涉及到隱私,其實也是有不同層級的。我們在搭建這個學習體系的時候,其實就已經給予了數據一定的隱私性。所以剛才我們提到,就是說其實我們不是數據追模型,而是用模型去追數據,所以這些數據其實一直在醫院、從來沒有離開過醫院,這些用戶的數據一直是待在醫院中的。當然,就像您說的,確實有一定的道理。

因為你如果根據這個模型反推,根據模型訓練出來的數據,然後你又知道底層的運行邏輯,可能是能夠做一些反推的事情,所以這個其實就是這個模型反推的技術。所以當然我們作為研究人員的話,其實也是想到了這一步,所以就往前也走了一步,所以這也是我們為什麼把它稱之為叫「隱私保護的聯邦學習體制」,也就是在這樣的一個基礎之上給隱私又加了一個保護層。所以我們在訓練完之後,這個數據當中加入了一些「噪點」這樣就可以使有一些數據變得模糊,我們也改變了原有數據的顆粒度,這樣就使得你反推就更加困難了。

問:從今年春季到現在,整個Clara平臺,有沒有什麼技術升級、創新可以給我們享一下?

Nicola Rieke:其中一個比較大的進展,其實大家也看到就是我們Clara平臺開發者數量增長比較快的一個主要原因,就是我們工具集是高度模塊化的。在Clara第一個版本當中,其實我們整個工作流是提前設定好的。也就是說,你用現有的模型去訓練現有的預定好的模型。在最新的版本當中,其實你就可以將自己的模型帶到這個平臺來做訓練,所以這也是在使用層面來說就是更加友好了。

另外,我們還整合了一些開源的其它工具到這個平臺當中。比如:醫療影像的一個新的瀏覽器功能,相當於是一個「AI助理分析工具」,它能有從三個視角看這個圖象,所以從用戶的角度來說,用起來也就更加方便了。另外一個,就是第三個我們做的改善,就是性能優化,尤其是在數據加載到訓練的過程當中。因為在會上也有說:有時候數據加載的時間,可能比訓練的時間還要長。另外的話,我們可以用這種,就是實現了自動化多GPU訓練,也就是用戶不用去管它。

問:英偉達AI醫療領域這一塊,國內有沒有理想的合作夥伴?

Kimberly Powell:是有的,現在我們也是在NVIDIA內部是在打造中國本土的醫療團隊。我們之所以來參加今天的會議,其實也是去見一些潛在的合作夥伴。

這次我們推出的技術,它只是一個工具。我們當然是賣GPU產品的,但是這是一個工具。所以建不建共享的數據中心,這個是完全取決於我們各地或者是各個機構你自己去考慮的問題。比如:一個省裡面可能有30家醫院,你要共享數據去訓練一個模型。那就是這些家醫院自己討論,是不是建立一個共享的中心,也可能去用公有雲、也可能自己去建區域的雲,我們只是給了你一個技術。

相關焦點

  • 天醫AIDOC:AI+區塊鏈+醫療,共振世界
    眾所周知,與健康息息相關的醫療行業,是一個孤島式、嚴守各自數據和技術的行業。同時,由於醫療行業,又是一個需要共同來維護人類生活健康,與安全的行業,許多疾病,需要通過企業機構間共享數據和技術來提高治癒率。目前,醫療行業的各自為戰,嚴防死守競爭對手的孤島效應十分嚴重,已經被各個國家政府、聯合國所呼籲企業間協作服務於全人類的健康,但仍然收效甚微。
  • 起底AI看手相行業:小心個人隱私洩露!
    「你的手型兼具金與水,為人有原則,但想得多做得少」。 近日,一款名為「微算手相」的測試在微信朋友圈刷了屏。用戶可通過掃碼進入測試頁面,上傳右手照片即可AI「看手相」,還能一鍵生成帶有自己頭像的海報分享出去,從形式上看是一個測試類H5。
  • AI+物聯網+區塊鏈:這10家公司要做醫療網絡安全守護者
    隨著聯網醫療設備的增加,與之相伴的網絡安全風險同樣在上升,並成為整個網絡安全領域的重大課題。過去幾年,網絡攻擊事件呈快速上升的趨勢。據統計,目前全球平均39秒就會發生一起黑客攻擊事件,而醫療設備也已經成為黑客攻擊的重要目標。隨著越來越多醫療設備使用無線通訊技術,這讓醫療設備處於非常危險的境地。這些無線信號很容易被攔截、幹擾、劫持並重新編程。
  • 紫薇帝星——醫療AI行業的紫薇之星
    公司董事長王宜主先生,從事醫療技術研究二十餘年,作為土生土長的安徽人,他也曾輾轉幾處,但最後,他還是選擇回到安徽,紮根安徽,「這不僅僅是因為對故鄉的情感」他說。他最想做的,是以安徽這個城市為土壤,埋下醫療科技的種子,長出能讓千千萬腫瘤患者乘涼的參天大樹來。沉浮二十載,科研是他矢志不渝的奉獻,「紫薇」三五年,病患是他創辦企業的匠心。「讓科技延續生命之光」,在紫薇帝星這裡,在王宜主這裡,不僅僅是一句口號,更是企業創辦這些年來最終的夢想。
  • 手相ai 人一出生命運就已註定在你的手上
    超準算卦/運勢/合婚/看相/八字/生肖/求籤/解夢長按二維碼 立即查看每日寄語:(手相ai內十八格「飛天祿馬格」此格以庚壬二日用子字多!例如六庚日癸日以子衝午字,庚日以子衝午中丁火為官星;手相ai若四柱中丁字並午字,則減分,歲君亦忌。比如六壬日以子衝午中己土為官星,四柱有己字並午,則減分,歲君大運,亦須忌之。內十八格「飛天祿馬格又格」手相ai以辛癸為日用亥字!衝巳中丙戊為官星;要四柱有申字並酉字或醜字,得一字可合為妙。假令癸日以亥衝巳,若四柱有戌字,則亥不能去衝,歲君大運亦忌。
  • AI+醫療的未來在哪裡:百度智能雲或許有答案
    其中,百度靈醫智惠基於強大AI研發能力與醫療知識圖譜以及更加全面的場景覆蓋,在AI+核心醫療領域綜合實力已處於全面領先地位。從百度靈醫智惠系列產品與解決方案在基層醫療的應用,已能看到雲智一體化模式破局AI醫療的潛力。從中我們或可以窺探AI醫療在2020年的走勢與應用,以及未來商業化演變趨勢,AI醫療市場格局也在醞釀微妙變局。
  • 小愛觸屏音箱和小愛ai音箱的區別
    小愛觸屏音箱帶有屏幕,小米ai音箱沒有屏幕;WIFI頻段:小愛觸屏音箱支持2.4GHz,小米ai音箱為2.4/5GHz雙頻;揚聲器:小愛觸屏音箱為1.5英寸,小愛觸屏音箱為2英寸。  小愛觸屏音箱和小愛ai音箱的區別:  1.小愛觸屏音箱帶有屏幕,小米ai音箱沒有屏幕;  2.WIFI頻段:小愛觸屏音箱支持2.4GHz,小米ai音箱為2.4/5GHz雙頻;  3.揚聲器:小愛觸屏音箱為1.5英寸,小愛觸屏音箱為2英寸;
  • 醫療公司做logo設計的好處
    在這篇文章中,我將揭示醫療公司做logo設計可以輕鬆獲得的好處。如果企業有自己的設計團隊,可以自己策劃設計公司logo,如果沒有,請一定要選擇專業的設計公司自己量身定製logo設計方案。無論哪種方式,利用醫療公司logo設計對於企業樹立正面的品牌形象都是必不可少的。
  • 有感於周總理說「做人啊,不能做勢利小人」
    請總理給有關單位說一下,能不能把暖氣燒好些?」放下電話,我急忙向總理報告此事。他聽了之後,雙眉緊皺,氣呼呼地說出了三個字:「勢利眼!」總理接著對我說:「做人啊,不能做勢利小人,特別是在人家倒黴的時候!……    周總理在這裡所說得 「勢利眼」、「勢利小人」就是不看歷史、不顧將來的。有句俗話「看人下菜碟」,也是說的這個意思。
  • 個人數據隱私保護,全球資訊,9月10號
    愛爾蘭命令Facebook停止向美國發送用戶數據據知情人士透露,歐盟隱私監管機構已向Facebook Inc.發出初步命令,暫停向美國傳輸其歐盟用戶的數據。這對Facebook是一次運營和法律上的挑戰,可能為其他科技巨頭開創先例。為了遵守愛爾蘭的初步命令,Facebook可能不得不重新設計其服務,將從歐洲用戶那裡收集的大部分數據隔離開來,或者完全停止為這些用戶提供服務,至少暫時停止。
  • 健康寶,保健康不保隱私?
    記得在網際網路誕生初期,個人隱私並不為人重視,很多人甚至不惜犧牲個人隱私來換取更多的便利空間。但隨著移動網際網路的興起,個人出行、購物、飲食、健康等諸多生活細節,都要授權給各類APP(應用程式),稍有不慎,個人信息就會被一些心懷叵測的APP一鍋端空。當海量的個人信息落到邊界模糊或「揣著明白裝糊塗」的網際網路平臺手中,最終會落得什麼樣的命運和下場,很多人心有餘悸卻無可奈何。
  • 別讓「還魂手機號」坑盡錢財隱私
    可是,在手機號越來越和大家的資金安全、個人隱私聯繫的時代,這個問題的影響範圍非常大,不得不重視了。可給電信消費者帶來的損失,卻是可以盡力防治的運營商不能把自己當作國有資源的管理者,而應該當消費者的服務商是的,手機號碼資源有限,再利用不可避免。然而,「還魂手機號」的麻煩卻絕對有運營商的責任。最主要的是號碼回收和再利用的間隔期問題。
  • 醫療設備軟體不可或缺的安全性設計
    在醫療器材研發過程中,大量的精力被投注於確保安全性和降低患者風險的考慮。儘管如此,隨著不同儀器聯網性能的不斷提升,安全研究人員在很多醫療儀器中都發現了安全不足,其中一個例子就是在一種常用輸液泵中發現的1,400個安全漏洞。
  • 2020 AI最佳成長榜頒獎盛宴:12熱門領域,60家獲獎企業,共啟AI新...
    評選時,雷鋒網注意到這十二個領域並不是齊頭並進發展的,比如布局成熟的安防、駕駛、金融領域,獲獎公司得體現這個飽和口的缺口新機;一直在攻堅的醫療、零售、教育領域,獲獎公司是否在順應大方向上的政策利好;國家強調自主可控的晶片、工業網際網路、AIoT領域,獲獎公司除了融資亮眼外,是否有自己的真正核心骨。
  • 英特爾AI醫療實戰曝光:10倍加速輔助診斷、準確度高達90%
    在醫療健康領域,AI 被廣泛應用於醫學影像、輔助診斷、疾病預測、藥物研發等多個環節,它們就像汽車裡的超級馬達,促使各個醫療環節加快效率。據數據顯示,2018 年中國醫療人工智慧市場規模達到 200 億元。這一高速增長得益於中國醫療市場的迫切需求,以及近年來醫療人工智慧技術的發展與相關政策的支持。
  • 萬字長文丨微眾銀行嚴強:數字經濟時代,隱私保護的道與術
    數據隱私驅動的行業巨變隱私立法的完善和用戶隱私意識的覺醒造成了深遠的影響,不僅改變了原有的數據之道,對數據業務帶來不同層面的變化。先說技術面,早期在談到隱私保護時,很多時候僅僅是加密,對數據進行脫敏,在數據處理階段做了一些工作,就被看成是對數據有非常強的隱私保護了,但是,放在AI或者隱私計算大的環境裡來看,實際上是不完善的。
  • 清華、智源、協和聯合開發乳腺癌AI診斷工具,可預測分子...
    如何利用好超聲影像,進行乳腺癌篩查,並對乳腺癌做分子亞型分類,是中國AI醫療領域一個重要且有待拓展的方向。  研究人員畢明傑表示, 「目前有許多從遺傳學、分子、細胞層面對乳腺癌分子亞型進行研究的,但使用超聲做分子亞型檢測,似乎還沒有人做。」  遺傳學、分子、細胞層面的檢測,是在活檢之後,無法避免剛才提到的諸多缺點。
  • 陽臺可別再這樣做了,陰氣太重難化解,隱私易曝光,趕緊改造
    陽臺可別再這樣做了,陰氣太重難化解,隱私易曝光,趕緊改造作者:王瑩買房是一件很難的事,但是裝修也不是一件簡單的事,裝修的時候都被如何選擇等一系列需要考慮的事鬧得頭昏腦漲吧,尤其是陽臺,別看地方小,其實學問可大了,而且也挺重要的,是一個家中對於裝修來說舉足輕重的地方,
  • 這三個星座,最注重個人隱私
    無論是在日常生活中還是感情中,每個人對於自己的隱私都有或多或少的保護,只是有些人對隱私看護的比較嚴,有的雖然也比較看重,但並不是不能讓他人知道。如今這世間,大多數的隱私都藏在手機裡面,裡面有你看過的很多東西,有你與他人的聊天記錄,生活的裡的一切都幾乎記錄在手機裡面。個人隱私對於有些人來說就是不可觸碰的禁區,有些人則是想得比較開,這也主要是因為他們並沒有見不得光的事情。
  • 通過一張照片,這套AI系統就能判斷你是不是同性戀
    【AI星球(微信ID:ai_xingqiu)】9月9日報導 (編譯:小白)根據最新研究,人工智慧可以基於人們臉部照片準確猜測出他們的性取向,這表明機器人可能比人類更擅長「發現同性戀者」。