全球首個AI雙盲隨機對照試驗發布,Wision AI的成功經驗在哪?

2021-01-10 動脈網

在醫療AI領域,全球發布的隨機對照臨床試驗(RCT)目前有且僅有5個,這其中的第一個,也是規模最大的一個,是來自四川省人民醫院和哈佛醫學院於2019年2月發表在國際前沿期刊《GUT》【IF=17.06】上的一篇關於中國內窺鏡影像輔助診斷企業Wision A.I.的計算機輔助結腸鏡檢出息肉和腺瘤的隨機對照研究論文。

作為醫療AI全領域的第一個隨機對照試驗,該論文獲得了《GUT》期刊優秀論文第三名、全網論文發布排行榜Top1%的史上最佳以及Top1%的本刊最佳和Top1%同期最佳的殊榮。

時隔一年,Wision A.I.又為醫療AI領域創下了另一個NO.1。2020年1月在《柳葉刀》消化子刊【IF=12.26】上刊出了四川省人民醫院和哈佛醫學院的關於Wision A.I.腸道癌前病變檢測產品EndoScreener的雙盲隨機對照試驗,這成為了醫療AI界的全球首個雙盲RCT,在業界引發強烈反響。

美國醫學院院士、著名「世紀醫生」Eric Topol博士在其個人Twitter上轉發《柳葉刀》該篇論文,宣布這是全球醫療AI領域的第一個雙盲隨機對照試驗,不是來自放射、病理、皮膚科或眼科,而是來自消化內鏡領域。這也是第一個經受住了雙盲隨機對照考驗的AI技術。

Eric Topol博士2月5日在個人Twitter上

Wision A.I.成功使用雙盲RCT來測試AI系統,這無疑是臨床驗證級別的又一個巨大提升,並為全球其他AI輔助診斷領域的臨床驗證方法提供了雙盲設計的參考。此前,AI技術首次被納入歐洲消化內鏡臨床指南作為初步推薦時,其主要依據也是Wision A.I.進行的臨床試驗。

醫療AI雙盲試驗的臨床價值

雙盲——Double Blind,顧名思義是要將研究對象和研究者都「盲掉(Blind)」,讓雙方都不了解試驗的分組情況,而由研究設計者來安排和控制全部試驗。這種實驗設計能夠消除可能出現在實驗者和參與者意識當中的主觀偏差和個人偏好。雙盲試驗屬於最高科學標準的試驗之一,在臨床新藥研發中應用非常廣泛,但是醫療AI領域卻一直由於雙盲設計困難等諸多原因缺乏雙盲RCT。

在醫療AI的臨床試驗上,大多數研究都是將AI對於醫生診斷出的疾病的識別率等數據作為AI性能的臨床證據。但這種研究的結果嚴謹地來說,只能證明AI輔助診斷系統(CAD)能夠自主檢出相關疾病,對於該系統對醫生實際的幫助和影響並未進行嚴格的科學論證,以至於醫生是否受益於CAD也有待商榷,所以業界曾有媒體詬病美國FDA在批准AI產品時不夠慎重。

最直觀的表現在於,當內鏡醫師知曉有AI輔助參與醫學診斷時,可能出現因競爭精神而更專注,或因依賴AI系統而放鬆等非正常診斷時的狀態,這部分變量存在的可能性也就導致了非盲法臨床試驗並非最嚴謹的驗證方法。

如何摒除參與者(醫生)意識當中的主觀偏差和個人偏好呢?參照新藥研發中臨床雙盲試驗的安慰劑對照組,Wision A.I.與國內外的專家一起設計了一套「盲法」來測試AI輔助診斷系統的效用。

如何設計醫療AI的雙盲試驗?「偽裝AI系統」+「引入第二觀察者」雙管齊下

要進行醫療AI的雙盲實驗,其關鍵在於如何成功地把AI輔助的醫生「盲掉(Blind)」?這是Wision A.I.對醫學AI界的一個貢獻——該公司設計了一套有偽裝AI系統參與的雙盲試驗方法,這套方法亦可以推廣到全醫學領域的輔助診斷軟體CADe或者CADx軟體中。

讓醫生進行臨床診斷時不清楚自己是否有AI輔助,這是雙盲試驗的一個核心。既不能讓醫生猜測到使用的系統是什麼,也不能讓醫生的心態受AI系統參與的影響。這在全球範圍內沒有先例可以參考,四川省人民醫院和哈佛醫學院的數位專家經過長時間的討論,最終確定了Wision A.I.腸道癌前病變檢測產品EndoScreener的雙盲測試雛形。

動脈網採訪了Wision A.I.的創始人劉敬家,嘗試從他的口中還原雙盲試驗設計的始末。「『盲法』試驗的核心在於:

其一,引入偽裝的AI系統,與真AI系統一併隨機化提供給受試者;其二,設置忠於系統的中間人角色(第二觀察者),按照試驗原則,把真AI或偽AI的實時識別結果通過雷射筆或提前設計的語法提示給操作醫師。」劉敬家向記者介紹道。

與非雙盲RCT相比,Wision A.I.的雙盲試驗加入了兩個核心要素「偽裝的AI系統」和「第二觀察者」,如何理解?

Wision A.I.在臨床實驗開始之前,就設計了一套偽裝的AI系統,該系統不會提示真實的癌前病變,並且保證和真的AI系統擁有相同超低的誤報率,以此來防止內鏡醫師主觀判別出真假系統。

在四川省人民醫院草堂分院的內鏡中心,Wision A.I.招募了1046名年齡在18歲至75歲之間的病人進行結腸鏡診斷和篩查,並在排除患有炎症性腸病、結直腸癌、結直腸手術史或有活檢禁忌等無效樣本的病人後,將剩餘的有效樣本隨機分為兩組,最終真AI系統組有484例病人、偽AI系統組有478例病人納入分析。

真AI系統組與偽AI系統組的病人不知道自己所處的分配組別,四名高級內鏡醫師在對這些患者樣本進行常規的白光結腸鏡檢查時,如果宣布找到了息肉,那麼真AI系統與偽AI系統都會沉默;但如果內鏡醫師視野範圍內出現了息肉,並且在息肉將要移出視野範圍時還未宣布發現此息肉,那麼真AI系統就會發出提示,偽AI系統保持沉默。

這裡值得一提的是,為了防止內鏡醫師直接使用真/偽AI系統從而觀察出AI系統的不同,Wision A.I.引入了第二觀察者的角色。第二觀察者最直接的作用是能夠在專門的顯示屏上看到真AI系統或偽AI系統的每一次輸出結果(內鏡醫師不可見),並將其傳達給內鏡醫師;當內鏡醫師即將遠離有系統提示的區域的視野範圍時,第二觀察者會使用雷射筆提示內鏡醫師系統檢測到的區域以便其觀察。

保證近似且一定低頻的誤報率,能夠讓醫生在得到第二觀察者雷射筆提示後,無法區分出提示系統的真偽,獲得提示的醫生會再次觀測被提示區域,如果該區域醫生觀察後發現依舊沒有息肉則繼續退鏡,如果醫生觀測後發現了息肉則計入統計。

這裡值得一提的是,如何保證偽AI系統輸出的每一個結果都不是真實的癌前病變?這其實也是系統設計的一大難點,劉敬家介紹了Wision A.I.創新的一種雙模型強弱相減的方法,就保證偽AI系統只會對息肉樣非息肉結構(例如氣泡、糞便、未消化的殘渣和皺縮的黏膜)提示。

「簡單的理解,就是偽AI系統輸出的結果的概率是將真AI系統識別的概率圖與一個事先研發的弱AI系統(敏感度特異度都遠低於真AI系統)的概率圖相減而來,同時通過調整閾值保證了偽AI系統的特異度更接近真AI系統。」劉敬家解釋道。

AI輔助結腸鏡檢查雙盲試驗結果:腺瘤檢出率(ADR)和息肉檢出率(PDR)顯著提升

在結腸鏡檢查中,發現和切除腺瘤性息肉是降低結直腸癌發病率和死亡率的最有效方法,而結直腸癌是導致死亡的主要癌症之一。根據《新英格蘭醫學期刊》中相關論文顯示,每提升1%的腺瘤檢出率(ADR),就會降低3%的間期結直腸癌患病風險。

ADR的提升能夠有效預防結直腸癌,這也成為了結腸鏡檢查的主要質量標準。高ADR的內鏡醫師更能幫助患者,人們也通過嘗試改進內鏡硬體技術、腸道準備方法和觀察方法以此來提升提高結腸鏡檢查中的ADR值。

然而,由於各種原因,即使在美國、日本等發達國家,目前臨床上仍有多達27%的腺瘤性息肉被漏診。

在Wision A.I.此次進行的雙盲隨機對照試驗中,結果顯示在腸道癌前病變檢測產品EndoScreener的幫助下,真AI系統組的ADR明顯高於偽AI系統組:在CAD系統實驗組(真AI系統組)的484例病人中,有165例病人(34%)檢測到有一個或多個腺瘤;而在使用假提示系統對照組(偽AI系統組)的478例病人中,有132例病人(28%)檢測到有一個或多個腺瘤。

Wision A.I.雙盲RCT試驗檢測結果

在息肉檢出率(PDR)方面,CAD系統實驗組的PDR明顯高於假提示系統對照組,在假提示系統對照組的478名病人中,有176名(佔37%)檢測出了息肉;在CAD系統實驗組的484名病人中,有252名(佔52%)檢測出了息肉。

在結腸鏡檢查中,假提示系統對照組平均每次發現0.38個腺瘤、0.64個息肉,CAD系統實驗組平均每次發現0.58個和1.04個息肉,無論從ADR值還是從PDR值上看,Wision A.I.的腸道癌前病變檢測產品EndoScreener參與的結腸鏡檢查能夠顯著提升內鏡醫生的檢出率。

試驗數據結果中還有值得提示的一點,在真AI系統輔助下有159個病例被內鏡醫生漏掉,而這部分病例通過讓經驗豐富的內鏡醫生(未參與臨床試驗)再次回顧性測試後,發現醫生們的敏感度和特異度依舊不高,表明容易漏掉息肉的問題不能簡單地由額外的人類觀察者來解決,這也證明了在實際的臨床環境中CAD系統可能在輔助內鏡醫師方面發揮更好的作用。

真實嚴謹的臨床實驗,是支持相關AI產品落地的第一步。Wision A.I.始終堅持臨床循證醫學的路線,此次試驗所用的EndoScreener系統已經經受了數個臨床試驗的檢驗,但該系統訓練樣本僅僅是5000多張的內鏡圖片,其中約一半是陰性樣本,在目前醫學圖像識別領域裡,高成本數據獲取、複雜數據標註的背景下,小樣本量深度學習的優勢愈加明顯。

相關焦點

  • 隨機雙盲實驗:讓騙子現形
    世界上最著名的無神論者、英國皇家科學院院士、牛津大學教授道金斯認為,最能提高每個人認知能力的科學概念就是「雙盲對照試驗」。歐盟《傳統植物藥指令》規定,從11年5月1日起全面實施,未經註冊的中藥將不得在歐盟市場上作為藥品銷售和使用。同年英國藥品管理局繼發布中藥毒性警告。2013年11月,英國藥物管理局頒布了中成藥禁售令,該法令將於2014年4月底開始實施。
  • 英雙盲對照試驗功不可沒,鏈黴素成為國病神藥,但惡魔從未走遠
    而剔除這些幹擾因素的唯一方法就是進行隨機雙盲對照試驗。這也是醫學史上第一次嚴格的隨機雙盲對照試驗(RCT),具有偉大的開創性意義。[12]考慮到鏈黴素數量有限,他設計的試驗是這樣安排的:挑選那些年齡在 15~30 歲的肺結核患者,他們必須是新近感染的急性進行性雙側肺結核,並且不適合萎陷療法。(萎陷療法是向胸腔或腹腔人工注入清潔空氣的一種治療手段,能使病變肺選擇性萎縮。)
  • 從數據到臨床實踐|姚麗教授:隨機對照試驗在腎科研究中的應用
    對照對照是指在試驗中,比較兩種或幾種幹預措施的效果。對照是準確評估治療作用大小的基礎,類型也很多,包括空白對照、安慰劑對照、標準對照、相互對照、自身對照和實驗對照等,姚教授詳細闡述了不同類型對照試驗之間的區別及利弊。2. 隨機隨機也是很常用的方法,是指採用隨機的方式,使每個受試對象均有同等的機會被抽取或分配到實驗組和對照組之中。
  • 中國首個進口乾細胞臨床試驗正式啟動
    2021年1月12日,由九芝堂美科(北京)細胞技術有限公司(以下簡稱「九芝堂美科」)發起的我國首個使用進口乾細胞治療缺血性卒中的Ⅰ/Ⅱa期臨床試驗(ASSIST)啟動會在組長單位首都醫科大學附屬北京天壇醫院通過線上會議形式順利召開,標誌著臨床試驗正式啟動。
  • 雙盲試驗測試的新藥,針對的是病,它要找一個適用於所有患者的萬能藥
    雙盲試驗的理念很完美,但實際操作卻非常殘忍。 在雙盲試驗中,所有參試的患者都抱著一絲希望,希望通過剛研發的新藥醫治自己疾病。因此,有誰願意被分往對照組?又有誰願意服用沒有治療意義的安慰劑?又有誰願意做試驗品的小白鼠?一旦患者知道了雙盲試驗的真相,又有哪位患者願意參加雙盲試驗?
  • 雙盲實驗了解一下!
    不過為保穩妥,實驗已經開始進入第三期實驗,預計九月就可能接種第一人,產業化預計年底能生產滿足全球的數十億隻疫苗。AP統計作為一個統計學老師,最吸引我注意的還是下面這張圖:在4月12日的二期實驗當中,臨床採取了隨機、雙盲、安慰劑對照的實驗。這個實驗方法是醫學當中非常常用的手段,同樣的,在AP統計考試當中也是非常重要的考點。我們今天就來講講雙盲實驗。
  • 全球三十大最佳 AI 創業公司公布
    Darktrace 經歷了快速增長,年收入同比增長超過 600%,在全球設有 30 個辦事處。目前,Darktrace 已完成 7500 萬美元 D 輪融資。 4、Drive.ai(GGV紀源資本被投企業) Drive.ai 成立於 2015 年,是一家位於矽谷的自動駕駛公司,其主要成員來自史丹福大學人工智慧實驗室。
  • 妹子體驗小米ai音箱
    目前,國內智能音箱的市場不可小覷,根據調研公司 Canalys 最新發布的數據顯示,到 2018 年年底,全球智能音箱的數量將會達到 1 億臺,而去年還僅有 4000 去年美國是全球最大的智能音箱市場,但值得注意的是 中國也佔據了 3% 的份額。
  • 隔夜美股 | 三大指數走低,C3.ai(AI.US)上市首日收漲120.21%
    美股科技股普跌,奈飛(NFLX.US)跌超3%,亞馬遜(AMZN.US)跌超2%,Facebook(FB.US)跌近2%個股方面新股DoorDash(DASH.US)上市首日收漲85.78%,總市值超過600億美元;新股軟體公司C3.ai(AI.US)上市首日收漲120.21%,報92.49美元;
  • 雙盲實驗︱20北大滙豐深財真題解析03
    2020 北大滙豐財經334真題名詞解釋3雙盲實驗答題思路 此題考查研究方法,較為基礎。研究方法內容較為固定,直接參考研究方法教材作答即可。參考答案 雙盲實驗(Blind Experiment),最早意識到雙盲試驗在科學研究中的價值的人是克勞狄伯納德(Claude Bernard),他建議任 何科學實驗的參與者必須被分為兩類:設計實驗的理論家沒有相關知識,因此也不會在觀測結果中添加個人對理論的理解的觀測者。
  • 華山醫院新冠病毒中和抗體臨床試驗進展順利,首個劑量組受試者已...
    第一例受試者給藥復旦大學附屬華山醫院6月19日消息:全球首個在健康受試者中開展的新冠病毒中和抗體臨床試驗在華山醫院Ⅰ期臨床研究中心完成了首個劑量組給藥,第一組劑量的受試者目前已安全出院。6月7日早上7點,華山醫院Ⅰ期臨床研究中心,在華山醫院張菁教授、張文宏教授、重症醫學和心內科專家的現場保駕護航下,由上海君實生物醫藥科技股份有限公司、中國科學院微生物研究所等單位共同開發的重組全人源抗新冠病毒單克隆抗體注射液(簡稱「JS016」)完成全球首例健康受試者給藥。
  • 《逃離塔科夫》12口徑爆頭任務怎麼做 海岸線ai位置介紹
    海岸線爆頭任務需要擊殺12人,很多小夥伴可能不清楚在哪做好吧,今天小編給大家帶來逃離塔科夫海岸線ai位置介紹,快來看一下吧。海岸線爆頭任務需要擊殺12人,很多小夥伴可能不清楚在哪做好吧,今天小編給大家帶來逃離塔科夫海岸線ai位置介紹,快來看一下吧。
  • 美國神藥臨床試驗數據終於發布,美媒看後都在說這句話……
    但在約1個月前,中方科研人員發布的一份臨床試驗結果顯示該藥物的效果並不明顯;與此同時,指導美國政府防疫工作的傳染病專家福奇等人則表示美方通過一個比中方的試驗樣本量更大的臨床試驗發現該藥物有效,可以縮短病人的住院時間。
  • 《柳葉刀》發表首個新冠病毒疫苗人體試驗,安全並能誘導快速免疫應答
    《柳葉刀》(The Lancet)於5月22日在線發表的一項在108名成人中進行的研究表明,首個SARS-CoV-2疫苗的1期臨床試驗發現:該疫苗是安全的,具有良好的耐受性,並能在人體內誘導產生針對SARS-CoV-2的免疫應答,
  • 盲法試驗——有哪些你不知道的事兒!
    設盲(Blinding)是指將試驗藥物和對照品(安慰劑或陽性對照藥)均以密碼或代號表示,全部試驗過程中對病人和/或研究者均保持未知,並由專人或小組保存密碼的內容,除非受試病人發生危急情況或安全需要時,否則直到全部試驗結束後才公開密碼——破盲(Un-blinding)。盲法試驗常用的有兩種:單盲(Single blinding)雙盲(Double blinding)。
  • AI2021中文直裝版 Ai2021正版激活 ai2021永久使用
    AI2021中文直裝版 Ai2021正版激活 ai2021永久使用 原標題:AI2021中文直裝版 Ai2021正版激活
  • 爽文+AI翻譯,全球老外正在同步修仙
    權威機構艾瑞諮詢已經連續幾年發布了《中國網絡文學出海研究報告》。          人們被新事物所吸引,每天有來自115個國家、可以算作單獨訪客的35萬個唯一IP位址訪問我們的網站,其實我們正在開創一個新市場。 面對採訪,RWX不鹹不淡地裝著X,像極了一隻在風口上愜意飛翔的豬。
  • 拜耳宣布Finerenone在患有2型糖尿病的慢性腎病患者中III期試驗...
    拜耳表示,FIDELIO-DKD研究是迄今為止在患有2型糖尿病的慢性腎臟病患者中進行的最大規模的III期臨床試驗項目中的一部分,該項目招募了13,000名處於不同疾病嚴重程度(從早期腎臟損害至晚期腎病)的患者。
  • 新冠肺炎全球大流行,世界各國臨床試驗情況如何?
    3 月 11 日,世衛組織正式將新冠肺炎疫情定性為「全球大流行」,在世界範圍內拉響警報。在病毒全球擴散的背景下,就各地面對病患的醫生護士而言,可參考的臨床處理經驗尤為重要,「臨床試驗」就是總結這些經驗的最科學方式。全球大流行(pandemic)指的是具有傳染力、波及範圍廣(常常橫跨多個大洲)又會造成死亡的流行病。