(天下網商記者 王安憶)阿里巴巴達摩院正在用AI算法抗擊新型冠狀病毒感染的肺炎疫情。
2月1日,浙江省疾控中心上線自動化的全基因組檢測分析平臺。利用阿里達摩院研發的AI算法,可將原來數小時的疑似病例基因分析縮短至半小時,大幅縮短確診時間,並能精準檢測出病毒的變異情況。
該平臺採用不同於核酸檢測方法,而是以一項全基因組檢測技術,對疑似病例的病毒樣本進行全基因組序列分析比對,能夠有效防止病毒變異產生的漏檢,大幅提高疑似病例的確診速度和準確率。
阿里巴巴達摩院稱,未來,這項AI算法還將用以支持疫苗與藥物的研發。
核酸檢測的效率和缺陷
全國新型冠狀病毒肺炎疫情依然嚴峻,快速精確的診斷,對疫情控制尤為重要。
目前,主流檢測手段為核酸檢測方法,原理是比對疑似病例的核酸構成跟病毒的核酸構成,完全對上就可以確診。
這項技術相對成熟,但由於新型冠狀病毒生物安全等級較高,為防止洩漏和操作人員感染,大量自動化過程改由純手工操作,導致實際檢測時間相對較長。
此前,央視記者曾探訪過陸軍軍醫大學第一附屬醫院傳染病專科實驗室,記錄下新型冠狀病毒核酸檢測的全過程。
實驗室操作人員均採用裡外三層防護,從疑似患者鼻咽部採集到的上皮細胞,與液體相混安置在試管之中。打開試管後,由於裡面可能含有新型冠狀病毒,操作人員為了避免產生氣溶膠(比飛沫更微小的粒子,藉助空氣傳播),無法用漩渦震蕩器混勻溶液,只能小心翼翼地用手來混。
接著,操作人員還要把試管放入56攝氏度的金屬加熱器中,以裂解病毒釋放核酸,然後經過2分鐘12000轉的離心操作,將病毒吸附在一根有兩道綠色薄膜的試管上,後面又經過三次不同規範的離心操作,提取出疑似病毒核酸。
全部完整檢測要經歷十幾道工序,從實驗室門口接樣到最後出檢測結果,單一樣本需3個小時才可以完成。
此外,為了確保檢測結果可靠可信,通常一個疑似病例都要採取2至3份標準樣本,同時開展標準核酸檢測,覆核後才能公布疑似病例檢測結果。
眼下,全國能夠進行新冠狀病毒核酸檢測的醫院和機構逐漸增多,核酸檢測試劑盒產量也逐步跟上。比如武漢大學中南醫院醫學檢驗科就改良了核酸提取的方法,最快2個小時就可以得出核酸檢測結果。
武漢大學中南醫院醫學檢驗科工作人員在進行樣本檢測
然而,截至2月1日24時,國家衛生健康委收到31個省(自治區、直轄市)和新疆生產建設兵團累計報告確診病例14380例,疑似病例有19544例。人工的核酸檢測「扛不住」每天不斷新增的疑似患者。
更重要的是,核酸檢測方法也有不足之處。
此前,湖北省疾控中心已成功完成新型冠狀病毒分離與全基因組測序工作,獲得病毒全基因組序列,全長29847bp,是基因組序列最長的病毒之一。
而核酸檢測方法,只能檢測到病毒基因的局部。由於病毒存在變異可能,因此對於整個基因序列來說,核酸檢測猶如盲人摸象,一旦病毒發生變異,就可能出現漏檢的情況。
達摩院AI算法克服高通量測序不足
不同於核酸檢測方法,浙江省疾控中心上線的自動化全基因組檢測分析平臺,是以全基因組檢測技術,對疑似病例的病毒樣本進行全基因組序列分析比對,能夠有效防止病毒變異產生的漏檢。此外,平臺在新型儀器以及算法的加持下,有效縮短了全基因測序的時間。
據介紹,疫情早期,核酸檢測可以頂上用,但越往後走,越需要全基因檢測,因為後期防疫的核心是防止病毒變異。
全基因組檢測分析平臺由浙江省疾控中心、阿里巴巴達摩院、傑毅生物共同研發,為浙江省疾控在新型冠狀病毒疫情防控上提供了全自動建庫和分布式計算分析能力。
達摩院稱,此次研發的自動化全基因組檢測分析平臺屬於高通量測序,在AI算法的加持下,克服了前處理和數據分析費時費力的不足。
在整個平臺中,傑毅生物開發了全自動高通量測序建庫儀,把整體常規人工需要12小時的工作縮短到2個小時。
當每次測序過程中產生的海量基因數據,則交由達摩院AI算法進行分析。
疫情發生後,達摩院組建了十餘人的團隊,算法專家顧斐博士第一時間奔赴浙江省疾控中心。
達摩院團隊針對新型冠狀病毒基因進行特徵分析,決定採用分布式設計的分析算法,並基於蛋白質資料庫(PDB)等公共數據集的數據進行算法的優化訓練。
顧斐表示,在序列比對過程中,他們對算法增加了分布式設計,病毒基因分析的速度由數小時縮短到半小時,從而大幅提高疑似病例的確診速度。
達摩院算法專家顧斐博士在疾控中心基因檢測分析現場
同時,由於採用分布式算法,病毒拼接的速度由30分鐘-1小時縮短到15-30分鐘,能幫助醫護人員檢測到病毒全貌,變異的病毒也能精準檢測,大幅提升確診效率。
顧斐提到,病毒序列拼接完成後,通過設計BiLSTM+DNN的方式訓練模型,可以在15-30分鐘內預測病毒蛋白二級結構。同時,達摩院還在研究基於序列的蛋白質三維結構預測模型以及藥物篩選模型,為藥物研發貢獻技術能力。
這個平臺已於2月1日上線浙江省疾控中心,可有效提升疑似病例確診效率,及時阻斷病毒的傳播。達摩院表示,他們也正在努力與合作夥伴共同將這套系統推廣至全國。
目前,有6個確診病例樣本,正在通過該平臺進行基因組序列的測定與分析。截至發稿前,這些樣本中檢測到的新型冠狀病毒與最早在武漢確診病人身上發現的病毒基因組序列高度同源。