2020年5月7日 訊 /生物谷BIOON/ --三年前,來自加利福尼亞大學聖克魯茲分校的科學家們就通過研究證明,利用在校園開發的相同納米孔測序就能實現對對人類基因組的長時間閱讀分析,這在當時的確是一項巨大的研究進展,但其卻需要15萬小時的計算時間和數周的工作。一年後,研究者開發的名為PromethION的納米孔測序儀就被證明是非常快速、且便宜而且容易操作的測序手段,如今研究人員能夠在9天內對11個人類基因組完成測序。
圖片來源:UC Santa Cruz Genomics Institute
日前,刊登在國際雜誌Nature Biotechnology上的研究報告中,來自加利福尼亞大學等機構的科學家們就開發了一種新型算法從長閱讀測序數據中準確精準組裝出完整的人類基因組,整個過程耗時大約6小時,價格約需70美元。研究者表示,他們希望這種裝配器(assembler)能夠增加基因組研究的步伐。
如今,基因組研究還完全依賴於來自一個個體的參考基因組來代表整個物種,為了能夠反映真正的人類多樣性,研究人員就開啟了一項泛基因組計劃(pangenomic initiative)對350個新的單一的人類基因組進行測序研究。文章中,研究人員開發了一種長閱讀測序步驟,其能利用3個PromethION流動細胞以前所未有的長度持續獲得約60倍的人類基因組覆蓋率(大約200億個鹼基),此外其在超過100kb長度的閱讀中能夠實現約7倍的覆蓋率,這種方法在成本和可同時處理的基因組方面具有很強的可擴展性,如今研究人員正在改進這種方法,以使其獲得更高的讀取長度和吞吐量。
研究者Benedict Paten表示,大量數據的湧入就需要開發高效的軟體工具,首先就是裝配器,新型裝配器具有廉價快速的特點,其目標在雲端,同時其能幫助研究人員進行規模化的納米孔測序,如今研究人員完全有信心在未來幾年輕鬆組裝數百個基因組。為了改善裝配器的基礎質量,研究者利用了基於深度神經網絡的「序列拋光器」來作為最後的裝配步驟,這樣就會使得組裝過程的總成本降低到200美元以下,且能在37個小時內完成,這就進一步降低了產生長閱讀組裝的開銷。
研究者指出,僅使用納米孔測序數據就能實現99.99%的裝配精度,這在人類基因組中尚屬首次,此外,他們還使用HiC測序數據產生了基於染色體水平的支架。最後研究者Karen Miga說道,我們的目的不僅是擴大參考基因組的多樣性,而且還要解決整個基因組中存在的數百個缺口,如今我們就能獲得一個真正完整的人類基因組組裝產物,並且深入探索未知後果的變化。(生物谷Bioon.com)
原始出處:
Shafin, K., Pesout, T., Lorig-Roach, R. et al. Nanopore sequencing and the Shasta toolkit enable efficient de novo assembly of eleven human genomes. Nat Biotechnol (2020). doi:10.1038/s41587-020-0503-6