火爆的背後,高通量測序面臨5大挑戰|深度

2020-12-05 雷鋒網

雷鋒網按:基因測序作為醫療健康行業的火爆技術,近年來越來越得到臨床的認可,並逐步被應用到各大領域中。尤其是精準醫療概念提出以後,基因測序更是備受青睞,它為精準醫療解答了很多未知的問題。

如今,基因測序已經形成了一定的產業規模,大量的企業以不同形式躋身進來。但是,在表面飛速發展的背後,技術上仍有大量的挑戰。外媒《GEN》,雷鋒網AIHealth欄目編譯如下:Shawn C. Baker博士撰文講解該領域面臨的困難與挑戰

過去十年裡,高通量測序技術經歷了跨越式的發展,測序能力大幅上升,費用下降,兩者的變化都是數量級的。到目前為止,全球範圍內,共配備測序設備超過一萬臺。

過去十幾年來,主要的平臺公司都致力於提升系統的易用性。Illumina的最新桌面系統,比如 NextSeq、MiSeq、和MiniSeq 系統,均通過試劑盒進行操作,以減少了手工操作的次數和開機時間。

一直以來, Illumina的系統都比賽默飛的 Ion Torrent 系統更加易用,但後者最新的系統Ion S5特別設計簡化了整個工作流程,涉及設計準備庫到數據生成的整個流程。

行業外讀者在聽聞了測序行業的許多進展後,如強大的測序能力、更低的成本以及更好的易用性,可能會誤認為,基因測序所有的困難已經都解決了,測序過程的所有障礙都移除了。

但是真正的困難還剛開始,大量的挑戰在前方。

樣品質量

問題最嚴重的一個領域,也是易被忽略的是:樣品質量,雖然測試平臺經常會校準,使用的樣本也是經過校準的,但是真實世界中的樣本經常會面臨很多意想不到的挑戰。

在人類基因測序中,一個最普遍使用的樣本類型是FFPE (formalin-fixed paraffin-embedded)。FFPE的廣泛應用有多種原因,其中最重要的是豐富性。據估計,全球範圍內,有超過100億FFPE樣本存檔。FFPE塊的臨床樣本存儲已經變成工業級別的標準實踐,其樣本數量將繼續保持增長。

除全球範圍的廣泛應用外,FFPE樣本通常包含著大量可用的表型信息。例如,FFPE樣本可與治療方法和臨床數據綜合應用。

但FFPE 樣本出現的問題是:固定過程和存儲條件均會造成大量的DNA損傷。

BioCule公司CEO、聯合創始人 Hans G. Thormar博士認為,

評估了BioCule的QC平臺超過1000份樣本後,我們看到了DNA樣品中大量的變異和各種類型的損傷,例如鏈間、鏈內交聯,單鏈DNA的聚合以及單鏈DNA破壞。

DNA損傷的變異數量和類型,如果忽略,可能會對最終結果產生負面影響。

Thormar認為,

這對下遊應用比如測序的影響是巨大的:從簡單測序文庫構建的失敗到虛假文庫的產生,最終導致結果的錯誤。因此,在測序項目開始時正確評估每個樣本的質量變得至關重要。

測序文庫

儘管,各大測序平臺公司花大力氣在降低生成原始序列的成本上,但是在構建測序庫方面卻不然。人類基因測序的測序文庫的構建,每個樣本大約花費50美元,在總花銷中是相對較小的一部分。但是在其他應用中,例如細菌基因組測序或低深度RNA測序,它佔據總成本很大一部分。

幾個小組研究了多元化自製解決方案,期望可以有效降低成本,但在商業領域並沒有太多發展。在開發單細胞測序解決方案中有一個亮點,例如10X Genomics公司的Chromium系統,利用基於珠的系統可以並行處理數百到數萬個樣品。

10X Genomics 公司的CEO兼聯合創始人Serge Saxonov博士堅持道,

我們認為單細胞RNA測序是進行基因表達分析的正確方式,在接下來的幾年,全球許多地區,RNA試驗將轉向單細胞解析度,我們的平臺有可能在這方面引領浪潮。

對於大型項目,比如在降低樣品成本方面,單細胞RNA測序中要求的高度多元解決方案將是關鍵的因素。

長讀數與短讀數

Illumina對於基因測序市場的主導,意味著到目前為止產生的絕大多數數據都基於短讀數(short reads,高通量測序平臺產生的序列就稱為reads,這是測序讀到的鹼基序列片段,測序的最小單位)。大量短讀數的產生對大多數的應用都很適用。例如檢測基因組DNA的單核苷酸多態性和計數RNA的轉錄物。然而,在許多其他的應用中,僅有短讀數是不夠的,例如閱讀基因組的高度重複區域和確定長鏈結構。

長讀數平臺,例如Pacific Biosciences公司的RSII和Sequel,Oxford Nanopore的MinION,通常能生成15-20kb範圍長度的讀數,最高曾報導過超過100kb長度的讀數。這樣的平臺贏得科學界的讚賞,例如加利福尼亞大學戴維斯分校細胞生物學教授Charles Gasser博士。

Gasser博士評論道,

我對於用長讀數方法進行基因組裝配的成功印象深刻,特別是與短讀數高保真數據相結合時的混合裝配中。技術的結合使得小群體、小預算的單個研究者從一個新的生物基因組中產生一個可用的組裝。

為了充分利用這些長讀數平臺,有必要通過新方法進行製備DNA樣品,標準分子生物學方法尚未優化用來分離超長鏈DNA片段,所以,在製備長讀數庫時必須特別小心。

例如,供應商創建了一種高分子量試劑盒用於分離大於100kb的的DNA片段,優化靶向DNA方案來選擇性富集DNA的大片段,為了保證長讀數產量的最大化,這些方法和技術必須掌握。

短讀數的一種特殊形式是連結讀數,例如10X Genomics,可作為真正長讀數的一種替代方法。連結讀數是這樣產生的:每個長DNA片段,通常大於100kb,其中產生的每個短讀數,均加入一個獨一無二的條形碼,在分析階段,這種獨特的條形碼就可以將分離的短讀數連結在一起,從而提供長鏈基因信息,使得構建大單倍型塊和對複雜結構信息的闡釋成為可能。

Saxonov博士建議道,

短讀數測序,因其高精確度和高通量,通常具有強大的功能,但只能獲取小部分的基因信息。這是因為基因組是基本重複的,基因組中的大量信息編碼在長鏈中。

數據分析

研究人員面臨的領一大挑戰是生成的數據量非常大。單個30X人全基因組樣品的BAM文件(半壓縮比對文件)約為90GB;一個相對中等的項目,包含100個樣本,其BAM文件可達到9TB。

一個Illumina HiSeq X儀器,每年能產生超過130TB的數據,很快數據的存儲就變成一個大問題。例如,Broad研究所以每12分鐘分析一個30X人全基因組速率產生基因測序數據——每年可產生將近4000TB的BAM文件。

BAM文件可以轉化為VCF文件(變體調用格式),後者僅包含不同於標準序列的信息。雖然VCF文件小並且更加好用,但是保存原始序列文件仍是必要的,方便研究者將來查看這些數據。

隨著測序成本下降,一些人就得出這樣的結論:對樣本重測序會很容易,並且可能更便宜,而分析大量數據時,研究人員的選擇空間非常大。但事實上,在OMICtools中有超過3000個序列分析工具可供選擇,研究人員想要找到最好的那一個,也不容易。

臨床解釋和報銷

最後,對於臨床樣本,還有一個挑戰:對於測序序列的變異提供一致可靠的解釋。

一個典型的外顯子包含1萬~2萬個突變,全基因樣本則會產生超過300萬種變異。在通常的解釋中,根據變異造成的疾病相似性分類。

為了協助指導臨床醫生,美國醫學遺傳學和基因組學,分子病理學協會和美國病理學家學院創建了一套對突變進行分類的系統。分類目錄包括致病性,可能致病性,不確定的顯著性(目前佔外源和全基因組樣本的絕大多數),可能良性和良性。

然而,這種方案有其局限性。即時使用一種公認的分類方案分類同一個資料庫,不同的項目組可能會提出不同的解釋。對新系統的一個試驗研究中,參與的不同臨床實驗室僅在34%的情況下,對於分類的解釋一致。

如果存在分歧或需要額外的分析來解釋實驗結果,那麼就存在報銷的問題。基於NGS的測試的報銷可能是一個大障礙,但是對於解釋的報銷幾乎是不可能的。

Rady兒童基因組醫學研究所臨床研究員Jennifer Friedman博士說,

實驗室不可能對試驗的解釋付費,如果這種服務可以提供,這是非常有價值的,但是沒有人做到這個。

沒有辦法為此付費,保險公司不報銷。儘管對於精準醫學的關注度上升,但是無論是臨床醫生或實驗室做出的解釋,都沒有被醫療保健支付者承認或是重視。

到目前為止,病人樣本的分析基本上是作為一個研究項目來對待的,是在研究型醫院中的一個選擇,並且僅用於有限數量的患者。

未來展望

儘管過去幾年有很大的進步,但是整個NGS工作流程,從樣品文庫構建到數據分析,仍然存在大量的挑戰。隨著基礎技術的進步,新的挑戰將繼續出現,對於這些基因組技術的廣泛應用和最大化改善人類健康而言,解決這些挑戰是至關重要的。雷鋒網雷鋒網

相關焦點

  • 高通量測序的前世今生
    「高通量測序」這詞我想大部分人都不會感到陌生,因為現如今它算得上是一個比較熱門的領域,但是您又知道多少關於高通量的知識呢?接下來小編來聊聊它的前世以及今生,帶您走進高通量測序的世界。所有事物的出現都是有必然聯繫的,不可能憑空出現。
  • 高通量測序的十年:從科研進入臨床
    從而推動產前檢測技術極大的發展,也幫助高通量測序真正的進入了臨床轉化應用階段。在染色體非整倍體疾病中,性染色體異常(XXX、XO、XXY)等也頗為常見,由於X染色體(155mb)相對Y染色體(60mb)要大很多,血漿游離DNA中母體的DNA含量佔50~90%,從而造成無創檢測性染色體異常 具有一定的難度,準確率基本在90%左右。
  • 高通量測序+驗證套路,5分+SCI,可移植性高,門檻低,懂?
    高通量測序是一次性對幾百萬到十億條DNA分子進行並行測序,又稱為下一代測序技術,其使得可對一個物種的轉錄組和基因組進行深入、細緻、全貌的分析,所以又被稱為深度測序。在高通量測序發展的過程中,也有很多的問題需要我們去解決:數據在臨床診斷上的作用,測序數據的儲存和分析,數據的安全和信息隱私等。
  • 高通量測序技術在產前診斷中的應用
    與CMA相比,CNV-seq屬於非訂製化技術,在基因組絕大多數區域內都可以無差別地檢測出CNV,其解析度可按測序深度不同而適應臨床需求[7]。筆者所在產前診斷中心採取平行檢測胎兒核型及CNV-seq方法,發現致病性染色體微缺失/微重複病例約佔所有產前診斷病例的1.2%。
  • 高通量測序(又名下一代測序, NGS)的原理簡介
    高通量測序(High-Throughput Sequencing)又名下一代測序(Next Generation Sequencing,NGS)
  • 華點雲:網際網路+高通量基因測序,讓基因解讀更容易
    華點雲自主研發的CelLoud雲平臺是基於高通量基因測序技術NGS的生物信息分析雲平臺,致力於為合作夥伴提供實現基於高通量基因檢測技術最終應用的全面解決方案,是我國最早自主研發並在臨床醫院推進使用的生物信息分析雲平臺之一。
  • 真邁生物發布新款國產高通量測序平臺GenoLab,專家齊聚共話中國...
    10月12日,真邁生物在深圳召開了以「披荊斬棘,乘風破浪」為主題的國產測序平臺及應用創新論壇暨真邁生物新品發布會。會上,真邁生物重磅發布了自主研發的新款高通量測序平臺——GenoLab,開啟了國產基因測序儀在科研和臨床應用領域加速普及和落地的新徵程。
  • 高通量多通道的單細胞測序設備,將投入醫療科研應用
    我有一種強烈的直覺,對於成千萬上億的細胞而言,僅取96個採樣細胞測定來描述細胞特性是有局限的,但有精細的檢測已足夠令人興奮,一旦細胞通量提高到成千上萬,那麼單細胞測序的應用場景就會有無限可能。 2016年,10x Genomics推出了首款單細胞高通量測序儀器Chromium,從設備層面實現了單細胞高通量cDNA建庫。
  • 高通量測序技術的原理和應用——第二代測序技術
    , HTS) 是對傳統Sanger測序技術革命性的變革,可以一次對幾十萬到幾百萬條核酸分子進行序列測定,因此也稱其為下一代測序技術 (Next Generation Sequencing, NGS),高通量測序技術的出現使得對一個物種的轉錄組和基因組進行細緻全貌的分析成為可能。
  • 研究解析RNA深度測序分析方法
    來自清華大學國家實驗室生物信息學研究部的研究人員發表了題為「Using non-uniform read distribution models to improve isoform expression inference in RNA-Seq」的最新研究論文,這篇文章解析了RNA深度測序分析方法
  • 第四代測序:固態納米孔技術的現狀與挑戰
    然而, 作為一種新興的測序技術, 固態納米孔在製造、測序、集成等方面也存在著諸多挑戰。來自中科院的學者就這一方面發表了綜述,主要介紹了納米孔測序技術的原理、製備工藝和面臨的挑戰, 並展望了未來納米孔測序技術的發展前景。DNA 測序技術作為人類探索生命秘密的重要手段之一, 對生物、生命科學、醫學等領域的技術發展起到了巨大的推動作用。
  • 什麼是高通量單細胞RNA測序技術?
    打開APP 什麼是高通量單細胞RNA測序技術? 值得一提的是,目前全球各地發表的植物單細胞測序的文章達到5篇了。iPlants報導了其中的三篇,包括一篇Plant Cell(點擊查看)、Plant Physiology(點擊查看)、Developmental Cell (點擊查看)、一篇Science(未報導)和這一篇,包括4篇是根發育和1篇是雄性配子發育。
  • 中國疾控中心千萬元訂單背後:高通量基因測序市場之爭
    在中國採購網上發布的兩則公告顯示,將總共投入近1000萬元人民幣採購高通量基因測序儀。其中一筆採購訂單已經於4月2日以500萬元的價格成交,產品為10臺illuminaiSeq100高通量基因測序儀。利用科學技術的手段監測疫情風險,能夠幫助政府部門更早地進行決策。未來中國疾控中心系統裡,將把檢測新病毒作為一種常態。
  • 染色體核型、微陣列、高通量測序、FISH等檢測手段的區別與應用
    那麼,染色體核型分析、二代測序、基因晶片、高通量測序、微陣列、FISH等檢測手段有哪些區別?  高通量測序也稱二代測序  主要用來檢測單基因病基因突變位點和染色體的微缺失微重複。檢測基因位點和染色體使用不同的試劑盒及測序深度,分析方法也不相同。
  • 2017年度聚焦:DNA測序深度分析
    這種平板上特製有許多直徑約為44um的小孔,每個小孔僅能容納一個磁珠,通過這種方法來固定每個磁珠的位置,以便檢測接下來的測序反應過程,如圖5所示。圖5 焦磷酸測序測序方法採用焦磷酸測序法,將一種比PTP板上小孔直徑更小的磁珠放入小孔中,啟動測序反應。
  • 《產前外顯子組測序遺傳諮詢和報告規範》團體標準宣貫活動火爆,線...
    《產前外顯子組測序遺傳諮詢和報告規範》團體標準宣貫活動火爆,線上人次超百萬 2020-09-14 13:05 來源:澎湃新聞·澎湃號·政務
  • 基於高通量技術的SFTS病毒基因組測序方法的建立
    3例樣品測序讀取片段數、讀取鹼基數、有效數據率、測序深度、覆蓋度和Q30%總結統計於表2。傳統的一代測序耗時長,通量低且對未知病毒的檢測較為局限,近年來,高通量測序已廣泛應用於以轉錄組測序等為代表的功能基因組學研究中[11,12]。對於有參考基因組序列的物種,轉錄組測序數據可以大大豐富和驗證對基因組數據的注釋[13]。其中Illumina平臺測序技術輸出序列長度短,通量大,速度快,被廣泛應用於核酸檢測研究。
  • 拼技術還是拼服務,國產高通量測序企業如何打響翻身仗第一槍?
    這是國內高通量測序(NGS)行業上遊儀器和試劑耗材製造商的首次合作。在整個NGS產業鏈中,上遊測序儀市場毫無爭議是整個產業鏈的核心。華大基因是高通量測序領域的龍頭老大,華大智造則承接了其測序儀研發製造部分。此次上遊儀器與試劑耗材市場的合作,也意味著產業中自主創新生態鏈的初步形成。
  • Cell:B細胞受體高通量測序技術
    近日,美國範德比爾特大學醫學中心等科研機構的科研人員在Cell上發表了題為「High-Throughput Mapping of B Cell Receptor Sequences to Antigen Specificity」的文章,開發了一種B細胞受體高通量測序技術
  • 三大巨頭高通量測序(NGS)的原理特點、技術應用和意義
    高通量測序(High-Throughput Sequencing)又名下一代測序(Next Generation Sequencing,NGS),以能一次並行對幾十萬到幾百萬條DNA分子進行序列測定和一般讀長較短等為標誌。是相對於傳統的桑格測序(Sanger Sequencing)而言的。