合作文章|變異檢測軟體技能PK,誰是Battle King?

2020-09-04 安諾基因

DNA變異是個體間遺傳變異的重要來源之一。第二代測序技術(NGS)和第三代測序技術(TGS)都在遺傳變異研究中大放異彩。許多變異檢測工具可以用來解析二代或三代數據,但是目前沒有軟體能兼顧靈敏性和特異性地分析NGS或TGS數據,且通過不同工具組合的分析流程得到的結果可能會有很大差異,那麼變異檢測到底應該用什麼軟體呢?近日,安諾優達裴素蕊博士等人聯合中山大學中山眼科中心國家重點實驗室謝志老師課題組在Briefings in Bioinformatics上發表了「Benchmarking variant callers in next-generation and third-generation sequencing analysis」。文章基於12套NGS和TGS數據系統評估了11款變異檢測工具。話不多說,小編帶你一探究竟~

文章亮點

  • 本文系統評估了用於NGS 數據的4個胚系突變檢測工具、6個體細胞突變檢測工具和3個用於TGS數據的胚系突變檢測工具。
  • Sentieon、GATK、DeepVariant均可獲得高準確、高靈敏的NGS數據胚系變異檢測結果。從準確性和經濟性的角度綜合考慮,推薦使用30x的全基因組測序深度應用於NGS變異檢測研究。
  • Sentieon的DNAseq模式,GATK的HaplotypeCaller模式和DeepVariant的PACBIO模式在SNP檢測中的表現類似,但DeepVariant在InDel檢測中表現優於Sentieon和GATK。TGS數據在極端GC區域和高重複區域的SNPs和InDel檢出數量高於NGS數據。
  • Sentieon的TNscope模式和GATK的MuTect2模式對於體細胞變異的檢測率明顯高於其他軟體。腫瘤標本純度越高,SNPs和InDel檢測的準確性越好。
  • 變異檢測的準確性依賴於分析工具的謹慎選擇及其參數和所應用的測序平臺等。

研究背景

第二代測序技術(NGS)是目前應用最廣泛的全基因組變異檢測技術。基於NGS的全基因組或全外顯子組測序技術通常用於鑑別孟德爾遺傳疾病中的患者特異性胚系突變和癌症中的體細胞突變。目前常見的檢測軟體包括應用於胚系突變的GATK HaplotypeCaller模式,Sentieon(DNAseq或者DNAscope模式),DeepVariant和應用於體細胞突變的GATK MuTect2模式,Sentieon的TNseq和TNscope模式,NeuSomatic和Strelka2。針對第三代測序技術,DeepVariant新開發的PACBIO模式也可以實現SNP和InDel變異檢測。本研究對不同變異檢測工具的系統評估將為研究者在不同場景下使用合適的檢測工具提供系統且有價值的建議。

研究主要內容

1. NGS數據胚系突變結果評估

對於NGS數據胚系突變檢測作者測試了Sentieon的DNAseq和DNAscope模式,GATK的HaplotypeCaller模式和DeepVariant的WGS模式。結果表明,以上4個檢測工具在7個數據集中均可獲得高準確、高靈敏的SNP和InDels檢測。其中,在覆蓋深度為30x時,SNP變異檢測的F1值均大於0.99,InDels變異檢測的F1值均大於0.98(圖1)。為了評估不同測序深度對變異檢測結果的影響,從NGS002和NGS005數據集中隨機抽取測序深度為2x、5x、10x、15x和30x的數據集。在小於15x的低測序深度下,測序深度的變化對精確度影響不大,但召回率較低。當測序深度超過15x時,F1值的增長幅度減小。從30x增加到50x時,F1值無明顯變化。因此,在進行胚系突變檢測時,為了兼顧成本和準確性,建議採用30x深度用於NGS胚系突變檢測。

註:F1=2*(精確度*召回率) / (精確度+召回率)

圖1 NGS數據集胚系突變檢測結果的Precision-recall曲線

2. TGS數據胚系突變結果評估

對於TGS數據胚系突變檢測作者測試了Sentieon的DNAseq模式,GATK的HaplotypeCaller模式和DeepVariant的PACBIO模式。其中,3款測試工具在SNP檢測中F1值都高於0.99,且三者之間的差異很小。然而,3款工具在InDel檢測結果具有顯著差異。DeepVariant的F1得分最高(TGS001、TGS002和TGS005分別為0.9902、0.9927、0.9924),其次是Sentieon(0.9433、0.9390、0.9393),而GATK(V4.0.7)的F1得分僅為(0.8437、0.8223和0.8078)。因此DeepVariant的PACBIO模式在TGS數據變異檢測中的準確性和一致性的表現更好(圖2)。

圖2 TGS數據集胚系突變檢測結果的Precision-recall曲線

3. NGS和TGS數據集胚系突變檢測結果比較

研究隨後用DeepVariant測試比較了NGS和TGS數據集中的SNP和InDel位點信息。結果發現,相比NGS數據,TGS數據能檢出更多的SNPs和InDel變異位點,尤其是在極端GC區域和高重複區域(圖3)此外,還發現了一些特異性的SNP和InDel位點僅在TGS數據集中被檢測到。由此表明單分子實時測序能較好地解決PCR擴增導致的GC偏好性問題且在高重複區域的變異檢測具有明顯的優勢。

圖3 NGS和TGS在不同GC區域和重複區域的平均變異位點數量

4. 體細胞變異檢測結果評估

為了評價不同腫瘤樣本純度對體細胞變異檢測的影響,作者分別混合了10%、20%、40%和60%腫瘤純度的模擬數據。在MIX10時,變異檢測精確度雖然可以達到0.99以上,但召回率僅為0.5左右,F1值低於0.9。由於覆蓋度不足,當腫瘤細胞混合比例較低(10%)時,部分體細胞變異位點將不能被檢測到。隨著腫瘤樣品純度的提高,精確度變化不大,召回率顯著提高。在MIX20腫瘤樣本中,MuTect2和TNscope的SNPs F1得分提高到0.97。當腫瘤純度增加到40%和60%時,除TNseq外,其餘所有軟體均表現出較高的SNPs 的F1評分。對於InDel檢測,MuTect2_GATK和TNscope_Sentieon在MIX20時F1得分最高,MuTect2_GATK和VarScan2在MIX40和MIX60時F1得分最高。因此,TNscope和Mutect2的體細胞變異檢測表現優於其他測試工具(圖4),且腫瘤標本純度越高,SNPs和InDel檢測的準確性越好。

圖4 不同腫瘤樣本中體細胞變異的Precision-recall曲線

5. 計算資源消耗評估

文章比較了所有檢測工具的計算資源消耗和時間成本(圖5)。其中,在不影響檢測準確性的情況下,Sentieon的計算資源消耗和時間成本都最少。因此,當以檢測速度為考量標準,Sentieon為較優選擇。否則,DeepVariant和GATK為更好的選擇。對於TGS數據,Sentieon的資源消耗最小,而DeepVariant的準確率最高。因此,各位老師應根據項目實際需求謹慎選擇分析軟體。

圖5 不同檢測工具的計算資源消耗情況

本研究中所評估的檢測工具詳細信息見表1。

表1 變異檢測評估軟體和模式匯總表

總之,在不同的應用場景下,變異檢測的準確性依賴於分析工具的謹慎選擇及其參數和所應用的測序平臺等。

安諾基因在人基因組測序方面擁有多樣化的產品類型,涵蓋了單基因病人重測序產品、複雜疾病人重測序產品以及腫瘤全基因組重測序產品等。此外,安諾優達配置有7臺Sequel II測序儀,全面為科研助力。三代人重全變異檢測產品採用DeepVariant、Sniffles等高分文章專業分析軟體,坐享極速測序周期和雲計算快速分析,助您一次測序輕鬆搞定SNP、InDel和SV全變異分析,徹底解決短讀長測序高GC區域覆蓋難題。總之,你想要的我們這裡都有,還不心動嘛?快和我們的銷售經理聯繫,下一個高分文章就是你的!

參考文獻:

Pei S, Liu T, Ren X, et al. Benchmarking variant callers in next-generation and third-generation sequencing analysis[J]. Briefing in Bioinformatics, 2020.doi:10.1093/bib/bbaa148

相關焦點

  • 文章相似度檢測軟體有哪些?怎麼操作相似度檢測軟體?
    文章相似度檢測軟體有哪些?怎麼操作相似度檢測軟體?相似度檢測軟體的作用就是檢測內容在網際網路上是否存在重複性,一般我們利用工具來檢測文章是否原創。不管是論文創作者還是文案創作者都想知道自己創作的內容是否存在重複,今天小編就跟大家分享一個簡單方法,教大家怎麼知道自己創作的內容是否存在重複。
  • 原創文章檢測工具,原創文章檢測軟體,檢測文章相似度
    原創文章檢測工具,原創文章檢測軟體,檢測文章相似度,無論大家做網站編輯或者自媒體文案編輯,都是要涉及到文章原創度的檢測,因為無論是做什麼類型的編輯都是需要敏銳的觀察力和進行內容創作的靈感。第一點:內容的原創性要合格無論是在自媒體平臺,還是在網站,你的內容原創性都一定要合格,原創度低的文章不僅在自媒體平臺推薦少,而且容易導致帳號限流,對網站來說,收錄也會降低,大家在發文之前可以用蟻小二進行原創度的檢測,檢測完成後,可以用蟻小二進行一鍵分發。
  • RNA-seq 檢測變異之 GATK 最佳實踐流程
    ,比對到參考基因組需要跨越轉錄剪切位點,所以 RNA-seq 進行變異檢測的重點就在於跨剪切位點的精確序列比對。文獻 systematic evaluation of spliced alignment programs for RNA-seq data 中對 RNA-seq 數據常用的 11 款比對軟體進行了詳細測試,包括 STAR 2-pass,而 GATK 對 RNA-seq 數據變異檢測的最佳實踐流程中選用了 STAR
  • 《創造101》第二期五組battle,孟美岐實力進A,吳宣儀爆冷失敗
    女團選秀節目《創造101》第二期在萬眾矚目中上線了,看點頗多,印象最深的就是「這一期的battle被玩壞了」,細數一下,竟然有五組,難道battle才是正體?更讓人驚奇的是,幾乎所有的挑戰者都成功晉級了,只有吳宣儀爆冷失敗、楊芸晴守擂成功,一起來看看!
  • 一拳超人:s級英雄中,誰擁有和king一樣的運氣?
    在s級英雄中,有一個很特殊的人,他自身實力並不強,但是他卻能百戰百勝,甚至用氣勢就能將敵人嚇跑,想必大家已經知道他是誰了吧!沒錯,他就是人氣超高的s級英雄king,同時他還有一個很響亮的稱號「地表最強男人」。我們都知道king自身的實力並不強,他完全是撿漏被稱為強者的。
  • 說唱裡battle什麼意思什麼梗? battle考驗的就是懟人功力
    說唱裡battle什麼意思什麼梗? battle考驗的就是懟人功力時間:2019-07-15 10:17   來源:愛秀美   責任編輯:沫朵 川北在線核心提示:原標題:說唱裡battle什麼意思什麼梗?
  • 雙語閱讀|King and the Spider,羅伯特·布魯斯與蜘蛛的啟示
    There was a king in Scotland. His name was Robert Bruce. He fought many battles and won them. But once he was badly defeated.蘇格蘭有一位國王。他的名字叫羅伯特布魯斯。
  • 為什麼說寫作技能對於軟體工程師來說很重要?
    ,見證了不同的項目以及團隊合作和招聘新人的方式。這種類型的面試無法發現工程師其它的技能——這些技能通常被低估,但是能給團隊帶來很多好處。其中有一項對工程師尤為重要,雖然它常常被忽視。所以它是什麼呢?是寫作技能。我們花了大量的時間來學習如何成為一個更好的編碼員,但沒有將足夠的時間用在寫作和交流上。
  • King的實力到底如何?一人力壓4個龍級,連黑精都開始懼怕他
    被號稱為人類最強的king,雖然從未有人見過他出手,但卻戰功赫赫,當然這種幻想都只是在第一季當中才會有,在第二季出來後,我們都知道,king桑不過是一個資深級老宅男,所有的戰功不過都是埼玉的功勞,而king桑不過是剛好都路過了而已。
  • 一拳超人:king究竟有沒有硬實力?官方給出隱藏數據,讓人很意外
    一拳超人的戰力設定一直都不太穩定,許多怪人的等級與實力都不符,就拿龍級的爆山來講,從他的表現和技能來看,沒有一點能讓漫迷們信服他有龍級實力,將他定位到鬼級還能勉強讓人認同,而S級的英雄中也有一位實力遭到質疑的人,此人就是地表最強男人king。
  • 如何選擇論文檢測軟體?
    現在市面上有很多的論文檢測軟體,大部分都是需要收費的,質量參差不齊,那我們應該怎樣去選擇一款比較好的論文檢測軟體呢?當然我們首先就是要看論文檢測軟體的質量效果,中國是從1977年恢復高考,中國知網是始建於1999年,知網經歷了二十一年的發展,現在已經成為了國內最權威的查重網站,其中的論文查重資料庫收錄最為全面,當然相應的查重價格也是很昂貴的,如果我們是在校學生,學校一般會與知網有合作,知網也不會提供給個人用戶查重論文的機會,而在學校與其合作是有提供給畢業生們1~2次的免費查重機會的
  • cuteSV——基因組結構變異檢測工具
    來自哈爾濱工業大學的姜濤老師在近期發表的文章中[4]介紹了一款全新的SV檢測工具——cuteSV,該工具使用了納米孔測序高通量測序平臺PromethION最新發布的長讀長測序技術,解析了Genome in a Bottle(GIAB)HG002人類參考基因組樣本中的SV。
  • 《瘋狂的球球》德雲社相聲演員燒餅與馬蘇battle誰的手更巧?解壓...
    德雲社相聲演員燒餅和影視圈的姐姐馬蘇竟然在比誰的手更巧?這是一檔怎樣神奇的綜藝!注意!注意!前方「球」來了!馬蘇燒餅緊張「battle」誰的手更巧,「彈球之爭」誰能更勝一籌?《瘋狂的球球》全新來襲,球來了!乘風破浪的姐姐王智與馬蘇、小燕子、樊雨潔組成雪球隊,德雲社相聲演員燒餅、曹鶴陽與E哥、肖添仁組成麥咭隊,兩隊點滿能力值,與球「槓」上了。現場最精彩的片段之一,實屬馬蘇和燒餅的「彈球battle」!
  • 看看自己長得像誰 iPhone軟體明星臉
    看看自己長得像誰 iPhone軟體明星臉 2013年02月13日 01:50作者:楊霏霏編輯:楊霏霏文章出處:泡泡網原創 也許你自己並不清楚,那麼就讓軟體來幫忙。測一測你的臉長得到底想那位明星。
  • 華大基因肺癌分析軟體獲證 實現檢測全流程資質認證
    原標題:華大基因肺癌分析軟體獲證 實現檢測全流程資質認證      10月30日,深圳
  • Bionano光學圖譜技術可檢測罕見病變異
    利用全外顯子組測序無法檢測大多數結構變異,無法生成染色體圖譜,遺漏掉捕獲效率低的外顯子區域的變異,幾乎不能檢測重複區域,將非外顯子區域的變異排除在外。相比之下,全基因組測序能提高9%的診斷率,但是依舊無法檢測大多數結構變異(尤其是重複、倒位和易位),無法生成染色體圖譜,也不能分相。
  • 商業分析專題:香港大學pk香港中文大學PK香港科技大學,你選哪所
    也就是說香港大學pk香港中文大學PK香港科技大學的商業分析碩士,你選哪所?今天學姐來跟大家談一談三所學校的BA專業。香港大學|商業分析碩士項目名稱:Master of Science in Business Analytics所屬學院:商學院項目學制:全日制1-2年項目學費:330,000港幣
  • 中國禽流感病毒進化變異和公共衛生風險預警最新研究進展
    流感中心副主任、中國科學院微生物研究所病毒傳播預警與致病機制研究組組長畢玉海研究員為文章的第一作者和共同通訊作者,山東第一醫科大學史衛峰教授、中科院武漢病毒所陳全姣研究員為共同通訊作者,廣東美格基因科技有限公司技術總監金桃博士作為文章共同第一作者主要負責了其中部分禽流感樣本的測序和基因組分析工作。
  • 獨門護體神功 258pk《熱血江湖傳》金鐘罩系統出新玩法
    258pk《熱血江湖傳》金鐘罩系統又出全新玩法,防身技能火爆來襲,戰鬥力升級同步開啟,保你刀槍不入! 【新鮮玩法 技能升級】 金鐘罩系統在258pk《熱血江湖傳》裡,作為一個暫露頭腳的新玩法,在不久前的更新中,官方又放了大招。
  • 厲害了夥伴556pk《鬥羅大陸》泰坦巨猿助你扭轉乾坤_國內新遊...
    說到在556pk鬥羅大陸中與敵人對戰取勝的關鍵有很多,不僅僅是戰力以及裝備夥伴也是尤為重要的,一個好的魂武夥伴可以讓你扭轉乾坤,而其中又屬泰坦巨猿十分的出色哦。  新服上線送首充+15元續充:http://www.556pk.com/g/704/3773