oncotator:腫瘤研究專用的突變注釋軟體

2020-10-18 生信修煉手冊

目前,較為流行的突變注釋軟體有以下3種

  1. ANNOVAR

  2. SnpEff

  3. Variant Effect Predictor(VEP)

這三款軟體適用範圍廣,可以注釋任何的基因組變異,無論是germline還是somatic variants。通用性強的同時,帶來的問題就是針對腫瘤基因組研究而言,其注釋結果中缺乏腫瘤特異性的注釋內容,而且其注釋結果為VCF格式,需要進一步轉換為MAF格式才可以進行腫瘤研究的下遊分析,不夠便利。

為了解決這個問題,Broad Institute的科學家開發了一款名為oncotator的注釋軟體,專門針對腫瘤基因組研究進行設計,其注釋結果可以直接輸出成MAF格式,官網如下

https://software.broadinstitute.org/cancer/cga/oncotator

該軟體集成了14種不同來源的注釋信息,分成以下4大類別

  1. Genomic Annotations

  2. Protein Annotations

  3. Cancer Variant Annotations

  4. Non-Cancer Variant Annotations

不同類別對應的資料庫展示如下

該軟體的原始碼保存在github上,網址如下

https://github.com/broadinstitute/oncotator/releases

同時該軟體依賴一個整合好的資料庫,下載方式如下

wget -r "ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/oncotator/"

資料庫大小為17G, 軟體採用python進行開發,其安裝過程比較簡單,基本用法如下

oncotator \
-v \
--db-dir /oncotator_v1_ds_Jan262015 \
--input_format=VCF \
--output_format=TCGAMAF \
input.vcf \
output.maf \
hg19

db-dir參數指定下載的數據資料庫的路徑,最後三個參數對應輸入文件,輸出文件和基因組版本,該軟體只支持hg19版本。

為了方便沒有編程經驗的科研工作者,同時也提供了web 服務,網址如下

http://portals.broadinstitute.org/oncotator/

上傳tsv格式的突變數據即可,示意如下

結果展示如下

通過該軟體可以得到MAF格式的注釋文件,更加方便的用於下遊的數據分析。

·end·

相關焦點

  • TP53基因突變的腫瘤
    過程中出了差錯,染色體上的基因突變了,此時,全靠細胞核裡的抑癌機制來糾錯,或者引導出錯的異常細胞凋亡自殺,不至於異常細胞無限發展成腫瘤。TP53基因,就是染色體上的抑癌基因之一,相當於電腦裡殺毒軟體,監控其他軟體(基因)出錯情況。TP53和P53:基因叫TP53,它轉錄出來的蛋白叫P53蛋白。
  • 腫瘤全外的點突變有哪些分類呢?| 腫瘤全外專題
    如下圖所示:小師妹最近在學習腫瘤克隆進化的過程中,發現人類的點突變的分類與農學裡的差異較大,為了釐清這裡邊的關係,小師妹覺得非常有必要做一個系統的梳理。這裡邊最常見的分類就是基因區同義突變和非同義突變,然後就是promoter區的SNP突變。另外,農學中取樣的植物組織往往是葉片,也不存在體細胞這一說。醫學相關研究中對突變的分類更加細緻,什麼是體細胞突變(somatic mutation)?|腫瘤全外一文也闡述了體細胞突變(somatic mutation)和胚系突變(germline mutation)的概念。
  • 研究揭示組蛋白單個位點突變如何導致腫瘤發生
    研究揭示組蛋白單個位點突變如何導致腫瘤發生 作者:小柯機器人 發布時間:2020/12/1 13:17:02 加拿大麥吉爾大學Nada Jabado、Claudia L.
  • 腫瘤突變形成促進腫瘤進展微環境
    腫瘤突變形成促進腫瘤進展微環境 作者:小柯機器人 發布時間:2020/7/9 9:59:43 日本國立癌症中心研究所/腫瘤探索研究與臨床試驗中心(EPOC)Hiroyoshi Nishikawa
  • 出國看病新研究,腫瘤突變負荷可預測免疫治療療效
    組織腫瘤突變負荷(tTMB)作為一種生物標誌物,已經被臨床科研人員研究了一段時間,體內的腫瘤突變負荷的主要臨床意義,在於可以預測哪些患者最可能對免疫療法產生反應。在2020年6月,腫瘤突變負荷被美國食品和藥物管理局(FDA)批准,作為在先前已接受多項治療的晚期癌症患者中使用帕博利珠單抗的生物標記。
  • 研究揭示微衛星不穩定腫瘤中的多表位移碼突變
    研究揭示微衛星不穩定腫瘤中的多表位移碼突變 作者:小柯機器人 發布時間:2020/12/2 21:36:46 美國西奈山醫院伊坎醫學院Nina Bhardwaj小組揭示微衛星不穩定腫瘤中的共享免疫原性多表位移碼突變
  • 腫瘤二代測序都能幹什麼?
    其次,腫瘤異質性的存在,許多腫瘤的驅動基因,是基於拷貝數的改變,或者合併基因突變和重排。拷貝數結合突變重排的變化,就不僅需要全外顯子甚至全基因組進行深度測序。但是一些明確意義的點突變和重排和拷貝數變化,目前有許多成熟技術可以輕鬆應對,用all in one的思路來看待新技術在臨床的應用,就如有了高鐵,就不需要特快列車和貨運列車,有了核武器這樣巨大的殺傷性武器,就無需常規武器一樣幼稚。
  • 瑞金新技術(十二)| 急性白血病和髓系腫瘤基因突變組合(panel)檢測
    >01急性白血病和髓系腫瘤基因突變組合檢測瑞金新技術急性白血病和髓系腫瘤基因突變組合(panel)檢測是血研所臨檢實驗室在前期臨床研究的基礎上,自主開發的基於液相探針捕獲和高通量測序技術的覆蓋100個相關基因的基因突變檢測,具有高準確性、高靈敏度、高覆蓋均一性、高捕獲效率和低成本的優勢,適用於急性白血病和髓系腫瘤患者基因突變篩查。
  • 【盤點】Nature多篇亮點研究揭示膀胱腫瘤基因組突變中DNA修復及...
    ;隨著對成千上萬個在腫瘤細胞DNA中積累的基因突變進行精確分析,研究人員如今發現的致癌基因的數量越來越多了;近日科學家們就將研究目光轉移到了其它關鍵問題上,即什麼樣的生物學過程會引發DNA發生突變?標記搜尋為了重新追蹤引發癌症基因突變的生物學過程,研究者Getz同其它癌症基因組研究者共同研究了所謂的突變標記,突變標記是腫瘤DNA遺留的突變模式,其反映了不同的引發突變的事件或暴露情況;比如吸菸會對肺癌細胞的基因組產生一種特有的標記,而研究者就可以通過進行大規模測序調查肺部腫瘤的基因組來對這種標記進行揭示,隨後再利用先進的計算機算法來揭示吸菸引發的不同遺傳類型的精確排列
  • 【直播】我的基因組 32:使用annovar注釋vcf
    輸出文件也有多種格式,包括注釋過的VCF文件、用tab或者逗號分隔的txt文件。ANNOVAR能快速注釋遺傳變異並預測其功能。類似的variants注釋軟體還有VEP,snpEff,VAAST,AnnTools等等。
  • Nat Commun:新研究發現一個治療KRAS突變腫瘤的潛在靶點
    2017年2月24日訊 /生物谷BIOON/ --西班牙納瓦拉大學的研究人員發現一個重要基因FOSL1會參與肺癌和胰腺癌的發育。這項工作還有美國、英國、德國和丹麥等國家的研究人員參與,最近發表在國際學術期刊Natue Communications上。大約25%的肺癌病人和90%的胰腺癌病人存在KRAS基因的突變,KRAS是癌症中最常見的突變癌基因,目前還沒有非常有效的治療方法能夠治療這些病人。
  • Science子刊:腫瘤特異性抗體靶向抑制RAS突變腫瘤
    2020年2月20日訊 /生物谷BIOON /--致癌RAS突變體(RASMUT)蛋白由於其在細胞內的位置導致常規抗體的無法接觸並靶向它,因此通過常規抗體方案是無法治靶向這種突變並治療癌症的。
  • Cancer Cell|腫瘤耐藥研究又有新進展!「基因突變」或許不是必要條件
    近期,在Science雜誌上發布的一篇研究認為,臨床上使用放化療藥物抵抗癌症進展時,機體內的腫瘤細胞往往通過應激誘導的突變(stress-inducedmutagenesis,SIM)這一機制,發展出耐藥的細胞株,使得腫瘤復發…然而,也有很多科學家認為,基因突變並不能完全解釋腫瘤細胞出現耐藥這一現象,越來越多的研究聚焦於細胞的非遺傳改變1。
  • 基因突變與腫瘤:講述它們的前世今生
    基因突變在腫瘤的發生和發展過程中扮演著重要的角色,隨著近代分子生物學的發展及腫瘤精準醫學的出現,在基因層面對腫瘤的研究越來越深入,特別是腫瘤發生的機制及抗腫瘤治療方面,本文就幾種常見的惡性腫瘤來闡述基因在腫瘤發生過程中的作用及臨床指導意義。
  • TMB:腫瘤突變負荷簡介
    腫瘤的免疫療法是即手術,放療,化療等傳統治療手段之後興起的一種新型的治療手段,以PD-1/PD-L1抗體為代表的免疫檢查點抑制劑在黑色素瘤,非小細胞肺癌等實體瘤的臨床治療中取得了不錯的進展。然而該療法也存在響應率低的問題,只有10-30%的腫瘤患者可以從該療法中獲益,為了精確篩選出免疫療法的目標群體,科學家先後嘗試了多種marker。
  • TMB專家共識發布|腫瘤突變負荷檢測及臨床應用中國專家共識
    ,通常用每兆鹼基有多少個突變表示(XX 個突變/Mb)。TMB 數值可反映腫瘤內產生腫瘤新抗原的潛力,與DNA 修復缺陷密切相關,在多種腫瘤中dMMR和MSI-H 患者具有較高的TMB。中國人群TMB 的獨立預測價值仍需更多前瞻性研究驗證。
  • 「無藥可治」的KRAS突變腫瘤有了新突破?
    這也就是為什麼三十多年的研究中罕有靶向KRAS蛋白的有效藥物。然而,在今年剛剛結束的ASCO會議上,AMG-510直接「剛」KRAS突變腫瘤的臨床研究數據讓人產生極大的「舒適感」。  2015年,MD Anderson腫瘤中心的Heymach團隊根據KRAS突變肺癌的共突變類型將KRAS突變分成三個亞組(圖4),分別是KRAS-TP53共突變(KP)、KRAS-STK11共突變(KL)、KRAS-CDKN2A共突變(KC)[2]。在進一步的研究中發現,三種不同類型的共突變腫瘤具有截然不同的生物學特性,並指出KL腫瘤對免疫治療反應較差[3]。
  • Cell Reports:90%的兒童骨腫瘤存在TP53突變
    Jude兒童研究醫院-華盛頓大學兒科癌症基因組計劃發現腫瘤抑制基因TP53突變在90%的骨肉瘤都存在,暗示突變在骨腫瘤的早期發展起著關鍵的作用。這項研究發表在Cell Reports雜誌上。p53基因的失活可幫助腫瘤細胞在放射治療下存活。以往的研究估計,四分之一到一半骨肉瘤中TP53突變,提示應該會有顯著比例患者對輻射做出反應。但情況並非如此。隨著全基因組測序發展,我們正在獲得新的見解,TP53各種突變促進骨肉瘤的發展,合著者Richard K. Wilson博士說:這些信息在設計治療方案中將是非常有益的。
  • 腫瘤突變負荷(TMB)是個什麼東東
    因此,需要繼續尋求更好的ICI治療反應預測,其中一種新興的生物標誌物就是腫瘤突變負荷(tumor mutational burden, TMB)。  簡而言之,TMB是腫瘤內存在的突變數。由於許多使用該生物標記物的原始研究都是基於外顯子測序計算的,因此通常將其視為基因組(外顯子組)編碼區內存在的突變數。