COSMIC:最大的【癌症基因突變】的資料庫

2021-02-28 Epigenetics表觀遺傳學

當你研究一個基因或蛋白時,研究到功能和應用階段,你需要知道這個基因在癌症中是否存在突變,這個時候該怎麼查?

今天給大家安利一個超強的資料庫:COSMIC

Cosmic [ˈkɑ:zmɪk] 本意為"宇宙的;極廣闊的",然而這裡為 Catalogue Of Somatic Mutations In Cancer 的縮寫,即「腫瘤中體細胞突變的目錄」。

該資料庫主要由英國威康信託基金會桑格研究所(Wellcome Trust Sanger Institute)開發和運作,2004 年發布第一個版本,2017 年 2 月 13 日發布了最新的第 80 個版本(v80),以後每 3 個月更新一次。這個資料庫有專門的團隊維護,不可以自己上傳數據,如果你希望上傳,可以聯繫他們的團隊。

網站對 2016 年 9 月的第 78 版(v78)的數據量統計如下:

這是目前最大最全的關於腫瘤中基因突變的資料庫!

下面簡要介紹一下 COSMIC 的用法和亮點:

COSMIC 菜單欄,核心包括 Resources、Curation(精選)、Tools、Data四個部分


▲ COSMIC 的整體頁面,其中上面提到的最核心的 4 個板塊也被單獨列出來

1. Home

Home 裡面包含有 Cell Lines Project COSMIC,其中 Cell Lines Project 是對最常使用的 1000 多種腫瘤細胞系的深入分析的數據,而標準的 COSMIC 版本中,包含的數據更多,但是分析沒有 Cell Lines Project 深入,可以理解為網站的兩種模式。

在標準的 COSMIC 模式下,網站的主色調是藍色的,而一旦選擇 Cell Lines Project,網站主色調變為綠色。以下我們在標準的 COSMIC 模式下講解。


▲ 1000 多種最常用的腫瘤細胞系清單

2. Resources

Resources 裡面包括 Cell Lines Project 、COSMIC、Cancer Gene Census、Drug Sensitivity、Mutational Signatures、GRCh37 Archive,其中 Cell Lines Project 、COSMIC 跟 Home 中的完全一樣,最後的 GRCh37 Archive 指的是以此前版本的人類基因組數據為參考,因此這裡重點介紹 Cancer Gene Census、Drug Sensitivity、Mutational Signatures。

2.1 Cancer Gene Census(癌基因統計)

2.1.1 Census

這裡又分為三個子菜單 Census、Breakdown(統計分析)、Abbreviations,其中 Census 菜單,顯示目前所有的癌基因,而且這個數據表可以搜索,導出(需要先註冊)。

注意:搜索的時候,只能在當前的頁面搜索,比如我在第一頁搜索 DNMT3A,顯示是沒有匹配的,但翻到第二頁,再次搜索就有了。

▲ 導出的格式有CSV和TSV,據導出的表格顯示,目前一共有 616 個癌基因。

以 DNMT3A 為例,點擊基因名,可以進入詳細的頁面:

▲  最右邊的灰色條可上下拉動,以控制頁面中峰的顯示幅度。滑鼠落在一個突位點上,顯示該突變點的位置以及突變數。

▲ 根據結構信息,分析該突變位點是否落在具有功能的結構域。

其他的功能,比如 Tissue、Distribution、Drug Resistance、Variant 等也非常重要,這裡不逐一介紹。

2.1.2 Breakdown(統計分析)

▲ 這裡是對所有癌細胞中的突變進行了整理

2.1.3 Abbreviations對表格中的縮寫進行解釋。

2.2 Drug Sensitivity

▲ 鑑定腫瘤的分子特徵,預測抗腫瘤藥物的響應

(Identifying molecular features of cancers that predict response to anti-cancer drugs.)

這裡主要包括 Compound、Cancer Feature、Cell Line 三種數據。

▲ 一共有265個小分子化合物,可以靶向不同的癌基因和信號通路

Cancer Feature 和 Cell line 的內容小夥伴可以自己去探索哦~

2.3 Mutational Signatures(突變特徵)

導致體細胞突變的原因很多,比如 DNA 複製的失真、暴露到內源性或外源性的誘變源、 DNA 酶修飾、DNA修 復的缺陷。不同的突變過程會產生不同的突變組合,這裡定義為「突變特徵」。

▲ 一共歸納了 30 種「突變特徵」

3. Curation(精選)

這裡又細分為 Cancer Gene Census、Genes、Gene Fusions、Genome Screen、Drug Resistance,其中 Cancer Gene Census 與前面介紹的完全一樣,不再贅述。


這裡的 Genes 與上面的 Cancer Gene Census 有一定差別,其中 Genes 是 Cancer Gene Census 中篩選出來的,此前沒有現成的資料庫的。(From this list we are selecting genes for COSMIC expert curation with an emphasis on genes for which there are no existing databases.)

▲ 這裡的 Genes 一共有 192 個,遠比 Cancer Gene Census 中的 616 個基因少

Gene Fusions、Genome Screen、Drug Resistance 也留給小夥伴們去探索。

4. Tools

Tools 中主要包括 Cancer Browser、Genome Browser、CONAN、Beacon,前兩者很容易理解,CONAN 是指拷貝數分析(Copy Number Analysis)

▲ 這裡需要輸入基因名稱或基因區間

Beacon,這裡理解為「界標」,即根據在基因組中的位置來查找突變

▲ Beacon 的操作界面

Highlight

在首頁的 Tools 工具欄中,新增了 COSMIC-3D,這個功能非常酷炫!

以 Kras 為例,輸入後按 enter 鍵,得到以下界面:

▲ 這個功能超級好玩!可以放大,縮小,旋轉,截圖……

▲ 繼續往下拉,可以看到各種錯義突變的位置,炫酷的是,右上角的蛋白結構還在轉個不停。

……

以上只是 COSMIC 的冰山一角

小編拋磚引玉而已

更多有意思的,有用的功能

還有待小夥伴們自己挖掘!

相關焦點

  • NCI發布最大規模癌症相關基因變異資料庫
    2013年7月16日訊 /生物谷BIOON/ --美國國家癌症研究所(NCI)科學家發布了有史以來規模最大的癌症相關基因變異資料庫,為研究者們提供了迄今為止最全面的方式,搞清楚如何將治療藥物靶向疾病。周一NCI在一份聲明中稱,基於基因組學研究的新資料庫,將對全球開放獲取,預計將有助於研究人員加快新藥的開發,同時能夠更好地將患者與療法進行匹配。當前所使用的大多數抗癌藥物,都是基於其實證作用(empirical activity)。其中的大多數藥物,我們知道存在作用靶標,但這些藥物並沒有與任何基因組學聯繫起來。
  • 最大人類基因變異資料庫解析突變奧秘
    【環球科技報導記者程君秋】據臺灣「中央社」8月18日報導,科學家17日公布至今匯集的最大人類基因變異資料庫,凸顯出若干被錯怪導致罕見疾病的基因突變,以及可能對疾病扮演意想不到角色的其他突變。據報導,多達100人的研究團隊2年前建立外顯子組(exome)超過1000萬變異的資料庫。外顯子組僅是人類基因組的一小部份,佔DNA的不到2%,但具關鍵重要性。外顯子組由基因編碼部位組成,即DNA的蛋白質表現區,發生錯誤會引發串聯式效應,導致疾病。
  • 10225例癌症患者的TP53突變揭示了基因功能新亮點
    該基因能感知細胞的應激或損傷,並在響應中阻止細胞分裂或引發細胞死亡,從而防止受損細胞的繁殖。TP53突變消除了一個關鍵的細胞安全機制,使其成為癌症的導火索。 7月30日發表在《Cell Reports》上一項研究中,來自美國貝勒醫學院的研究人員對TP53突變進行了最全面的研究,以更好地理解導致這一重要基因失活的過程。
  • 基因表達+突變分析利器
    小夥伴們大家好呀,今天要為大家介紹的是於2020年9月1日發布的資料庫muTarget(http://www.mutarget.com/),分析實體瘤中基因表達變化和突變狀態的資料庫。:連接實體瘤中基因表達變化和突變狀態的平臺muTarget介紹muTarget資料庫主要來自癌症基因組圖譜(TCGA)存儲庫,主要包含200多個癌症標本的實體瘤收集到資料庫中。
  • 發現200個非編碼基因突變可導致癌症!
    2018年4月5日訊 /生物谷BIOON /——人體基因組中98%的DNA都不會編碼蛋白質。與癌症相關的大量基因突變都發生在這些非編碼區域,但是目前還不清楚它們如何影響腫瘤生長和發展。現在來自加州大學聖地牙哥分校(UCSD)醫學院和MOoores癌症研究中心的研究人員發現非編碼DNA中幾乎有200個突變在癌症中發揮著重要作用。
  • DisGeNet:疾病相關的基因與突變位點資料庫
    DisGeNet是一個專門收錄人類疾病相關的基因與突變位點信息的資料庫,對應的文章發表在Nucleic Acids Research上,連結如下https://academic.oup.com/nar/article/45/D1/D833/2290909網址如下
  • Cell:科學家發現新型基因突變 為癌症診斷和治療提供思路
    2017年2月27日訊 /生物谷BIOON/ --威爾康奈爾醫學院和紐約基因組中心的一項最新研究在癌細胞內發現了一種新的基因突變類型,或為了解癌症起源提供線索,同時也為開發新的治療方法提供靶點。藉助下一代基因測序技術,科學家們已經知道癌症的根源在於破壞蛋白質序列的突變。突變會導致細胞合成異常活躍或發生功能紊亂的蛋白,也會導致細胞無法合成一些蛋白,最終導致癌症的發生。在最近發表在Cell上的這項研究中,研究人員介紹了一種可能導致癌症發生的新型突變:在基因組的非編碼區域發生微小DNA序列(1到50個鹼基)的插入或缺失,也叫做「indels」。
  • 暗藏的癌症「定時炸彈」——RET基因突變
    此外,其治療RET突變的甲狀腺髓樣癌也獲得了令人振奮的臨床數據。據悉,這款藥物的臨床試驗正由國內的創新藥企基石藥業在中國開展,期待能造福更多國內患者。 罕見的RET基因融合突變,卻是多種癌症的「元兇」 隨著全球基因檢測技術的不斷發展,大家對於疾病的「特性」有了新的認知。
  • 研究發現多個癌症體細胞突變
    研究人員聚集於幾百個乳腺、肺、卵巢、前列腺和胰腺腫瘤中大約1500個編碼基因,發現了近2600個體細胞突變,包括2400多個過去未曾報導過的。正如預料的那樣,突變種類和突變頻率隨腫瘤類型而異,不過多個受影響的基因往往落入腫瘤相關的通路。
  • 融合基因資料庫大全
    在進行融合基因的分析時,我們會想要知道哪些融合基因是別人已經發現並證實過的,對應的疾病等信息,藉助已有的融合基因的資料庫可以實現,常用的資料庫有以下幾個1.
  • 八分之一的癌症患者或有遺傳突變,基因檢測可幫助親人預防癌症
    該實驗根據癌症類型、疾病階段、癌症家族史、種族、民族或年齡選擇患者,並使用大於80個基因的下一代測序平臺進行種系測試。結果發現,每8名癌症患者中就有1名具有與癌症相關的遺傳基因突變。但是,有些人在遺傳上傾向於患某些類型的癌症,例如乳腺癌或結癌。」基因突變可導致基因功能異常並導致細胞癌變。
  • 突變對表達影響預測資料庫
    對於利用TCGA資料庫分析突變和基因表達之間的關係的資料庫。目前之前介紹的類似於GEPIA是實現不了的。同時Cbio一般也是看自己基因和自己基因突變的的關係的。所以今天就介紹一個可以用來分析基因突變和基因表達關係的資料庫:muTarget(http://www.mutarget.com/)
  • 揭秘基因突變與多種癌症發生之間的神秘關聯!
    本文中,小編整理了多篇研究報告,共同解讀基因突變與多種癌症發生之間的關聯,分享給大家!新研究揭示最常見的SF3B1基因突變如何導致癌症doi:10.1038/s41586-019-1646-9在一項新的研究中,來自美國弗雷德哈金森癌症研究中心和紀念斯隆凱特琳癌症中心等研究機構的研究人員確定了SF3B1(splicing factor 3b subunit 1, 剪接因子3b亞基1)基因突變如何促進很多癌症形成,其中SF3B1
  • 治療ARID1A基因突變癌症有新方法
    治療ARID1A基因突變癌症有新方法日本國立癌症研究中心與日本慈惠大學發現了一種針對ARID1A基因突變癌症患者的新型治療方法。ARID1A基因會產生蛋白質,這些蛋白質的作用是促進各種基因表達的SWI/SNF染色質重塑複合物。
  • 科學家開發出RAS基因突變引發的癌症療法
    近日,來自德克薩斯大學MD安德森癌症研究中心的研究人員通過研究開發出了一種新型療法,這種療法能夠有效治療因RAS基因突變誘發的療法耐藥性癌症,RAS基因突變在很多癌症中都存在;研究者表示,這項臨床前研究結合了能夠將靶向作用PARP及MEK(絲裂原活化蛋白激酶)的抑制劑療法。
  • 警惕,這些基因突變,癌症術後易復發
    二、I期肺癌中與總生存期相關的基因突變只要是癌症就一定存在基因突變,所謂的陰性結果,只能說是測序錯誤或基因公司的判讀錯誤。I期肺癌也是有基因突變,這些基因突變對手術之後的預後有影響嗎?研究者分析了大量的數據,發現408個I期非小細胞肺癌患者中有41個突變頻率比較高的基因。這些基因的突變頻率超過了10%。
  • 美國《科學》雜誌發表最新論文: 近2/3的癌症發病是因為基因突變
    近日,國際頂尖學術期刊《science》(中文名《科學》)刊登了一篇來自美國約翰霍普金斯大學Kimmel癌症中心的研究,該研究稱,近三分之二的癌症基因突變可歸咎於健康細胞在分裂過程中發生的DNA(脫氧核糖核酸)複製隨機錯誤,即,所謂的「壞運氣」,而不是遺傳基因或環境因素。
  • Cell Rep:揭示p53突變在癌症中的新模式和新功能
    2019年8月4日訊 /生物谷BIOON /——TP53是研究最廣泛的癌症基因之一,以其抑癌作用而聞名。它能感知細胞的壓力或損傷,並相應地阻止細胞分裂或引發細胞死亡,從而阻止受損細胞的繁殖。該基因的突變消除了一個關鍵的細胞故障安全機制,是導致癌症的一個步驟。
  • Nat Genet:新研究揭示癌症基因突變規律
    2020年10月7日訊/生物谷BIOON/---德克薩斯大學MD安德森癌症中心研究人員的一項新研究發現,癌症中發現的突變並非隨機積累,而是以不同的模式發現。其中基因組的三維結構是導致突變的潛在因素。研究發現,由外部因素(例如紫外線或菸草煙霧)引起的突變以及內部因素(例如DNA損傷修復或校對機制的缺陷)引起的突變實際上位於基因組的不同區域。
  • 32種癌症10225例癌症患者的研究揭示TP53基因的新功能
    Soussi博士在過去30年收集的資料庫中另外80000個突變進行比較。研究團隊在分析了這個龐大的數據樣本庫後,對TP53基因突變如何影響癌症有了更透徹的了解。他們發現,在所有被研究的癌症類型中,TP53突變在存活率較低的患者中更為常見。他們也找到了一種更準確預測預後的方法。Donehower說:「我在突變TP53腫瘤中發現了四個上調基因,其表達與患者預後相關。如果這四個基因高表達,那麼患者更有可能預後不良。