當你研究一個基因或蛋白時,研究到功能和應用階段,你需要知道這個基因在癌症中是否存在突變,這個時候該怎麼查?
今天給大家安利一個超強的資料庫:COSMIC。
Cosmic [ˈkɑ:zmɪk] 本意為"宇宙的;極廣闊的",然而這裡為 Catalogue Of Somatic Mutations In Cancer 的縮寫,即「腫瘤中體細胞突變的目錄」。
該資料庫主要由英國威康信託基金會桑格研究所(Wellcome Trust Sanger Institute)開發和運作,2004 年發布第一個版本,2017 年 2 月 13 日發布了最新的第 80 個版本(v80),以後每 3 個月更新一次。這個資料庫有專門的團隊維護,不可以自己上傳數據,如果你希望上傳,可以聯繫他們的團隊。
網站對 2016 年 9 月的第 78 版(v78)的數據量統計如下:
這是目前最大最全的關於腫瘤中基因突變的資料庫!
下面簡要介紹一下 COSMIC 的用法和亮點:
COSMIC 菜單欄,核心包括 Resources、Curation(精選)、Tools、Data四個部分
▲ COSMIC 的整體頁面,其中上面提到的最核心的 4 個板塊也被單獨列出來
1. Home
Home 裡面包含有 Cell Lines Project 和 COSMIC,其中 Cell Lines Project 是對最常使用的 1000 多種腫瘤細胞系的深入分析的數據,而標準的 COSMIC 版本中,包含的數據更多,但是分析沒有 Cell Lines Project 深入,可以理解為網站的兩種模式。
在標準的 COSMIC 模式下,網站的主色調是藍色的,而一旦選擇 Cell Lines Project,網站主色調變為綠色。以下我們在標準的 COSMIC 模式下講解。
▲ 1000 多種最常用的腫瘤細胞系清單
2. Resources
Resources 裡面包括 Cell Lines Project 、COSMIC、Cancer Gene Census、Drug Sensitivity、Mutational Signatures、GRCh37 Archive,其中 Cell Lines Project 、COSMIC 跟 Home 中的完全一樣,最後的 GRCh37 Archive 指的是以此前版本的人類基因組數據為參考,因此這裡重點介紹 Cancer Gene Census、Drug Sensitivity、Mutational Signatures。
2.1 Cancer Gene Census(癌基因統計)
2.1.1 Census
這裡又分為三個子菜單 Census、Breakdown(統計分析)、Abbreviations,其中 Census 菜單,顯示目前所有的癌基因,而且這個數據表可以搜索,導出(需要先註冊)。
注意:搜索的時候,只能在當前的頁面搜索,比如我在第一頁搜索 DNMT3A,顯示是沒有匹配的,但翻到第二頁,再次搜索就有了。
▲ 導出的格式有CSV和TSV,據導出的表格顯示,目前一共有 616 個癌基因。
以 DNMT3A 為例,點擊基因名,可以進入詳細的頁面:
▲ 最右邊的灰色條可上下拉動,以控制頁面中峰的顯示幅度。滑鼠落在一個突位點上,顯示該突變點的位置以及突變數。
▲ 根據結構信息,分析該突變位點是否落在具有功能的結構域。
其他的功能,比如 Tissue、Distribution、Drug Resistance、Variant 等也非常重要,這裡不逐一介紹。
2.1.2 Breakdown(統計分析)
▲ 這裡是對所有癌細胞中的突變進行了整理
2.1.3 Abbreviations:對表格中的縮寫進行解釋。
2.2 Drug Sensitivity
▲ 鑑定腫瘤的分子特徵,預測抗腫瘤藥物的響應
(Identifying molecular features of cancers that predict response to anti-cancer drugs.)
這裡主要包括 Compound、Cancer Feature、Cell Line 三種數據。
▲ 一共有265個小分子化合物,可以靶向不同的癌基因和信號通路
Cancer Feature 和 Cell line 的內容小夥伴可以自己去探索哦~
2.3 Mutational Signatures(突變特徵)
導致體細胞突變的原因很多,比如 DNA 複製的失真、暴露到內源性或外源性的誘變源、 DNA 酶修飾、DNA修 復的缺陷。不同的突變過程會產生不同的突變組合,這裡定義為「突變特徵」。
▲ 一共歸納了 30 種「突變特徵」
3. Curation(精選)
這裡又細分為 Cancer Gene Census、Genes、Gene Fusions、Genome Screen、Drug Resistance,其中 Cancer Gene Census 與前面介紹的完全一樣,不再贅述。
這裡的 Genes 與上面的 Cancer Gene Census 有一定差別,其中 Genes 是 Cancer Gene Census 中篩選出來的,此前沒有現成的資料庫的。(From this list we are selecting genes for COSMIC expert curation with an emphasis on genes for which there are no existing databases.)
▲ 這裡的 Genes 一共有 192 個,遠比 Cancer Gene Census 中的 616 個基因少
Gene Fusions、Genome Screen、Drug Resistance 也留給小夥伴們去探索。
4. Tools
Tools 中主要包括 Cancer Browser、Genome Browser、CONAN、Beacon,前兩者很容易理解,CONAN 是指拷貝數分析(Copy Number Analysis)
▲ 這裡需要輸入基因名稱或基因區間
Beacon,這裡理解為「界標」,即根據在基因組中的位置來查找突變
▲ Beacon 的操作界面
Highlight
在首頁的 Tools 工具欄中,新增了 COSMIC-3D,這個功能非常酷炫!
以 Kras 為例,輸入後按 enter 鍵,得到以下界面:
▲ 這個功能超級好玩!可以放大,縮小,旋轉,截圖……
▲ 繼續往下拉,可以看到各種錯義突變的位置,炫酷的是,右上角的蛋白結構還在轉個不停。
……
以上只是 COSMIC 的冰山一角
小編拋磚引玉而已
更多有意思的,有用的功能
還有待小夥伴們自己挖掘!