很多老師會有這樣的疑問,高通量測序後得到的結果太多,哪個基因是關鍵的?比如做完ATAC-Seq後,染色質開放性發生變化的基因很多;做完ChIP-Seq後,組蛋白修飾/轉錄因子影響的基因很多;做完MeRIP-Seq後,m6A修飾有差異的基因也很多。雖然可以通過一些方式縮小範圍,比如調整分析參數,或者RNA-seq進行聯合分析,但還是可能會得到很長的基因列表,究竟哪個基因值得進一步研究呢?這時候可以從基因的信息著手,通過基因的定位、功能、參與的通路等信息判斷是否關鍵基因。今天給大家介紹可以查看基因信息的資料庫-Genecards。
Genecards(https://www.genecards.org/)是一個人類基因的綜合型資料庫,匯總了網絡上約150個相關的基因資料庫資源(包括基因組,轉錄組學,蛋白質組學,遺傳學,臨床和功能信息等)。該資料庫可提供人類目前已注釋的、可預測的所有基因的詳細信息(如基因與表型間的聯繫、基因互作、信號通路、基因的臨床意義等),是我們開展人類基因研究的重要工具。下面以TP53基因為例講講具體的使用方法。資料庫的使用很簡單,就是輸入我們想要檢索的基因即可。Genecards 有三種檢索模式:1)直接基因檢索模式;2)信息類型檢索模式;3)高級檢索模式。在Summaries 這個模塊中,Genecards匯總了多個資料庫(如 NCBI 、CIViC, UniProtKB等),對我們要查看基因功能的總結描述,可以讓我們更方便更快速的了解這個基因,點擊箭頭可進入對應的資料庫進行查看。
在基因組這個模塊中,我們可以看到目標基因在基因組當中的位置及長度。
另外,由於基因組對於基因表達的調控,主要是通過轉錄調控來實現的,所以資料庫總結了很多轉錄調控的信息。我們在這裡可以查詢到這個基因可能受到哪些轉錄因子的調控,包括轉錄因子結合位點、啟動子和增強子等調控元件的信息,基因序列結構,基因定位圖等一系列信息。一個基因的功能經常是由他們的定位決定的,基因在細胞核和細胞質行使的功能是不一樣的。在Location中,我們可以觀察基因的定位。如圖為TP53的基因定位。
在Expression模塊中可以觀察基因在不同組織中的表達情況。如圖為TP53在各個組織當中的表達情況。
這部分主要是介紹基因相關的mRNA和cDNA的相關信息。除了傳統的RNA,這裡還提供流式細胞術產品信息,基因編輯產品信息,克隆產品等等。
這個模塊中,該網站收錄了基因的很多功能信息,如基因GO分析的功能、基因的臨床疾病表型信息、動物模型,miRNA產物信息、InhibRNA產物信息等。如圖為TP53的功能介紹和Go分析。
這部分主要是介紹基因相關的信號通路及分子相互作用信息,大家常用的通路資料庫,如KEGG、Sino、GeneTex、GeneGo都整理在這了。如圖為P53涉及的信號通路。其中:R的為Reactome的通路信息,G為KEGG的信息。
在Disorders這個模塊下,匯總了這個基因和哪些疾病是有關係的,這裡的數據主要來自於malacards。藥物在體內發揮作用也是需要通過基因的變化來產生的,所以我們可以通過這個模塊了解有哪些藥物影響這個基因的表達。資料庫總結了DrugBank,ClinicalTrials,ApexBio,DGIdb和Novoseek五個資料庫的結果,我們可以很容易的看到這個基因和哪些藥物有關係以及可能的激活機制。