前些時間,我們介紹了幾款生物信息學的資料庫,包括Uniprot、Reactome、Ensembl以及Gwas Central。應廣大讀者的要求,今天就著重介紹一下Uniprot。Uniprot是一個免費、老牌的生物信息學資料庫,很多文章都使用了Uniprot中的數據。如在2018年11月,在發表自《Nature》的文章「Single-cell reconstruction of the early maternal–fetal interface in humans」中,作者為了研究了胎盤-蛻膜界面處的胎兒細胞和母體細胞之間的「交流」,並利用所得數據開發了一種新型統計工具(CellPhone, www.CellPhoneDB.org),用以預測潛在的特殊的細胞間互作用。在CellPhone中,其中一部分的蛋白質註解信息就來自Uniprot。那麼,我們今天就來看一下怎樣通過Uniprot來獲取我們需要的各種信息吧。
我們仍然使用PD-1蛋白作為例子,講述Uniprot中怎樣獲取該蛋白的注釋信息。打開www.uniprot.org,在UniprotKB界面中的檢索框中輸入「programmed cell death protein 1」,並點擊「Search」,獲得結果列表。
圖1
在列表中我們可以看到對於PD-1來說,Uniprot收錄了人類和鼠類PD-1的蛋白信息。選擇輸入人類的條目,點擊圖2紅框中的「Q15116」來查閱詳情。
圖2
點擊「Q15116」後,我們進入到結果的主界面。整個界面中包括了非常多的信息,主要模塊有四個:Entry、Publications、Feature viewers以及Feature table。
Entry:Uniport介紹蛋白信息的最主要頁面,包括了14種關於該蛋白的注釋信息類型。
Publications:Uniprot提供了與該蛋白相關的發表物的信息。
作為初學者我們可以從Entry入手。在蛋白注釋信息界面中的左側展示導航欄,我們可以看到該信息又被分成14種亞信息類。讀者可以從圖3的表格中查看相應亞信息類的解釋和描述。此外,我們還可以使用選擇按鈕(圖3紅框所示)來選擇那些類型的信息出現在結果頁面中。
圖3
基於PD-1蛋白的這個例子,我們來看一下這些亞種信息到底能給我們帶來什麼?
Function
在Function中,結果呈現了與PD-1相關的一些基本生物學的知識信息(圖4-1),包括轉錄調節機制、涉及的生物過程、相關的組學信息等等。這些信息來自不同的出版物或者其他的資料庫(圖4-2)。Uniprot提供了信息來源的題目及連結,點擊任何一個黃色標籤,可以呈現出該引用源的相關條目。讀者點擊這些條目的連結後,可以跳轉至相應的其他資料庫進行查詢,非常的方便。尤其是在涉及生物過程的信息展示時,Uniprot做了與另外EMBL的連結(圖4-3),這對了解蛋白質在生物體內發揮哪些作用非常有用。
圖4
Names & Taxonomy
在此欄中,我們可以看到。Uniprot對PD-1蛋白的推薦名稱為 「Programmed cell death protein 1」 ,以及一些簡寫模式比如Protein PD-1以及hPD-1,或者替代名稱CD279等。相關的基因名稱PDCD1、種屬名稱Homo sapiens (human)及種屬在NCBI的分類識別編號及分類譜系信息。另外在此欄中,Uniprot還提供了該蛋白或者蛋白相關的基因在HGNC(Human Gene Nomenclature Database)、MIM(Online Mendelian Inheritance in Man)和neXtProt(the human protein knowledge platform) 三個資料庫的連結,方便讀者進行相關基因信息的查詢 (圖5-1)。
圖5
Subcellular Location
Uniprot中提供的PD-1蛋白的位置在細胞的表面,並給出了細胞示意圖(圖6)。圖6-1中顯示的黃色標識為人工註解部分。如果圖中有藍色顯示,則表示為機器計算註解。此外,Uniprot還提供了PD-1蛋白拓撲結構的區域信息。在拓撲表(圖6-2)中可以看到:24-170位的胺基酸序列位於細胞外,171-191位的胺基酸序列成跨膜的螺旋結構,192-288位胺基酸位於細胞質中。
圖6
Pathology & Biotech
與蛋白相關的疾病模塊中,我們可以發現:有一篇文獻表明PD-1蛋白與紅斑狼瘡疾病有關(圖7-1)。此外Uniprot還提供了存在的突變位點和已知的突變後果。例如:在PD-1中的第49位存在著天冬醯胺突變成丙氨酸的可能,但這種突變並不影響PD-1與O藥(Nivolumab)的結合(圖7-2)。此外,在此模塊Uniprot還提供了其他資料庫的連結。如:提供了PD-1蛋白在ChEMBL中信息的連結以及其他化合物,如:O藥(Nivolumab)在DrugBank中的信息連結(圖7-3)。
圖7
PTM/Processing
在轉義修飾模塊中,我們可以看到PD-1蛋白中的1-23位胺基酸是PD-1的信號肽(圖8-1)。此外在胺基酸修飾功能上,49位、58位、74位以及116位的胺基酸是糖基化的位點;54位與123位通過二硫鍵相連;223位和248位亦是可修飾位點等等(圖8-2)。一些轉義後的修飾信息也可以在這裡查到,如233位賴氨酸通過進行FBX038泛化後,可以引起PD-1通過其蛋白酶進行降解,並給出了信息出自的文獻(圖8-3)。
圖8
Expression
Uniport在此提供了PD-1蛋白質相關基因在細胞或者組織中mRNA水平上的表達信息。如根據Bgee資料庫的信息。PD-1蛋白的相關基因(Ensembl ID為ENSG00000188389)在78個器官或組織中有所表達,其中在淋巴結中表達水平最高(圖9-1)。點擊圖中的連結可以查看在不同組織中的表達信息。又如在圖9-2中,我們可以看到該基因在不同人群中的表達差異情況,該數據來自資料庫ExpressionAltas。
圖9
結 語
本文通過PD-1蛋白的實例著重講解了Uniprot在Entry信息模塊中所能提供的Funtion 、Names&Taxonomy、Subcellular location、Pathology&Biotech、PTM/Processing和Expression亞信息模塊中的信息。由於篇幅有限,Entry中剩下的亞信息模塊將在Uniprot,一個熟悉又陌生的資料庫|使用Uniport獲取相關蛋白注釋信息(二)中講解,敬請期待。
以上信息僅作為方法介紹,信息探索可到資料庫中獲取更多,點擊閱讀原文可直達Uniprot資料庫。
CTR檢索知多少 | 中國研究中心都在研究什麼?
想不用實驗就發文章?--你需要知道的幾個生物信息資料庫
全面、免費、權威的臨床信息,你竟然不知道?
特瑞普利單抗(商品名:拓益,英文名:Toripalimab Injection)是君實生物自主研發的抗PD-1單抗,於2018年12月17日獲批上市,用於治療既往接受全身系統治療失敗的不可切除或轉移性黑色素瘤。
目前,特瑞普利單抗在黑色素瘤、鼻咽癌、尿路上皮癌、三陰乳腺癌、非小細胞肺癌、肝癌、腎細胞癌、食管鱗癌、頭頸部鱗癌、淋巴瘤、神經內分泌瘤等多種疾病領域仍有多項註冊臨床研究在積極開展中。
審批編號:JSSW20190701110
有效期至:2021年6月30日
內容聲明:君實醫學訂閱號平臺所發布信息僅供醫療專業人士閱讀參考。