大家好,我是阿琛。「挑圈聯靠」,首先便是挑出表達差異。與酸菜老師在基礎科研的教學一致,要麼篩,要麼猜。通過TCGA資料庫,或Oncomine資料庫,分析獲得感興趣的一個基因或者基因群。此時,所有的分析數據主要基於轉錄水平的評估;然而,對於研究分子的差異表達,最好是能通過蛋白水平的驗證。
對有條件的課題組而言,搜集組織標本,基於免疫組化技術和western blot技術來檢測該蛋白在組織中的表達水平,無疑是最好的辦法。但在生信研究中,受限於實驗條件以及標本來源等因素的影響,這就需要我們的一位好朋友登場了---人類蛋白組圖譜資料庫,即HPA資料庫。
引子
2003年,瑞典科學家以及Knut & Alice Wallenberg發起了一項基於蛋白質研究的大規模項目,稱為人類蛋白質圖譜(Human Protein Atlas)。Human Protein Atlas資料庫(https://www.proteinatlas.org/),即HPA資料庫,是一個免費的包含超過26000種抗體,靶向來自17000多種人類基因的公共資料庫。
經過一次次的更新與維護,HPA資料庫包含的內容也逐漸完善。2019年,資料庫新增了三項內容;目前,HPA資料庫更新於2020年3月6日,為v19.3版本,涉及組織圖譜,細胞圖譜,病理圖譜,腦圖譜,血液圖譜,和代謝圖譜六大板塊。下面,以TP53基因為例,阿琛帶大家一起從組織,細胞等多個層面來領略HPA資料庫的構成與使用。
1.輸入在搜索框內輸入目標(如TP53)
點擊Search,即可得到該基因的相關信息,包括基因的描述(Gene description),證據評分(Evidence),以及該基因在各個圖譜中的結果。接下來,我們分別來查看與講解每個板塊中所包含的信息。
2.點擊Tissue,進入組織圖譜(Tissue Atlas)
進入該板塊後,首先便是TP53基因的基本信息介紹,包括名稱,蛋白分類,蛋白的定位等信息。隨後,資料庫展示了TP53在人體各組織的表達情況,分為RNA表達水平和蛋白表達水平,其中RNA的表達更是整理了多個數據集的內容,稍作整理,便可用於文章中。
而關於TP53基因在具體某一組織中的表達情況,點擊右側相應的器官即可進入。比如,查看TP53基因在oral mucosa(口腔黏膜)中的表達情況,結果提供了抗體的種類,染色程度以及免疫組化結果,點擊不同的組織即可顯示對應患者的基本信息。這樣,基因在正常組織中的表達情況就準備好了。
3.點擊Pathology,進入病理圖譜(Pathology Atlas)
「表達差異」,顧名思義,自然需要正常組織和腫瘤組織兩者的對比。在病理圖譜中,我們可以查看TP53基因在不同腫瘤中的表達情況。與組織圖譜的結果展示方法類似,該模塊同樣包含了RNA表達水平和蛋白水平。
在RNA水平上,HPA資料庫主要整理了基因在TCGA資料庫中各個腫瘤的RNA表達,並提供了可視化分析結果,通過散點圖和生存曲線,可以十分直觀的觀察基因在不同腫瘤中的表達及其對預後的影響。
TP53基因對子宮內膜癌(endometrial cancer)和前列腺癌(Prostate cancer)預後的影響;其中,藍色為低表達,紫色為高表達
▲ TP53基因在不同腫瘤組織中的RNA表達水平
隨後,便是通過免疫組化技術對基因在不同腫瘤組織中的蛋白表達檢測。
點擊相應的腫瘤,可以得到該基因在腫瘤組織中的檢測結果,其包括免疫組化圖片,病人的基本信息,以及在不同細胞中的染色強度統計結果。當然,這一結果也可以作為基礎研究中的陽性對照結果。
▲ TP53基因在結腸癌患者組織的免疫組化結果
4.點擊Cell,進入細胞圖譜(Cell Atlas)
從組織到細胞,整個生信文章的謀篇布局,同樣可以借鑑基礎研究的邏輯思路。除了基因定位的細胞模式圖外,HPA資料庫為我們準備了精美的細胞免疫螢光結果。值得一提的是,該結果可以根據作者自己的需要,進行組合,包括Antibody(抗體),Nucleus(細胞核),Intensity(強度),Microtubules(微管蛋白),ER(內質網),和Objects(對象)。既可單獨顯示,又可疊加顯示。對於每一塊所代表的區域,大家隨後可以自行調試玩耍。
此外,HPA資料庫中還提供了基因siRNA的RNA驗證和細胞螢光結果,可謂是相當的貼心了。將組織和細胞結果一組合,必然能給文章增加不少的色彩,也在一定的程度上彌補了生信文章缺少實驗驗證的遺憾。
▲ TP53基因經siRNA幹擾後,RNA檢測和免疫螢光結果
5.腦圖譜(Brain Atlas),血液圖譜(Blood Atlas),以及代謝圖譜(Metabolic Atlas)
隨著人類社會的進步,神經退行性疾病,血液系統,以及代謝疾病越來越受到科學家們的重視。2019年,基於前期的多項研究,三大圖譜全新上線。雖然目前仍處於不斷的更新與完善狀態,但其中所包含的內容同樣給我們提供了許多可供參考的結果與精美圖片。接下來,我們一起看一下這三塊新增的圖譜。
5.1 腦圖譜
腦圖譜通過整合人類、豬和小鼠三種不同的哺乳動物物種,展示了不同蛋白在哺乳動物腦內的RNA表達情況,以及蛋白的亞細胞定位。比如NECAB1,是一種鈣結合蛋白,結果展示了蛋白在不同腦區的RNA表達水平,免疫組化結果,以及全腦的免疫螢光切片。
▲ NECAB1基因在3種不同哺乳動物腦區的RNA表達水平
▲NECAB1基因在人和小鼠腦內的免疫組化及亞細胞定位結果
▲ 全腦切片的免疫螢光結果
5.2 血液圖譜
隨著腫瘤免疫治療的興起,人們開始越來越關注血液系統內免疫細胞變化對腫瘤免疫微環境的影響情況。同時,血液圖譜的搭建,對血液系統疾病的研究與發展是一個巨大的幫助與進步。
從造血幹細胞(Hematopoietic Stem Cell),逐步成熟分化,甚至各種免疫反應,任何環節的改變都將引起機體的變化。在該板塊中,結果總結歸納了18種血細胞和外周血單個核細胞(PBMC)中不同基因的RNA表達信息。
5.3 代謝圖譜
從微觀的轉錄、翻譯、修飾,到宏觀的各種能量轉換,都離不開機體的各種代謝途徑。一條條代謝通路,就如集成電路一般,複雜而又有條不紊的運行著,既各自獨立,又相互溝通。
在此,HPA資料庫展示了各種代謝途徑中基因的表達情況以及代謝通路調節機製圖譜。對於研究腫瘤代謝的小夥伴將是一個很大的便利。比如,查詢HAL基因,即可獲得該通路中相關基因在不同組織中的表達熱圖。
由於後三大圖譜的存在時間尚短,其內容的豐富程度遠不及前三個內容。不過,隨著研究的進展,一個個內容都將被補充完善。今天的分享就到此結束了,大家可以進一步的去探索HPA資料庫這個大寶藏,不斷挖掘其中的豐富內容~~~
10天領悟3分SCI套路
點擊下方
免費參加
—END—