在我們研究生物學問題的時候,單一的組學通常是無法解釋完整,因此常常會進行多組學的關聯分析,除了比較常見的轉錄組+小RNA或轉錄組+代謝組的關聯,還有轉錄組+蛋白組這種很常見的關聯分析。
轉錄組和蛋白組測序技術可以分別從RNA和蛋白質兩個水平對樣本中的基因轉錄本以及翻譯的蛋白質進行定性定量研究。轉錄組的結果體現了樣本中基因的表達情況,而蛋白質組的分析結果表現了基因表達後翻譯的情況。
通過兩者的關聯貫穿分析,可以找到與研究性狀相關的關鍵基因,減少候選基因數目,使得研究更加便捷。但是,從整體上分析蛋白組與轉錄組兩組數據的相關性,發現相關性比較低,畢竟從mRNA翻譯成蛋白的過程中會受到非常多的調控,那麼在這樣的情況下,我們該怎麼辦呢?
文章通常會用四象限圖(如下圖)進行關聯[1],直觀地展示基因與蛋白的變化情況。
例圖1. 蛋白組和轉錄組相關性低
橫坐標是蛋白差異倍數(取了log2),縱坐標是轉錄組的差異倍數(同樣取了log2),每個點代表一個基因/蛋白,黑色的點表示非差異的蛋白和基因,藍色的點表示蛋白差異表達但基因非差異表達,綠色的點表示基因差異表達但蛋白非差異表達,紅色的點表示既是差異基因又是差異蛋白。
然而四象限圖雖然能將基因和蛋白的變化展示出來,但是從圖上看他們之間的關係較為散亂,一時之間難以下手,縮小範圍,那麼在這樣的情況下,該怎麼辦呢?
基於該情況,九象限圖可以將分類更為精確,在原有的四象限圖基礎上進行升級。升級後的九象限圖將基因和蛋白的變化進一步細化。
通過橫縱坐標的虛線將圖劃分了9個象限,橫坐標上的虛線表示轉錄組的差異倍數閾值,縱坐標上的虛線表示的蛋白組的差異倍數閾值,閾值線外表示顯著差異的基因/蛋白,閾值線內則表示非顯著差異的基因/蛋白。
例圖2.九象限圖結果展示
每個象限的含義可以參考下表中的解釋。
表1 九象限圖解讀
看了這麼多介紹,大家是不是對九象限圖蠢蠢欲動了呢~Omicshare雲平臺新推出了九象限圖工具——你有需求,而我剛好專業,希望能滿足廣大研究者做轉錄組和蛋白組關聯分析的需求。下面我們就介紹一下這款工具如何操作。
登錄Omicshare雲平臺www.omicshare.com/tools,在「所有軟體」中找到九象限圖分析
圖1. 九象限圖工具位置展示
點擊圖標進去之後,會跳轉到操作界面。界面包括「數據輸入」以及「作圖參數」兩部分。分析需要同時輸入以下數據:轉錄組表達量總表、蛋白組表達量總表、以及ID轉換文件。
九象限圖的關鍵,就是基因/蛋白ID和差異倍數,因此轉錄組表達量總表與蛋白組表達量總表是必須輸入的文件,輸入基因/蛋白ID和差異倍數的文件,可添加注釋等信息。
一定要將差異倍數在表格的第幾列標明出來(必須),以轉錄組示例為例,差異倍數在表格的第6列,在下一列填入數字6就可以了。
而如果基因和蛋白的ID不對應,可以添加ID的對應文件,用於將基因和蛋白對應起來。這三種數據的格式可以通過點擊「示例」查看。
圖2.轉錄組示例文件,基因ID和差異倍數一定要有哦
圖3. 數據輸入界面展示,標*的地方是一定要填的哦
為了方便對圖形進行修改,我們提供以下作圖參數,每個參數的說明如下:
轉錄組/蛋白組差異倍數閾值: 默認轉錄組是上、下調2倍,蛋白組是上、下調1.2倍,可以對差異倍數進行調整。
tip:關於轉錄組和蛋白組的差異閾值,這個其實只是目前發文章的一般標準,並不代表所有的項目都必須按照這個標準,在特定的情況下,可以根據自己的實驗情況來進行調整。只要能篩選到基因/蛋白,並對其進行討論和驗證,給出篩選標準的合理解釋,在發文章時就不會有太大問題。
各象限顏色(順序1-9象限):每個象限顏色選擇默認,若選擇自行輸入,則每個象限的顏色可自由更改。
tip:在文章的討論部分,大家可能會針對某個或幾個象限來重點討論,那麼這個時候,將其他象限的顏色都調成黑色,將目標象限標註出來,也不失為一種好方法。
x、y軸標題: 可自行定義x、y軸名稱。不要出現中文或者特殊字符(如括號等)
字體放縮倍數:字體默認固定大小,字體縮放建議在1-2倍之間。
圖4. 作圖參數界面
基於示例文件進行分析,可輸出以下結果,包括10個表格以及1個圖形:
圖5 結果展示
1) A-VS-B.annot.all.xls: 九象限總表,記錄了所有基因/蛋白所在的象限信息,在轉錄組和蛋白組的表達量,功能注釋。
圖6 九象限總表,記錄了有基因/蛋白所在的象限信息
2) A-VS-B_1(2、3、4…).annot.xls:各象限分表(9個),記錄了各自象限的基因/蛋白信息,在轉錄組和蛋白組的表達量,功能注釋,表格內容和總表類似,少一列象限信息。
3) A-VS-B.associate.png/pdf:九象限結果圖。九象限圖共分為9個象限,縱坐標代表轉錄組基因差異倍數的log2值,橫坐標代表蛋白表達差異倍數的log2值。基因表達上下調2倍的基因為顯著差異基因(log2=1或-1),蛋白表達上下調1.2倍的蛋白為顯著差異蛋白(log2= 0.263,或- 0.263)。
圖7 九象限圖
Tip:經常有老師問,非模式生物的蛋白組,沒有抗體,無法用ELISA 或者WESTERNBLOT來做差異蛋白的驗證,該怎麼辦?能不能挑選基因做QPCR來驗證?
通常我們會建議老師挑選基因和蛋白表達模式一致的基因來進行驗證,如果只通過兩張表達量總表來篩選,會非常的耗費時間精力,一不小心就眼花繚亂了,那麼這時候通過九象限圖,就可以很快的幫助我們找到這類基因了,是不是省力了很多呢。
讓我們一起期待omicshare的下一個工具吧。
(九象限圖工具上線第一周免費使用,還沒用過的趕緊去試試,之後就要收費啦,2個奧幣一次)
[1] Chen, J.; Liu, S.S.; Kohler, A.; Yan, B.; Luo, H.M.; Chen, X.M.; Guo,S.X. iTRAQ and RNA-Seq analyses provide new insights into regulation mechanismof symbiotic germination of Dendrobiumofficinale seeds (Orchidaceae). J. Proteome Res, 2017, 16, 2174–2187.
今天的內容就到這裡啦~