生信分析 內容不夠,多組學數據分析來湊!

2021-01-09 GP生信人

今天小編要和大家分享的是去年12月發表在OncoImmunology(IF:5.869)雜誌上關於免疫聚焦多組學數據分析前列腺癌的文章,更多生信人原創文章見:生信人。

Immune-focused multi-omics analysis of prostate cancer: leukocyte Ig-Like receptors are associated with disease progression

前列腺癌免疫聚焦多組學分析:白細胞 lg樣受體與疾病進展相關

一.研究背景

近年來,免疫檢查點抑制劑的發展使腫瘤免疫治療發生了巨大的變化。免疫檢查點是一系列受體/配體,可以抑制或激活免疫細胞的功能。然而,到目前為止,前列腺癌(PCa)免疫療法對晚期癌症療效仍然是有限的。因此,今天分享的文章整合多組學分析研究了LILR家族基因,特別是LILRB1作為PCa免疫治療靶點的潛力。

二.數據與方法

1.患者及數據集:作者從TCGA下載了498個樣本的NGS RNA-seq,miRNA,甲基化,CNA,SNP數據,及從GDC下載了相關的臨床數據。作者也從GEO下載了106例患者的RNA-Seq及臨床數據。此外,作者也收集了溫哥華前列腺癌中心(VPCC)中85例患者的RNA-Seq及臨床數據作為驗證集。

2.組學數據的處理:

1)RNA-Seq 數據:作者完全分析RNA-Seq數據,以避免數據處理中的變異性。同時使用共同的分析 pipeline確保轉錄組數據集綜合分析的準確性。原始FASTQ文件使用FastQC定量Trimmomatic修飾。

2)miRNA 數據:作者對來自TCGA的level 3 NGS miRNA數據進行標準化,將標準化計數為零或NA的miRNA從miRNA數據集中刪除。

3)甲基化數據:使用level 3的甲基化數據且選擇β值,使用值評估甲基化水平,值表示甲基化和未甲基化等位基因之間的比率強度。

4)CNA數據:作者從TCGA下載level 3 DNA拷貝數數據,並使用Birdsuite進行處理。對數據進行清洗、標準化、分段和對數變換。

5)SNV 數據:作者使用VCFtools處理來自TCGA的level 3 SNV數據。

6)免疫基因集:分析所選擇的免疫基因集由812個基因組成。這組基因來源於與免疫系統相互作用的腫瘤細胞anti-genome 的meta分析。

3.生存分析:作者使用cox風險比模型、K-M分析來進行生存分析。

4.免疫組化分析:作者使用免疫組化分析LILRB1表達。

三.主要內容與結果:BCR相關的特徵

首先,作者為了識別與生化復發(BCR)相關的免疫基因相關特徵,使用R包mixOmics 的sPLS-DA模型分析每種組學數據。最終,作者識別出51個mRNA, 44個miRNA, 36個甲基化位點,32個CNA和6個SNV。從圖1中可以觀察到mRNA, miRNA,及甲基化預測BCR發生的平衡錯誤率(BER)良好, 然而CNA 及SNV沒有很好的預測BCR。接下來,作者將所有這些特徵合併到一個數據集中,並執行一個通用的sPLS-DA分析,結果發現能夠很好的預測BCR(圖2)。

圖1 來自TCGA 的單個組學數據集的sPLS-DA結果

圖2 TCGA 組學數據集的sPLS-DA結果

接下來作者分析識別了mRNA的特徵,發現一些特徵與抗原加工與呈遞有關,這其中包括HLA分子、殺傷細胞免疫球蛋白樣受體、及LILR家族基因。由於LILR免疫調節因子家族,顯示出作為癌症免疫治療靶點的潛力,因此,作者進一步分析了30個LILR基因相關特徵與BCR之間的關聯。如圖3所示,可以觀察到在sPLS-DA分析中,僅30個LILR基因相關特徵就可以預測BCR,表明這個家族的受體在PCa的進展中發揮了作用。

圖3 TCGA 結合組學數據中LILR基因相關特徵的sPLS-DA結果

接下來作者為了進一步驗證LILR基因和BCR的相關性。作者整合171例腫瘤RNA-seq數據集分析使用Multivariate INTegrative (MINT)方法評估LILR基因與BCR的相關性。圖4展示了來自LILR基因家族的5個基因(LILRB1、LILRB2、LILRB3、LILRB5和LILRA3)與BCR相關,證實了LILR基因與BCR之間存在關聯。

圖4 MINT分析結果

這一部分,作者為了進一步刻畫LILR基因和BCR的關聯,作者進行了K-M分析。圖5a可以看到,正如MINT分析所揭示的,LILRB1是一個與BCR密切相關的基因,因為LILRB1 mRNA的高水平與較短的BCR生存相關。此外,也可以觀察到高水平的LILRB2 mRNA也與較短的BCR生存相關,但這種關聯不那麼顯著(圖5b)。LILRB5 mRNA的高水平與較短的BCR生存幾乎顯著相關(圖5d),而LILRB3 mRNA單獨表達與BCR生存無關(圖5c)。生信人進一步研究發現,將這4個基因的mRNA水平加起來,與BCR生存的相關性並不比單獨的LILRB1 mRNA更好(圖5e),說明LILRB1是這種相關性的主要驅動因素。此外,將LILRB1從組合中去除會極大地影響該關聯顯著性,這也支持了LILRB1的重要性。相反,高水平的LILRA3 mRNA與較好的BCR生存顯著相關(圖5e)。

圖5 K-M分析LILR家族基因與BCR生存相關性

接下來,由於TCGA-GSE54460-VPC聯合隊列由高風險腫瘤組成,作者下一步試圖確定這些基因與BCR的相關性是否在中危PCa樣本隊列中保持不變。因此,作者使用由144名男性組成的亞隊列進行了新的Kaplan-Meier分析。圖6(b-d)顯示,高水平的LILRB2、LILRB3和LILRB5 mRNA水平與較短的BCR生存顯著相關。接下來,作者整合LILRB1、LILRB2、LILRB3和LILRB5 mRNA水平發現其總和與BCR相關(圖6e)。

圖6 CPC-GENE RNA-seq 數據中分析LILR家族基因與BCR生存相關性

由於在中等風險隊列中,LILRB1 mRNA水平與BCR之間沒有統計學意義上的顯著關聯,作者推測LILRB1基因的表達可能與grade有關。而Spearman相關分析也顯示,在TCGA-GSE54460-VPCC隊列中,LILRB1 mRNA水平與grade相關,而在聯合隊列中,LILRB2、LILRB3、LILRB5、LILRA3 mRNA水平與grade無關。為了進一步評估LILRB1基因與BCR的關係,作者通過免疫組化方法分析了20例高危前列腺腫瘤中LILRB1蛋白的表達。結果在分散於腫瘤腺體間的免疫細胞中發現了LILRB1蛋白。腫瘤細胞或基質細胞均未表達該蛋白。K-M分析也發現 LILRB1+細胞浸潤腫瘤臨床結局更差(圖7b)。

圖7 BCR生存分析

到這裡這篇文章的主要內容就介紹完了,文章使用PCa數據集進行了多組學分析,結合稀疏偏最小二乘判別分析、生存分析等生物信息方法識別了一系列與BCR密切相關的免疫特徵。並對這些特徵進行進一步分析最終確定一些候選分子靶點,這些分子靶點可以用於PCa的免疫治療幹預,而文章的亮點應該是整合了多組學數據進行分析,小夥伴們可以參考哦。

相關焦點

  • MetaboAnalyst 代謝組學在線分析
    MetaboAnalyst 這個網絡工具自2009年誕生以來,已在代謝組學數據分析這片領域內牢牢紮根。便更好地應對了日益增加的用戶需求,它可用於代謝組學數據分析、注釋、整合其他組學數據。MetaboAnalyst 已遷至Google雲伺服器上。在2007年,約25%代謝組學研究使用過MetaboAnalyst 。
  • 數據不夠?生信分析幫你湊!學會深度挖掘快速發文章
    這個時候需要的是生信分析——深度的數據挖掘和分析處理,可以幫助臨床醫生不耗費大量的時間通過實驗攢數據,而是通過數據處理得到自己想要的信息,更快速地發文章。 學習哪種生信分析的工具?
  • 多組學與藥物敏感分析的資料庫
    為了更好的分享,庫庫不定期推薦優秀的公眾號給大家,敬請期待作圖丫聚焦生信技能,前沿文章,個性繪圖以及生信技能培訓。該資料庫通過對三個大型藥物基因組資料庫(GDSC,CellMiner和CCLE)的綜合分析在4個分子水平上(表達,拷貝數變異,突變和甲基化)來探索藥物敏感性和RNA分子的相關性。目前,RNAactDrug已存儲了4 924 200多個RNA分子和藥物敏感性的關聯,涵蓋了19 770個mRNA,11 119個lncRNA,438個miRNA和4155種藥物。
  • 想學空乘身高不夠?摸高來湊
    很多想學空乘專業的同學,看了身高要求後就選擇了放棄,實在可惜!女生 :162cm~174cm(國際空姐可放寬至158cm)男生:172cm—185cm現在國內航空公司招聘空乘的最低要求是162cm以上,但有些國外航空要求會更低一些。那麼空乘身高要求究竟是為了什麼?怎樣彌補「踩線」身高?
  • 智商不夠,情商來湊~22個提高情商的技巧大全~
    智商不夠,情商來湊1、清楚自己的優勢與短板:清楚地了解自己的優勢和短板,根據自己情況承擔工作,充分發揮自己的優勢,彌補自身不足。。。智商不夠,情商來湊4、平靜面對過去:沒有時間後悔,放下過去,著眼當前,只有這樣才能進步5、做成熟主動的聆聽者:「聽到」和「聆聽」是兩個截然不同的概念,用提問題的形式重複別人說過的話,確保自己沒有遺漏信
  • Cancer Cell|時代新範式-下一代組學分析智慧機器人
    隨著研究界對生命密碼的解析逐漸深入和先進實驗及計算方法的不斷更迭,組學研究從最初以基因組為核心發展出包含轉錄組、蛋白質組、代謝物組、表觀遺傳組、蛋白互作組等多模態相輔相成的豐富內涵。相應地,在科研實踐中,以產出大規模組學資源為目的的大型聯合體項目層出不窮,其貢獻的數據深度與廣度往往是前所未有的。
  • 微生物組學數據分析工具綜述 | 16S+宏基因組+宏病毒組+宏轉錄組
    下面來說說大家關注的宏基因組。宏基因組這部分,生信者言李木子童鞋也曾經給大家做過系統梳理和點評:《精選30餘款宏基因組分析軟體,來自老司機的使用經驗總結(上篇)》、《精選30餘款宏基因組分析軟體,來自老司機的使用經驗總結(中篇)》、《精選30餘款宏基因組分析軟體,來自老司機的使用經驗總結(下篇)》、《句句乾貨!一文讀懂宏基因組binning》。
  • 音樂陷阱還是顏值不夠音樂來湊?
    他們找來異性戀男女一共96位,其中男32女64,不是因為男同性戀太多,而是女的要分兩組,正處於排卵期和和處於非排卵期的。這些人在音樂方面的素養一致,另外還有對照組。真是閒得蛋疼了,關卵子什麼事?因為想看看有沒有生育因素的影響,沒準排卵期來了就急火火要找個男的,管什麼音樂不音樂的。實驗的具體辦法就是先看異性照片,然後聽不同的音樂,再看照片。
  • 2019微生物組—宏基因組分析專題培訓第三期
    關於學習生物信息學分析的重要性,請閱讀《生物信息9天速成班—成為團隊中不可或缺的人》。生信分析離不開程序寫作,這部分沒想像的難,只要跟著我們操作下來,就可以理解,具體見生物信息中的程序學習心得。課程簡介請詳細閱讀課程簡介,如果以下內容您全精通,不必參加此培訓。
  • 美吉I-Sanger生信雲樹立科研服務雲平臺金標準
    雲技術革命正迅速改變科研領域的生產方式和服務模式,以美吉生物I-Sanger為代表的生信雲平臺,經過不懈探索努力和自身數萬科研用戶服務實踐,提出生信雲平臺應具備的社會責任,以去中心化的設計理念,通過強大、快捷的交互功能,免費為客戶提供無限次的數據分析和增值服務體驗,致力於「讓人人都成為生信專家」的願景目標,率先提出生信雲服務標準,以供業界探討。
  • 柯南:證據不夠?物理來湊!非牛頓流體了解一下!
    柯南:證據不夠?物理來湊~非牛頓流體了解一下!柯南出到現在已經有21年了,這麼多年中大家都知道柯南是一個高智商的偽小學生,同時還身負著死神體質~集集都有人死亡,而且殺人的手法還都不一樣,不過出到現在已經700多集了,這麼多年什麼手法都被寫沒了那怎麼辦呢?
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    猜你還想看◆生信分析:你可以更美一些:SnapGene Viewer軟體序列可視化操作◆生信分析:這個R包不太冷系列——GOplot(功能富集繪圖)◆生信分析:10行代碼讓你的相關性圖貌美如花◆生信分析:對話百年名畫--文章繪圖配色高級又簡單!
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    隨著生物科技的迅速發展,每天都會有海量的生物學數據產生,如何有效的分析這些「生物學大數據」?生物信息學的應用變得尤為重要,在生物領域從基因測序,到基因編輯,再到基因療法的精準醫療,由生物科技引發的又一場變革正悄然而至。試問大家做好準備迎接它到來了嗎?本次分享的主題為:如何快速獲取海量數據?
  • 這幾本生信入門書籍你不能不知,附下載連結
    基因組學相關的書籍:                                                                   基因組學概論這本書比較全面系統的介紹了  DNA、蛋白質序列和結構、基因組、蛋白質組、轉錄組和系統生物學內容,也分別對原核生物
  • 蛋白質組學數據分析——(1)原理
    這一篇來自博客園博主的分析,作者:小xuo生一、蛋白質組學概述蛋白質組學是特定系統內蛋白質集合及其相互作用的研究。
  • Cell上的經典蛋白組學、磷酸化蛋白組學、WES多組學聯合分析文獻
    今天小鹿為大家整理了近期發表在Cell上的一篇極為經典的蛋白組學、磷酸化蛋白組學、WES相關的多組學聯合分析文獻,希望能助您打開思路,找到新的挖掘點。然而,目前對LUAD的蛋白質組學特性知之甚少。研究者對103例中國LUAD患者進行了全面的蛋白質組學分析。
  • 「身高不夠,顏值來湊」的4位男星,鹿晗不是最矮的!
    「身高不夠,顏值來湊」的4位男星,鹿晗不是最矮的!第一位:霍建華,逆天的睫毛,在加上高顏值,的確是帥哥一枚了,但是身高卻差強人意,百度身高177,但是似乎並沒有這麼高!第二位:鹿晗,想必大家都知道,小鮮肉一枚,顏值逆天,不過百度身高178,可是很多網友覺得似乎沒有178哦,果然是身高不夠,顏值來湊,網友光看臉了,應該不在注重身高了吧,但是鹿晗不是最矮的。第三位:郭富城,郭富城的顏值很高,五官現在依舊很帥氣,但是很難想像到我們郭天王的身高只有167,不過雖然身高矮,但是顏值高就可以了啊!「身高不夠,顏值來湊」的4位男星,鹿晗不是最矮的!
  • 蛋白質組學研究,這篇夠經典!
    在正文開始之前,推薦蛋白質組學的一本書和一篇綜述,書是冷泉港蛋白質組學實驗手冊,適合完全不懂零基礎的開始學,綜述是chemical review(影響因子有40多,化學類第一高)上的Protein Analysis by Shotgun/Bottom-up Proteomics,適合有一定基礎的看。
  • 人類基因組時代的泛基因組學
    薩爾茲伯格是一位橫跨計算機領域和生物學領域的專家,名氣很大,他是約翰霍普金斯大學計算生物學中心的主任,同時在計算機系和醫學院任職,專門從事基因測序和基因組學應用研究,人類基因組計劃的參與者之一,最近還主持了非洲裔美國人的基因組學項目等。開發過很多有名的生物信息算法,大家使用過的生信軟體如:bowtie、TopHat、cufflinks等都出自於他的實驗室,今天要談的泛基因組學也是他的研究內容之一。
  • CNS 一作大神:這個生信分析方法帶你不做實驗快速發論文!
    近期看到一篇發在《Experimental Eye Research》影響因子 3.152 的文章 ,從投稿到接收並發表共 2 個多月。 這是一篇完全基於生物信息學分析的文章,文章的思路:分析 TCGA 資料庫中的數據——利用 R 語言的 WGCNA 包——結合在線工具——發表文章。