大家好!今天小編分享一篇2020年12月發表在《Computational and Structural Biotechnology Journal》(IF=6.018,中科院二區期刊)上的一篇文章,題為「Transcriptomicsignatures and repurposing drugs for COVID-19 patients: findings ofbioinformatics analyses」。作者基於GEO資料庫,採用轉錄組分析系統地解析了SARS-CoV-2對人肺組織和血液相關基因表達地影響和COVID-19感染地致病機制,並結合藥物再利用技術識別可藥性靶標,從而指導COVID-19治療藥物的開發。
https://doi.org/10.1016/j.csbj.2020.11.056
研究背景
新型冠狀病毒肺炎COVID-19,現已證實是由2019新型冠狀病毒SARS-CoV-2感染引起的急性呼吸道傳染病。SARS-CoV-2的傳播力和感染力很強,目前仍未開發有效的治療藥物。
全球製藥業都在面臨多方面挑戰,一些臨床領域將新藥推出市場的時間成本增加以及監管要求的變化,這項都在無形中增加了成本。以往的舊藥新用,多數靠醫生在臨床實踐的偶然發現,隨著更多新技術和新方法的應用,舊藥新用逐漸告別「靠天吃飯」的尷尬處境。幸運地,隨之生命科學高通量技術、生物信息學技術、計算機的數據分析和處理能力的飛速發展,研究人員對人體各個系統的分析和認識能力達到了前所未有的高精度,現代系統分析方法又進一步細分到計算方法和實驗方法,這使之成為藥物再利用指導下的高效工具,因為藥物再利用涉及使用」去風險「化合物,這可能降低總體開發成本和縮短開發時間。
研究目的和意義
雖然當今全球醫學界都在開展大型臨床試驗,評估現有藥物是否有效地治療COVID-19住院病人,但是目前學術界缺乏一套基於大數據分析針對藥物再利用(drug repurposing)的系統分析方法,所以這篇文章旨在系統地評估SARS-CoV-2對COVID-19患者肺組織和外周血單核細胞(PBMC)樣本基因表達的影響,通過差異表達基因分析確定與新冠病毒感染相關的重要通路,再應用WGCNA分析方法進一步確定與新冠肺炎患者的臨床特徵呈高相關性的基因模塊,最後採取三種先進手段預測潛在治療藥物。總而言之,這篇文章利用生信分析方法結合藥物再利用技術,發現出一些潛在可行的COVID-19治療藥物。
研究思路
研究結果
01
COVID-19患者肺組織的基因特徵
作者首先基於GEO資料庫的RNAseq的轉錄組分析數據篩選差異表達基因DEGs。為了提高研究的效率,在這些候選的DEGs裡,作者共分析了1052個基因,其中537個上調DEGs和515個下調DEGs(FDR<0.05和|Log2 (FC) | > 1)。隨後作者對COVID-19感染的差異表達基因進行了通路富集分析結果。為了進一步確定受COVID-19感染影響的基因,作者用GSEA方法和MSigDB資料庫的數據集分析其基因表達譜。
02
COVID-19 外周血單核細胞樣本的基因特徵
為了避免中間出現的數據偏差,作者從健康供體和新冠患者的PBMC樣本中的RNA測序數據進行分析,作者鑑定出了2145個DEGs,其中1111個DEGs為表達上調和1034個DEGs為表達下調。接著作者對這些DEGs進行了富集分析結果,從而揭示感染COVID-19後的發病機理。
03
WGCNA鑑定與COVID-19相關的基因模塊
WGCNA方法至今已在臨床醫學上被廣泛採用,以識別出患者出現的臨床特徵相關的基因模塊。在鑑定基因模塊前,作者對健康供體和COVID-19患者的全血RNA轉錄組數據用GSEA進行質量評估。隨後,作者應用WGCNA方法用病人的臨床特徵轉錄組分析。為了提高研究的效率,作者通過加權係數矩陣的聚類分析方法將基因分配到5個模塊中,將未分配的基因歸為灰色模塊。然後將模塊的特徵基因與相關聯的患者臨床特徵進行計算模塊-特徵關係。再通過加權分析對每個模塊中的Hub基因進行分析,熱圖分別顯示了健康供體和患者兩個模塊中Hub基因的表達情況。之後作者對這兩個模塊的30個hub基因構建PPI網絡。
04
GSEA方法預測COVID-19潛在治療藥物
由於目前尚無有效藥物治療COVID-19,所以作者利用drugBank中5825種藥物的靶向基因集,分析藥物靶向基因與COVID-19基因特徵的相似性,預測潛在治療藥物。以藥物靶點作為內參基因集,在WebGestalt webserver使用GSEA方法對GSE147507、CRA002390和E-MTAB-8871的三個基因特徵進行處理和分析。
05
用CREEDS識別出可誘導COVID-19基因特徵相互改變的藥物
因為WebGestalt網絡伺服器只能分析到藥物靶點和COVID-19標記基因的相似結果,但是並不能知道這些藥物是否逆轉COVID-19標記基因。所以他們再用CREEDS網絡伺服器從6100種藥物中鑑定出了可誘使COVID-19標記基因相互改變的藥物。作者自主構建了一條公式評價藥物對COVID-19基因特徵的逆轉效果,隨後把識別出來的藥物用一個帶有整數的雅卡爾係數進行排列,係數低表明藥物跟COVID-19基因特徵具有良好的逆轉效果。
關於計算逆轉效果的公式如下:
其中,NESdn和Pdn代表了COVID-19基因特徵裡的表達下調基因的NES和P值,而NESup和Pup代表COVID-19基因特徵裡表達上調基因的NES值和P值。
06
驗證潛在藥物對COVID-19基因特徵的作用
為了進一步確認潛在藥物的逆轉效果,作者分析了藥物的轉錄組分析數據,並用GSEA方法進行驗證。GSEA結果的兩張圖顯示了與COVID-19基因特徵相關的每種藥物的NES值和P值。然後也用了通路富集分析方法驗證了潛在藥物對COVID-19影響的信號通路的作用。
總結四點作者的研究思路
1、系統地評估SARS-CoV-2對COVID-19患者肺和PBMC樣本裡基因表達的影響。
2、通過基因差異表達分析發現了一些與感染COVID-19有關的關鍵通路。
3、通過WGCNA分析和聚類分析方法明確了與COVID-19患者臨床特徵相關聯的基因模塊。
4、通過GSEA分析方法,利用WebGestalt和CREEDS這兩個webservers預測潛在治療藥物。
這篇文章為什麼最終能發表在6分期刊呢?
我們先看看這本期刊《Computational and Structural Biotechnology Journal》的錄稿原則,這本期刊著重刊登那種通過基因組學、代謝組學、生信的算法等方法研究生物過程中分子功能機制的文章。這篇文章是基因轉錄組學和生信方向的,所以適合投稿在這本期刊。
我們再看看摘要,作者首先開門見山,簡明扼要地陳述了本文的研究目的和意義,即採用轉錄組分析系統地解析了SARS-CoV-2對人肺組織和血液相關基因表達的影響和COVID-19感染的致病機制,並結合藥物再利用技術識別可藥性靶標,從而指導COVID-19的藥物療法開發。而且列出了文章最具代表性的結果:1、差異表達基因分析方法COVID-19感染後能引發一系列IFN因子的釋放及關鍵信號通路;2、WGCNA方法揭示與COVID-19病人臨床特徵相關的2個基因模塊,進一步了解COVID-19的發病機制;3、藥物再利用方法對成千上萬現存藥物進行分析,發現了有兩種藥物對COVID-19的基因特徵具有明顯的逆轉反應。在引言部分,這篇文章的作者首先以COVID-19的流行病學作為背景知識,說出治療藥物研發的迫切性,然後作者指出了目前研究存在的不足(仍缺乏基於大數據分析針對藥物再利用的系統分析方法),然後作者自己針對這個短板設計出一套全新研究方法,以解決當今遇到的問題。最後就帶出作者自己的研究問題、研究目的。在方法部分,作者很全面地詳細闡述了數據挖掘、DEG鑑定、PPI構建等方法,並清晰地描述了涉及研究的所有數據來源、數據分析所使用的軟體或工具,包括火山圖在內的數據圖用ggplot2包和pheatmap包繪製。比如作者用GSEA方法分析藥物多大程度受COVID-19感染影響,之後為了評價藥物的作用,自主構建了一條數學公式。
這篇文章的選題較為新穎,有臨床意義的,圍繞全球爆發且肆虐中的新冠病毒開展研究,作者了解到目前仍缺乏有效的治療藥物,而且循主流藥物研發程序的確需要耗上幾年甚至十幾年時間。所以作者利用轉錄組分析數據和生信分析結合藥物再利用的技術從現有藥物名列中找出潛在可治療藥物。
寫在最後
這篇文章在不加任何實驗的情況下,只靠數據挖掘、R包,從差異表達基因篩選和鑑定、構建PPI到最後的預測分子藥物都運用了多個資料庫,公共資料庫的運用是貫穿全文的,更加體現出在生物信息學上數據挖掘在探索疾病發病分子機制和藥物篩選上的重要性。
希望我們分享的文章能幫助你發表更多SCI論文。如果你有疑問,歡迎在下面評論區留言。
以上資料圖片素材均來自文獻
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.