研究探討RNA-seq數據分析方法

2020-11-23 科學網

 

高通量RNA測序(RNA-seq)有望描繪出轉錄組的整體圖像,實現樣本內所有基因及其亞型的完整注釋和定量。隨著測序價格的不斷下降,以及個人化測序儀的上市,更多的實驗室有機會嘗試這種新技術。

 

然而,測序之後的數據分析才是真正的挑戰。在RNA-seq之後,還需要一些強大的計算工具,才能繪製出完整的轉錄組圖譜。在這一期的《自然—方法學》(Nature Methods)上,來自MIT和哈佛Broad研究院的研究人員發表了一篇綜述,介紹了轉錄組注釋和定量的計算方法。

 

首先,他們介紹了一些方法,將讀數與參考轉錄組或基因組直接比對。之後,他們討論了鑑定表達基因和亞型的方法。最後,他們還介紹了一些方法,來預計基因和亞型的豐度,以及分析樣品間的差異表達。

 

由於RNA-seq數據生成的不斷改善,現有計算工具的發展有著很大差異。在某些領域,如讀數定位,有多種算法存在,但在差異表達分析上,解決方案才剛剛出現。作者們強調了這些方法的核心原理和每種方法的關鍵差異,以及它們在RNA-seq分析上的應用。他們還討論了這些不同的方法如何影響結果以及數據的闡釋。

 

為了方便讀者參考,他們還將現有的方法列成了一張表,註明了它們的原理和用途。另外,他們精選了一些有代表性的方法,應用在已經發表的RNA-seq數據組中。此數據組包含了5800萬個末端配對的讀數。

 

數據比對是RNA-seq分析中的一項基本任務,然而也面臨著一些挑戰,比如數據量大,讀數很短(36-125 bp),錯誤率可觀,且許多讀數跨越外顯子-外顯子交界。對於RNA-seq的比對方法,作者將其分成「unspliced read aligners」和「spliced aligners」 兩類,並分別介紹。

 

轉錄組重建也是個很困難的任務,因為基因表達差異很大,且讀數可能來源於成熟的mRNA,也可能來源於未完全剪接的前體RNA,這樣就很難鑑定成熟的轉錄本。當然,讀數短也為分析帶來了困難。目前的轉錄組重建方法主要有兩類,一類是基因組指導的,另一類是不依賴於基因組的。作者比較了這兩類方法,並具體介紹了每一類下面的幾種方法。

 

至於轉錄組的圖譜分析,DNA晶片一直是首選方法。在使用RNA-seq來估計基因表達時,需要將讀數適當地標準化,才能提取出有意義的表達預測值。作者介紹了一些方法,來預計基因和亞型的豐度,以及分析樣品間的差異表達。

 

作者還提到,隨著測序技術的成熟,如讀長不斷增加,現有的計算工具需要發展,也能滿足新的需求,同時新工具也會不斷出現,滿足新的應用。(來源:生物通 薄荷)

 

 

 

 

特別聲明:本文轉載僅僅是出於傳播信息的需要,並不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站註明的「來源」,並自負版權等法律責任;作者如果不希望被轉載或者聯繫轉載稿費等事宜,請與我們接洽。

相關焦點

  • QB期刊 |RNA-seq數據計算方法大匯總
    為了回答各種生物問題,十年來不同領域的研究者已為第二代RNA-seq數據分析提出了超過2000種計算與分析方法。該綜述文章從四個層面(樣本,基因,轉錄本,和外顯子)對RNA-seq數據的分析方法進行了總結,旨在歸納看似不同的方法背後共通的統計假設和模型。
  • Circular RNA的產生機制、功能及RNA-seq數據鑑定方法
    Frontiers in Molecular Biosciences, 2017)【Circular RNA的RNA-seq鑑定及實驗驗證方法】CircRNA可以通過RNA-seq技術進行大規模的鑑定。
  • 超能餅乾|SnapATAC分析單細胞ATAC-seq數據(三)
    簡介在本教程中,我們將對PBMC的兩個scATAC-seq數據集(5K和10K)和一個scRNA-seq數據集進行整合分析。這三個數據集均來自10X genomics測序平臺產生的數據,可以直接在10x官網下載使用。
  • C-Myc 與RNA-seq分析
    Okay,扯的有點遠,大家看題目,我除了寫了RNA-seq,還寫了C-Myc,這可是一個非常有名的基因,做癌症生物學的人知道它與增殖信號相關,做幹細胞的人知道這是yamanaka在製作小鼠iPS所選用的四個轉錄因子之一,這個基因被研究的也很早,目前依舊火熱中。
  • 從數據分析到結論產生,談談scATAC-seq
    然而,由於scATAC-seq數據固有的高噪聲和稀疏性,使得生物信號的準確提取和生物假設的有效制定變得困難。為了克服ScATAC-seq數據分析中的這些限制,在過去幾年中開發了新的方法和軟體工具。然而,關於scATAC-seq數據分析的最佳實踐還沒有達成共識。
  • The Scientist:從晶片到RNA-seq的轉型之路
    在這一技術最輝煌的時期,準備研究基因表達模式的人都會想到使用晶片。不過隨著測序成本的直線下降,RNA測序(RNA-seq)成為了越來越受歡迎的轉錄組分析方法。DNA晶片上排列著大量的核酸探針,可以代表生物的整個基因組或部分基因組,比如外顯子、miRNA、單核苷酸多態性SNP等等。用晶片分析基因表達需要抽提RNA,將其反轉錄為cDNA,然後進行螢光標記。
  • scRNA-seq數據差異基因表達分析的有效方法有哪些?
    scRNA-seq數據差異基因表達分析的有效方法有哪些?我們知道RNA-seq即轉錄組測序,是某個物種或者特定細胞類型產生的所有轉錄本的集合,而單細胞RNA測序(single-cell RNA-seq,簡稱scRNA-seq)則是以單個細胞為特定研究對象,提取其mRNA進行逆轉錄並進行高通量測序分析,可體現出個體細胞內表達水平的具體變化,目前已廣泛應用在生物學、醫藥研發、臨床醫學等各個領域。
  • 計算差異表達分析方法(rna-seq)
    比較了11種RNA-seq數據的差異表達分析方法。
  • RNA-seq的標準化方法的不完全整理
    >基因長度不同,為了能夠比較不同的樣本,比較不同的基因的表達量,以及使表達水品分布符合統計方法的基本假設,就需要對原始數據進行標準化。在RNA-seq標準化這個領域也是如此,目前用的最多也就是, RPKM/FPKM, TPM,但是注意,有些時候一個方法出現的多,單純是因為公司沒有修改他們的分析流程。為了方便理解,假設目前你在一次測序中(即剔除批次效應)檢測了一個物種的3個樣本,A,B,C,這個物種有三個基因G1,G2,G3, 基因長度分別為100, 500, 1000.
  • 研究解析RNA深度測序分析方法
    新一代測序技術又稱作深度測序技術,主要特點是測序通量高,測序時間和成本顯著下降,把這種高通量測序技術應用到RNA上,也就是將各種類型的轉錄本用深度測序技術進行高通量定量檢測,統稱作RNA-seq或RNA測序。隨著新一代高通量DNA測序技術的快速發展,RNA測序(RNA-seq)已成為基因表達和轉錄組分析的重要手段。
  • 解讀單細胞RNA-seq技術
    但是現在,時代已經變了,新的單細胞RNA-seq方法,可以分析大量的細胞及它們的命運。我們都參加過大型生日派對:在擁擠的房間裡,與許多人聊天、吃飯和慶祝。但是,試想你並不知道壽星是誰,只是像一個局外者看待這個派對。你可能會覺得整個事件看起來與其他的生日派對沒有什麼不同。然而,派對上的每個人都在壽星的生活故事裡擔當獨特的角色。
  • RNA-seq的3的差異分析R包你選擇哪個
    很多課題組導師都認為做一個RNA-seq項目就能發CNS啦,就跟這兩年大家以為做一個單細胞轉錄組項目就可以發CNS的堅信程度是一模一樣的!直到現在(2020),基於高通量測序技術的RNA-Seq方法仍然是轉錄組學研究中必不可少的工具。截止到(2016)已經普遍接受的是,標準化預處理步驟可以顯著提高分析質量,特別是對於差異基因表達分析而言。
  • RNA-seq 檢測變異之 GATK 最佳實踐流程
    RNA-seq 序列比對對 RNA-seq 產出的數據進行變異檢測分析,與常規重測序的主要區別就在序列比對這一步,因為 RNA-seq 的數據是來自轉錄本的
  • Nature重磅綜述 |關於RNA-seq,你想知道的都在這
    但是,研究還表示RNase H方法比pull-out法的穩定性要好。另外對應用不同試劑盒獲得的數據進行差異基因分析時要注意轉錄本長度的偏好性的影響。作者還描述了另外一種類似於RNase H的方法,效果也不錯但之前沒有報導過。ZapR方法是Takara Bio的專利技術,它使用一種酶來降解RNA-seq文庫中的rRNA片段。
  • ChIP-Seq數據挖掘系列-3: Motif 分析(3) - 利用ChIP-Seq結果在基因組區域中尋找富集的Motifs
    HOMER 假定目標數據和背景序列在1-mers, 2-mers, 3-mers, etc上是沒有差異的。短寡聚序列長度是通過參數-nlen <#>設定。一個例子,目標數據和背景序列中 A's是一樣的;先計算目標序列中各種短寡聚序列的偏好性,然後調整每條背景序列的權重來標準化這些偏好性,當然權重矯正是按照較小的步長一步一步進行矯正。
  • 基因測序(視頻+課件),輕鬆學會數據的處理和分析
    因為,你只有真正了解數據是如何來的,才能更好地明白數據該如何處理和分析,以及如何才能有效地挖掘出它背後隱含的生物知識。>2、轉錄組資料庫準備和質控3、轉錄組分析簡介4、轉錄組差異表達5、轉錄組比對和表達量計算6、轉錄組新轉錄本和新lncRNA7、轉錄組差異表達8、轉錄組-比對和表達量計算9、轉錄組分析簡介小rna測序1、小rna測序1_質控和reads長度統計2、小rna
  • Nat Methods:開發出基於CRISPR/Cas9和單細胞RNA測序的CROP-seq方法
    為了理解多種基因如何協同調節細胞狀態,當前針對每個CRISPR靶向的基因,分別地對細胞進行培養、編輯和分析是必不可少的。這是非常繁瑣的,而且耗費昂貴。如今,在一項新的研究中,來自奧地利科學院CeMM分子醫學研究中心的Christoph Bock及其團隊開發出一種新方法:將CRISPR集中篩選和按序篩選(arrayedscreen)的優勢結合在一起。
  • 【突破】500,000+單細胞的RNA序列揭示所有主要人體器官的細胞類型圖
    他們建立了所謂的單細胞人類細胞景觀(HCL)分析管道,以幫助鑑定細胞,並對人類和小鼠的景觀進行了單細胞比較分析,以揭示保存的遺傳網絡。研究人員發現幹細胞和祖細胞表現出很強的轉錄組隨機性,而分化的細胞則更加獨特。先前的研究中,這些研究人員報告了一種名為Microwell-seq的技術方法,該方法是一種經濟高效的單細胞mRNA測序技術,在雙峰率和細胞類型相容性方面具有優勢。
  • 環狀RNA(circRNA)資料庫大匯總,快來看看有沒有你需要的!
    CIRCpedia v2 是一個更新的綜合資料庫,包含來自 6 個不同物種的 180 多個 RNA-seq 數據集共 262782 條的 circRNA 注釋。此外,更新後的資料庫包含了人類和小鼠之間環狀 rna 的保守性分析。
  • Cell:新研究揭示人體體液中存在6種胞外RNA貨物類型
    2019年4月24日訊/生物谷BIOON/---在一項新的研究中,為了開發由胞外RNA(extracellular RNA, exRNA)介導的細胞-細胞通訊圖譜,美國國家衛生研究院(NIH)胞外RNA通訊聯盟(NIH Extracellular RNA Communication Consortium)創建了exRNA圖譜資源(https://exrna-atlas.org