「出道即巔峰」的edgeR或DESeq被廣泛應用於高通量測序的差異表達分析,包括環狀RNA的差異表達分析。
然而,做過環狀RNA差異表達分析的老師應該都清楚,反向剪切(back-splicing)的環狀RNA並不像mRNA或lncRNA那樣馴服。
獨特的環狀結構讓二代測序較短的讀長限制了對其鑑定以及定量,目前僅僅依靠其反向剪切序列;另外,環狀RNA的表達總是與來源基因(host gene)線性RNA的表達糾纏不清,讓我們很難區分差異是來源於反向剪切還是只是來源基因的副產物。
對此,許多軟體在識別上下功夫,比如DCC、CIRCexplorer、CIRI等等,然後用DESeq2或edgeR進行差異分析;而另一些軟體在定量上使勁,對環狀 RNA 的定量不僅僅使用反向剪切序列(BSJ),而且考慮到來源基因線性分子表達的影響,使用BS ratio進行定量,例如DCC、CIRI2、CIRIquant以及CLEAR。當然這種定量就不適合用於DESeq2或edgeR,一般可以用DCC::CircTest或CIRIquant等軟體進行差異分析。
而最近北大基礎醫學院楊恩策團隊提出了環狀RNA差異分析的新方法DEBKS,對BS ratio進行了優化(公式及圖解如下)。
對此,DEBKS設計了4個模塊(見下面的流程圖)
1. merge,整合不同樣品的環狀RNA
2. count,對來源基因的線性RNA進行定量
3. anno,評估環狀RNA長度
4. dec,檢測差異表達環狀RNA
以及兩個差異表達模式
1. paired,配對的樣品
2. unpaired,非配對的樣品
作為一款工具,我們需要首先對其性能進行評估。
作者首先用了兩套公共數據集檢測了DEBKS識別差異環狀RNA的檢出率並用RT-qPCR進行了驗證;隨後,用模擬數據對DEBKS以及其他軟體進行了評估,評估內容包括
1. 重複樣品表達一致性檢驗
2. AUC,真陽性率以及假陽性率
3. 差異表達基因檢測敏感性
4.來源基因表達對差異環狀RNA的影響
通過比較,DEBKS具有更優秀的性能並且更少受來源基因表達的影響。
由於需要包含線性剪切位點的表達(LJC),因此,DEBKS只能應用於既包含環狀 RNA又包含線性RNA的測序,例如rRNA-depleted RNA-seq或exome capture RNA-seq。
另外,基因間區的環狀RNA由於缺乏線性分子的表達,因此無法用DEBKS評估。
雖說目前差異分析幾乎被edgeR/DESeq包攬,然而面對複雜多樣的生物學情景以及日益增長的多組學信息,分析工具的多樣性和特異性是非常有必要的。
環狀RNA研究越發蓬勃,然而專門的工具卻仍舊匱乏,另外,有些工具走著走著就丟了。雖然DEBKS在文章中提到表現比較優秀,然而能不能成為環狀RNA研究的利刃,仍需要大量真實數據去檢驗。
1. Liu Z, Ding H, She J, et al. DEBKS: A Tool to Detect Differentially Expressed Circular RNA[J]. bioRxiv, 2020.
轉載請聯繫郵箱授權:circRNA@163.com