這個方法或許能拯救你的轉錄組

2021-01-08 騰訊網

幫朋友轉發一篇內容,具體內容可以通過文章底部QQ群聯繫作者本人。

還講轉錄組

目前轉錄組的定量和差異分析,網絡上、培訓課上資料都非常多,方法也比較固定,但是目前我們分析碰到的最常見問題,就是同樣的數據,用不同的軟體找到的差異基因差異很大,並且很多時候找不到我們想研究的功能基因,同時很多基因在不同樣品間的表達並不穩定。因為傳統的分析方法和原理有著天生的局限性,沒能充分地發揮轉錄組測序數據的潛力。所以對於很多生信老鳥和菜鳥來說,轉錄組的定量和差異分析,還點玄學的感覺。

我們這裡介紹一種新的定量方法(RNADX),它在qPCR的原理上進行了升級,能大大地提高轉錄組定量的準確性,特別適合高雜合的昆蟲、海洋生物和林木,並且能在已發表的數據中找到一些新的差異基因。

RNADX

這是一套改進的RNA高通量測序實驗和分析方法,它通過表達穩定的外參基因來對其他基因進行定量,能大大提高樣品間基因定量的穩定性,同時qPCR的驗證率也有20%以上的提高。

基因定量

基因的定量,就是基因在特定時期的表達水平。那麼怎麼定義基因的表達水平呢?在回答這個問題之前,我先問1個初中的物理問題:怎麼定義一個物體的重量呢?性感男神如花跟我比,哪個更重?

為了解決這個問題,國際上制定了1千克的標準品,然後又以這個標準品的重量為基準,製造了很多重量與標準品相同的砝碼,送給了不同的國家機構,然後這些機構,就以標準品為基礎,製造了2千克,5千克,100千克等砝碼,用來測量物體的重量。假如目前如花測量的體重是90千克,我本人測量的體重是65千克,那麼如花就比我重25千克,體重是我的1.38倍。

那麼回到剛才的問題,我們怎麼定義基因的表達水平呢?那麼我們也要找一個標準基因,用來衡量其他基因的表達。我們管這個標準基因叫內參基因,理論上它在各時期表達都要很穩定。在我們的實驗室裡,大家用一種叫qPCR的方法,將基因和內參基因做比較,得到的差異倍數,作為這個基因的表達水平。示意圖如下:

傳統的qPCR方法,會用一些表達穩定的內參基因(referencegene)作為標準,用其他基因的表達與標準內參作比較,得到基因的表達,如下圖所示:

高通量測序

因為上述的qPCR實驗方法太費人力,所以現在很多實驗室採用測序的方法來測量基因的表達。但是測序方法跟我們的qPCR方法不一樣,怎麼定義基因的表達,目前國際上還一直爭論不休,一直提出新的統計方法(RPKM,FPKM, TPM,CPM等),讓人眼花撩亂,但是這些基因表達的統計方法,是基於一個這樣的概念:基因的表達在整體表達中佔的比重,示意圖如下:

尷尬的困境

我們做的轉錄組定量,是想要知道在不同的實驗環境下,哪些基因的表達產生了變化。但是當我們拿到測序結果後,用不同的軟體和統計模型,總會發現它們找到差異基因差別還是挺大的,跟我們的qPCR實驗吻合度也不高,只有30%-50%。

為什麼高通量測序和傳統的qPCR定量,這兩種方法的結果差別會這麼大呢?因為有些的基因,在不同的實驗條件下,表達水平相差特別大,大到能影響整體。比如村裡來了一位姓馬的鄉村教師傑克,而且他還把他的所有錢都帶過來了,村裡的總資產被大大拉高了,其他村民資產佔的比例就降低了。以下我們舉個極端的例子,就能一目了然的知道問題所在了:

走出困境

從上面的例子可以看出,只要我們的不同樣品間,有表達穩定的內參基因,所有基因與這個內參基因比較,不就能得到準確的定量結果嗎?老哥也在科研路上混了10來年,有這個想法的牛人應該不計其數,如果可行,國際上應該有文章發表才對,但是為什麼現在主流的高通量方法,還是用基因的表達比例來計算呢?因為所謂的內參基因,在某些期期表達也不穩定,甚至不表達。

即然內參不靠譜,能不能加入表達穩定的外參序列作為標準基因?如果你想到這方面,說明你跟我一樣,開始步入U秀的行列了,目前國際上還真的有這種標準品,叫ERCC Spike-In,它目前是被用到表達譜晶片上,用來校正基因的表達。

在高通量測序上,目前是被用來評價實驗的一致性。那麼為什麼很少聽到有人用它來校正基因的表達呢?主要是因為要用它來作為內參,它就必須是非常精確的標準品,每mL的水裡,要有多少個外參序列,都是非常研格限制的,所以這個標準品很貴。另外就是在做實驗的時候,要同時嚴格地控制RNA量和標準品量的比例,對實驗人員要求也非常高。作為一名曾經放蕩不羈愛自由的科學工作者,開了公司接了些轉錄組項目,得想辦法克服這些問題,不能砸了招牌,沒有條件,就要創造條件。在這個過程中,我也深深體會到中國科研人員的無奈和公司的機智。

首先要解決標準品昂貴的問題,它除了實驗技術要求高之外,最大的問題是很多公司不願意投入研發,因為現在高通量轉錄組基本沒有利潤,如果客戶分析結果不好,還可以讓客戶再測一次,多收一份錢,雖然很大可能結果還是一樣不好。可能是本人的運氣比較好吧,杭州的一家試劑公司,叫開泰生物,投入了不少人力,幫我們設計併合成了標準品。

然後就要解決實驗操作問題,因為不同批次的樣品,不可能每次加內參的比例都一樣,存在人為誤差,即然實驗解決不了,我們就從算法上解決,我們可以通過樣品基因表達的整體差異倍數,來糾正標準品的誤差,從而做到精準定量。在這裡,非常感謝在美國的宋教授和他的團隊,幫我們開發了一個叫RNADX的軟體(等文章發表後我們會把它放到github上)。

方法介紹

我們在建庫的時候,加入了表達穩定的人工外參序列,然後進行高通量測序。在測序完成後,將不同的基因與外參序進行比較,得到相對定量,如下圖所示:

A. RNA建庫,將去除核糖體RNA後的RNA文庫,加入1%的人工外參序列。

B. 基因定量,把所有的基因與外參序列進行比較,得到基因的相對定量,找到差異基因。

效果評估

為了評估我們的算法準確度,我們用了植物基因組,動物基因組,還有糖尿病小鼠來做評估,評估指標如下:

相關係數

我們使用corrplot這個R包來對樣品的相關性進行計算,樣品間的相關係數越高,說明樣品間的基因表達相似度越高,找到的差異基因越精確。通常情況下,組內的相關係數要比組間的相關係數高,組內的相關係數最好大於0.9,組間大於0.7。

•動物樣品

這是一組雌雄個體RNA的數據比較,我們可以看出用了RNADX的定量,能大幅提升組間樣品相關性,平均從0.5提成到0.7。在FPKM組內相關性很好的情況下,RNADX算法也能提升一點。

• 植物樣品

我們只對這株植物的根、莖、葉、花蕾、果實進行測序,我們的RNADX方法,都比FPKM的方法樣品間的相關係數要高出不少,大概能有10%的提升。

qPCR驗證

目前來說qPCR是基因定量的精標準,所以我們挑了小鼠的基因來進行驗證,拿RNADX的結果和目前文獻裡最常用的方法來進行比較。

• 小鼠轉錄組

因為哺乳動物的RNA相關係數相對都很高,我們直接用qPCR的方法,來驗證我們數據的準確度。綠色的是qPCR的結果,作為標準。紅色是RNADX的結果,灰色則是我們大部分文獻裡用的edgeR包做的差異分析。

我們挑選了qPCR表達為上升趨勢的基因,來驗證不同的定量方法,RNADX方法中,只有一個基因差異倍數小於1,其他的差異倍數都大於1,為上升趨勢。而edgeR這個軟體,3個基因被過濾掉了,並且1個基因的pvalue>0.05,差異倍數也不明顯。

定量比較

為了顯示RNADX的方法比FPKM優秀,我們挑了兩個FPKM值非常不穩定的基因,再看看RNADX的表達,表格如下:

上表中我們可以看出FPKM的表達,誤差比較大,而且很多樣品的表達為0,而RNADX的數字穩定得多。

為了直觀地展示,我們對上表作了個圖,如下所示:

PS:為什麼FPKM很多樣品表達為0,而RNADX的表達不為0,那是因為我們使用hisat2比對軟體和stringtie來計算FPKM,而我們的RNADX方法則有自己的比對處理模塊,使得比對結果更加真實。

提供服務

1.外參試劑,用戶可以在構建文庫的時候,根據逆轉錄cDNA的濃度進行1:99比例添加。

2.實驗外包,用戶可以把提好的RNA或者樣品送寄來我們公司,我們對樣品進行建庫和測序。

3.數據分析,我們提供基因定量,新轉錄本構建,功能注釋,差異分析,可變剪切分析,並提供一份結題報告。

4. 算法源碼,因為我們正在對這個方法進行文章撰寫,暫時就不提供源碼了,但是可以提供一個收費的可視化的平臺。

常見問題

1. 我們幹嗎要用這個新方法?

我們這個方法的目標群體是對數據準確度有追求,並且已經有想研究的基因的科研人員,因為他們要研究的基因就鎖定在一個小範圍內,需要的定量結果要經得起考驗。

2. 我們已前測了好多轉錄組數據了,但是沒有加外參,可以用這個方法進行分析嗎?

應該可以,但是有些樣品的內參基因表達不穩定,會被過濾掉。

我們的軟體會自動在樣品間查到內參基因,用內參基因來對樣品進行歸一化。但是有些樣品的內參基因表達不穩定,我們的軟體會自動過濾掉這些樣品,這些樣品就沒法用來分析了。樣品越多,它們的共有內參基因就越少,根據我們的經驗,9個樣品以內,這個算法的效果還是可以的。

3. 目前有些公司,推出了「絕對定量」轉錄組,就是每條RNA加了分子標籤(UMI),RNADX方法跟它比怎麼樣?我們要解決的問題是基因定量,也就是數據歸一化的問題。加了UMI的轉錄組可以解決實驗上某些RNA分子擴增過量造成的問題,但是如果分析人員最後還是用傳統方法或者軟體來定量分析,那所謂的「絕對定量」轉錄組,也只是某些公司的噱頭,起的只有錦上添花的作用。

4. 你們提供的服務收費嗎?

嗯,收費。因為外參測劑合成的成本比較高,另外操作要求非常高,所以收費會比較高。

5. 你們把分析原理寫出來,不怕別人抄襲嗎?

這個加內參或外參的分析方法,在十幾年前就有人發表過文章了,現在還有ERCC的外參試劑賣。只是算法和實驗沒有相結合。另外很多事情看上去是挺簡單的,但是做起來可沒那麼簡單。別拿你的業餘愛好跟我們這些靠技術吃飯的人來比較。

6. 你們的評估效果看上去很不錯,是不是吹牛呀?

沒有吹牛,有時候太過優秀也會招人嫉恨。

7. 你們文章沒發表前,我們用了你們的方法,在文章裡怎麼提你們的技術?

我們會提供一個可視化的galaxy平臺在github上公布,不過需要付費使用。

收費標準

市場指導價:外參:800+提取:150+建庫:500+測序:360+分析:500=2310。

具體價格可聯繫當地銷售。

產品比較

優惠方案

本次是我們第一次進行正式推廣,在2020年5月1日前,我們有以下優惠政策。

1. 分析效果不能優於傳統方法(評價指標為相關係數,表達異常值的數量),我們承擔一半費用。

2. 我們提供舊數據分析服務,最高可打7折,效果不能優於傳統方法則不收費。

3. 轉發本文章,併集齊10個贊,進行朋友圈截圖,可再打9.5折。

4. 15個樣品實驗+分析,送ipad mini。

聯繫我們

我們提供了以下QQ群,裡面有幾位資深分析人員(平均每人在Nature子刊上發表過10篇以上論文),看心情為你解答轉錄組或者人生問題(申請時備註:單位+研究方向,本群除了群主,其他人嚴禁發廣告)。

另外本公司目前招聘NGS的信息分析人員和產品經理,有意向的可以加群後私信群主。

各地區代理商

持續更新中,有意向公司請聯繫群主:

• 杭州開泰生物

• 武漢大眾源生

參考文獻

[1]Evaluation of the External RNAControls Consortium (ERCC) reference material using a modified Latin squaredesign.

[2]Measurement of mRNA abundance usingRNA-seq data: RPKM measure is inconsistent among samples.

相關焦點

  • 科學家構建空間轉錄組測序新方法
    本報訊(記者黃辛)中科院生物化學與細胞生物學研究所景乃禾課題組新近創立了一種技術方法,可以獲得具有空間位置信息的少量細胞轉錄組圖譜
  • 彭廣敦教授:空間轉錄組測序技術轉錄組學研究領域的新方向
    本次會議多組學研究和臨床轉化研討會以邁向臨床精準醫療為主題,聚焦基因組學、轉錄組學、蛋白質組學和代謝組學等多組學技術聯用研究臨床疾病,以及多組學數據的整合交叉分析應用,會議涉及基因變異、測序分析、轉錄調控、代謝研究、RNA幹擾等,力圖打通多組學研究到臨床應用的通道,推動多組學技術在醫學轉化上的應用。來自中國科學院上海生化細胞所的彭廣敦教授分享了「空間轉錄組測序技術」精彩議題。
  • 【中國科學報】科學家構建空間轉錄組測序新方法
    中科院生物化學與細胞生物學研究所景乃禾課題組新近創立了一種技術方法,可以獲得具有空間位置信息的少量細胞轉錄組圖譜。相關研究成果日前在線發表於《自然—實驗室指南》。  無論是體內組織還是體外細胞系,不同細胞之間都存在著差異性,即細胞的異質性。
  • 神助攻帶你「撩」起單細胞轉錄組
    帶著無比喜悅,無比激動的心情,小編用幾個數字給您炫一下10x Genomics這一神助攻應用於單細胞轉錄組測序的六大優勢!本研究應用10x GemCode™平臺對29個細胞系及RNA樣本,共250,000個單細胞,及68,000個外周血單個核細胞(PBMC)進行3』單細胞轉錄組測序分析。1.
  • 技術貼 | 宏基因組 + 宏轉錄組分析工具:HUMAnN
    HUMAnN 第一版 2012 Curtis Huttenhower團隊使用該方法還特意分別做了口腔、糞便宏基因組與宏轉錄組關係的研究【2】。該研究於2014年發表於PNAS,他們發現: 1)冷凍、乙醇、RNAlater三種保存條件中的微生物群落、宏基因組和宏轉錄組高度一致。
  • 靶向單細胞多組學方法,可在低深度下同時檢測蛋白表達和低豐度轉錄組
    通常,轉錄組的表達水平要比蛋白質低得多,而蛋白質的動態表達範圍則較大,拷貝數跨度約為6-7個數量級,轉錄本拷貝數跨度約為2個數量級。平行檢測蛋白質表達和轉錄組數據方法的開發,如CITE-seq、REAP-seq,解決了僅評估轉錄組所固有的一些限制,但也幾乎使每個單細胞的測序深度增加了一倍。
  • 宏基因組bining+宏轉錄組強強聯合
    採用宏基因組genome bining以及宏轉錄組的方法,發現並驗證新物種和新功能。通過功能宏基因組學的方法,研究者從酸性泥炭地中恢復了7株新的酸桿菌基因組草圖,這些酸桿菌都具有潛在的異化亞硫酸鹽(dsrAB, dsrC, dsrD, dsrN, dsrT, dsrMKJOP)或硫酸鹽呼吸(sat, aprBA, qmoABC和dsr)相關功能基因。令人驚訝的是,這些基因組也編碼了DsrL蛋白,迄今為止該基因只在硫氧化微生物中發現。
  • 微生物組學數據分析工具綜述 | 16S+宏基因組+宏病毒組+宏轉錄組
    建立在高通量測序基礎上的微生物群落研究,當前主要有三大類:基於16S/18S/ITS等擴增子做物種分類的Metataxanomics、鳥槍法打斷全基因組DNA序列的Metagenomics和基於mRNA信息的宏轉錄組方法
  • 湯富酬課題組與合作者開發出單細胞轉錄組三代單分子測序新方法
    而人類轉錄組中轉錄本的長度普遍在1000bp以上,有些轉錄本長度甚至超過100kb(Piovesan et al., 2016; Frankish et al., 2019),遠遠超過二代測序方法所能檢測的最大讀長。
  • 轉錄組層面上研究蛋白質-RNA相互作用的技術及方法綜
    兩周前,小編給大家推薦了清華大學張強峰教授在QB期刊上發表的關於轉錄組層面上研究RNA-RNA相互作用的乾濕實驗方法的綜述文章後(點擊這裡進入該篇文章),引起了許多小夥伴的關注。並且也有小夥伴問,RNA在轉錄組層面上的相互作用不僅有RNA-RNA之間的,應該還有蛋白質-RNA之間的相互作用呢!
  • 高歌團隊發布單細胞轉錄組數據檢索新方法和參考資料庫
    若能有效利用現有的單細胞數據進行檢索與推斷,研究者便能更好地進行新測序單細胞的注釋,以及綜合多數據集的研究。然而,精確的單細胞轉錄組數據檢索和注釋需要克服兩個挑戰:一、數據集之間的批次效應(batch effect)會顯著影響細胞檢索的可靠性;二、目前缺少跨物種和平臺、具有高質量注釋的單細胞轉錄組資料庫。
  • 規模最大人類器官轉錄組計劃公布第三階段成果 ——來自死亡個體的...
    值得一提的是,GTEx數據被廣泛用作設計新方法和工具的參考數據集,由此衍生出大量便於更深入研究的統計學方法。為生活中的「小煩惱」尋找關聯基因這裡有每個人的小憂慮,歡迎「對號入座」——如果你還沒到成為中年油膩男的年紀,或許正在擔心:為什麼我的髮際線在不斷升高;如果你是位壓力山大的職場女性,或許正在擔心:去年體檢的乳腺結節不知道怎麼樣了,據說乳腺癌患病率很高;如果你是名新手寶媽,或許正在擔心:我家娃超重了!
  • 利用轉錄組學方法揭示南荻群體遺傳
    近日,中國科學院武漢植物園閆娟博士在李建強和桑濤研究員的指導下,根據以往對南荻生理生態及群體遺傳的研究,揭示利用轉錄組學方法研究群體遺傳,可以捕獲群體內和群體間遺傳變異和表達變異的微弱信號,並對植物在不同環境條件下進行的遺傳水平響應有了整體認識,更清晰地闡明植物群體進化的適應性和非適應性過程,研究結果在線發表於《分子生態學》上。
  • 顛覆先前的認知,首次系統獲得新冠病毒轉錄組及表觀轉錄組學數據
    儘管最近報導了SARS-CoV-2基因組,但其轉錄組結構尚不清楚。2020年4月8日,韓國基礎科學研究所Dongwan Kim等人在Cell 在線發表題為「The architecture of SARS-CoV-2 transcriptome」的研究論文,該研究利用兩種互補的測序技術,展示了SARS-CoV-2轉錄組和表觀轉錄組的高解析度圖。
  • 轉錄組做得不過癮?帶你走進翻譯組的神奇世界
    隨著高通量測序技術的發展,轉錄組測序已走入科研「尋常百姓家」,每個實驗室大概都有師兄師姐曾測過十個八個的轉錄組吧。但是,看遍了千篇一律的差異基因聚類圖,是不是想換點新花樣?面對日益競爭的科研壓力,是否應該為課題研究找到新的方向和切入點?承啟生物給各位看官呈上一份翻譯組的盛宴,讓大家對翻譯調控這一「調控之王」有一定的了解。
  • Mol Cell:整合子或能作為人類轉錄組的「守護者」
    通過類比,基因組的轉錄或許是一個並不完美的過程,其會產生大量的非功能性和潛在的有害轉錄物(無論在傳統基因內部還是外部都是如此)。RNA聚合酶II酶能夠轉錄機體大部分基因,同時還能從多個非遺傳區域產生廣泛的轉錄物;在過去10年裡,科學家們越來越清楚地認識到,這種酶的起始位點相對混亂,而且轉錄起始位點散布在基因組的各個區域;然而,並非所有這些位點都與「合適的」基因有關,這需要特定的基因定義的元件存在。
  • 利用sci-CAR方法同時分析上千個細胞中的轉錄組...
    2018年9月6日/生物谷BIOON/---不同細胞類型的基因組可能是相同的,但是它們的表觀基因組和轉錄組不是相同的。表觀基因組由一組影響每個細胞的基因組發揮何種功能的標記組成,而轉錄組指的是在某一特定條件下,細胞內所有轉錄產物的集合。轉錄產物經翻譯後會產生蛋白。
  • 經典解析—SmallRNA轉錄組測序
    小博發現,SmallRNA轉錄組測序近期備受小夥伴們的恩寵。那麼,今天小博就跟大家解析一下SmallRNA轉錄組測序吧。Small RNA轉錄組測序是鑑定和定量解析small RNA的新方法和有力工具。
  • 空間轉錄組研究將對基因測序領域帶來的三大影響及作用
    雖然暫時還無法精細到單細胞層面,但是這樣的區域劃分也已經足以展現出組織內部不同區域間的轉錄組差異。 2.不影響對全組織進行全面分析:晶片上捕獲的全轉錄組在同一個反應中完成測序,能有效降低多次重複實驗中的誤差。測序結果如果不按照條形碼歸類,則直接體現的是切片全組織的轉錄組情況,無需再做單獨檢測。
  • 【Webinar】諾禾致源空間轉錄組——給新藥研發更多「空間」
    2020 年 8 月 28 日,15 : 00 - 16 : 00諾禾致源空間轉錄組