各種坑,各種填 | RNA velocity of single cells

2021-03-01 協和小卒

基於其剪接和未剪接的信使 RNA 的比例,計算出一個稱為 RNA 速度的量,用以揭示基因表達的變化方式。

圖片來源:velocyto

2018年,Karolinska研究所和哈佛醫學院的研究人員在《自然》雜誌上報告了一種捕獲單個細胞動態過程的技術。截至目前,該文章的引用已經到達 377,可見其在揭示一些生物學問題層面還是非常受歡迎的

圖片來源:Nature

那麼如何利用單細胞數據進行該分析呢?今天我們就來聊一下 10X genomic 數據的分析流程。

Cellranger 預處理10X genomic 數據

10X genomic 數據的預處理是用 cellranger 軟體完成的,完成這一步之後會得到一個包含所有分析結果的文件夾,而這個文件夾就是你要做 RNA velocity 的基礎。

velocyto 的安裝

velocyto 目前有兩種不同的實現方式:R 和 Python

鑑於 Python 的流程耗時較少,以下就以該平臺為準。

圖片來源:velocyto

Python 的介紹頁如下圖所示:

圖片來源:velocyto

接下來就是安裝 velocyto,需要注意的是,velocyto 的運行基於 3.6 或更高的 python 版本,然後就是安裝:

pip install velocyto

安裝成功之後,在終端輸入 velocyto,會出現以下界面:

圖片來源:velocyto

在正式分析之前,還有兩個準備工作需要完成:

1、基因注釋文件的下載,這個可以自己在 GENCODE 或 Ensembl 上下載,不過如果你用的是 cellranger 流程,那麼它本身的注釋文件中就包含,位置在: ~/refdata-cellranger-GRCh38-3.0.0/genes/genes.gtf

2、 下載  「expressed repeats annotation

圖片來源:velocyto

其實第二步的這個是比較坑的,我在這個上面耽誤了好長時間。首先轉到 UCSC 的界面,在這裡有幾點需要注意,以下我標註上了紅框:

圖片來源:UCSC

下載結束之後我就上傳到伺服器去做分析,代碼很簡單,只有一行:

velocyto run10x -m ~/mm10_rmsk.gtf ~/results/sample/ ~/reference/refdata-cellranger-GRCh38-3.0.0/genes/genes.gtf

但是屢屢報錯,錯誤信息如下:

圖片來源:操作截圖

百思不得其解,在 GitHub 上也把別人的建議都搞了一遍,還是無法解除 bug,在請教了幾個朋友之後,發現有個事情比較詭異,那就是我從 UCSC 上下載的文件只有幾十 M,而他們的卻都是 500 M 左右,我感覺是不是因為網絡原因,導致我下載的文件不完整呀。果然,我在github上也看到了有人提到過這一點:

圖片來源:Github

哎,又是網速(再次吐槽重點室的網速哈~),反覆下載之後,得到了一個 500 M 的文件,本以為這樣就可以愉快地分析了,結果仍然報錯:

圖片來源:操作截圖

查看資料之後,發現這個報錯要麼是自己 samtools 的版本太低,要麼就是分配的內存不夠。看了看 run10x 這個命令下有這樣一個參數 「--samtools-memory」,可以設置 sort bam 文件時可佔用的內存。

圖片來源:velocyto

幾經周折之後,終於看到了以下界面:

圖片來源:操作截圖

我最終用到的命令是:

velocyto run10x -m ~/mm10_rmsk.gtf ~/results/sample/ ~/reference/refdata-cellranger-GRCh38-3.0.0/genes/genes.gtf --samtools-memory 8000 -@ 20

運行成功之後,會在 cellranger 結果文件夾中多了一個以 velocyto 命名的文件夾,其中包含的是 loom 格式的結果文件

圖片來源:操作截圖

以上就是 velocyto 分析的第一步:產生 loom 格式的文件,這也是後續深入分析的基礎。在上述分析的過程中,看似簡單,但是也遇到了一些坑,希望自己遇到的這些坑能夠幫助到大家,也能夠節約大家的時間。

未完待續~

相關焦點

  • 10x轉錄組數據進行RNA velocity分析
    --dump N, saves a cell every N cells.velocyto run10x -m /data/yudonglin/velocity/mm10_rmsk.gtf /data/yudonglin/singlecell/ABFC20190816-04-分析結果/NoPro /data/yudonglin/velocity/refdata-gex-mm10-2020-A/genes
  • 細胞分化高級玩法——RNA velocity 分析,你 get 了嗎?
    RNA 速度 (RNA velocity),即細胞中 mRNA 分子豐度隨時間的變化,這種變化代表了細胞狀態的改變,可以通過未剪接和剪接 mRNA 豐度來估計。它是一種局部速度向量,可以在數小時的時間尺度上預測單個細胞的未來狀態。
  • 《最強蝸牛》:各種打不過,各種被按在地上摩擦
    測試服玩家(計費刪檔測試),非光子服玩家(抽獎,白蝌蚪等各種送包括代金券)。想入坑的萌新做好心理準備:這遊戲抽獎各種藍天白雲,好不容易吃個保底橙還是垃圾加速(組裝,克隆)或黑蝌蚪(可以理解為其他遊戲裡的金幣),橙珠4點幾概率的龍珠沒出一個,0點幾到2點幾的垃圾不要命的出。
  • 《使徒行者3》詐騙 以1為噱頭填2的坑 坑還越填越大
    《使徒行者3》的最後一集仿佛在被人追趕,很迅速的就結束了這一切,然後留有時間再度設置了懸念,那位紐西蘭的阿俠沒掛,劇情又回到了第三部的開頭,爆薛在問「阿釘在哪裡」,這個問題真是設置了一整季的懸念,讓人想吐槽《使徒行者3》詐騙,以《使徒行者1》為噱頭宣傳第三部,而第三部則填《
  • 《終極筆記》結局太坑,留下兩大遺憾,但填的這兩個坑,實在牽強
    文/小凡娛影導語:《終極筆記》結局太坑,留下兩大遺憾,但填的這兩個坑,太牽強了由曾舜晞、肖宇梁、成方旭等主演的《終極筆記》已經超前結局了,看完36集這個結局真是太坑了,如果沒有第二季,那就真的成了爛尾結局了,還是《重啟》的結局好些。
  • 那些年我們踩過的「坑」:淺談數據收集的各種效應(Effect)
    原創作者:胡婧煒在問卷調查中,設計者經常會遇到各種各樣的「坑」,一不小心就會犯錯誤。比如以下的各種效應(Effect)就是大量的研究者從他們做調查的經驗中總結出來的人們可能會踩的「坑」,讓我們來了解一下。
  • 老版《西遊記》雖然經典,卻也有四處誰也填不了的坑
    這個坑確實填不了。原著中的真實情況是,孫悟空打到靈霄殿外,被王靈官用金鞭抵住。此時叫嚷之聲驚動玉帝,遂傳旨請西方佛老伏魔。這裡可以看出玉帝是從容不迫的,根本沒有害怕!第二處,唐僧辭駕出長安。太宗李世民與唐三藏結為異姓兄弟,稱其為「御弟」。並言道「寧戀本鄉一捻土,莫愛他鄉萬兩金」,待唐僧不可謂不厚啊。
  • 新手玩草缸都會走的路,布滿各種坑,你的學費交了多少?
    【前言】如果你是一個初入草缸坑的小白,被各種美輪美奐的草缸造景吸引,你一定會夢想有一天,自己也能擁有一個ADA賽事級的草缸,甚至荷蘭風、中國風、日系風,各種風格的造景都能信手拈來。然後,你泡了幾天各大論壇,決心入坑草缸。隨即你到當地魚市或是登陸購物平臺,從魚缸開始,過濾、照明、底砂、CO2、各種添加劑、測試劑一通大採購。那麼恭喜你,你已經走在了交學費的路上。
  • 到最後一部了,這些坑該填了吧!
    但不知玄機該如何填那些之前挖下的萬年大坑呢?下面就來說一下玄機那些年挖下的大坑。 03墨家內奸之謎 這個墨家內奸是在第四部被李斯提及才被大家知道的,正是因為這個墨家內奸,才暴露了墨家據點的位置,從而讓蓋聶逍遙子以及墨家人陷入危機之中,但等到第五部完結,這個墨家內奸都沒有再被提及,不知道是玄機忘了還是不準備填坑了
  • 《無心法師3》打著嶽綺羅的幌子,卻沒能用心填坑!
    《無心法師3》打著嶽綺羅的幌子,卻沒能用心填坑!《無心法師3》終於迎來了大結局。雖然在《無心法師3》為《無心法師》系列填了不少坑,卻實在讓人無法喜歡!無心法師3除了嶽綺羅之外,關於青雲觀、無心的坑也是草草了事。
  • 研究人員發現了調節神經發生的特定環狀RNA
    多種基因在分化時上調或下調,產生神經元特異性蛋白和核糖核酸(RNAs),包括環狀rna (circRNAs)。這類環狀rna直到最近才逃脫了常規檢測,儘管這些分子在哺乳動物大腦中高度表達。然而,腦表達環狀rna的功能作用仍然是未知的。
  • lammps教程:velocity命令三種使用方法
    在lammps中,使用velocity命令設置原子的速度,命令格式為:velocity group-ID style args keyword value ...其中,group-ID指定哪一組原子將要被設置速度,style決定了速度設置的類型。
  • 魔獸世界:9.0暴雪又來填坑了,塑造了四年的大佬,9.0直接拉胯
    魔獸世界的劇情一直都是魔獸玩家津津樂道的話題,每次有重大資料片更新之後,就會引來無數劇情黨來探索新版本的劇情,以及上個版本暴雪留下來的大坑,所以9.0暴雪又填了什麼坑呢?今天就讓周卓帶領大家研究一下9.0暴雪的爛尾神操作吧,話不多說開始我們今天的BB!填坑一:蠱惑沃金的竟然是你這個狗賊?
  • 復聯4過去的星雲被殺死,接下來的坑漫威怎麼填?網友:還有銀護3
    導語: 復聯4過去的星雲被殺死,接下來的坑漫威怎麼填?網友:還有銀護3!點進來的小帥哥小仙女們,相遇便是緣分,歡迎閱讀小編的原創圖文消息,一起跟著小編進入屬於我們的影視世界吧!大家都知道死去的英雄不同於響指的化灰,是不能復活的,那星雲被殺死之後,這個坑漫威又該怎麼填呢?有網友表示,不是還有《銀河護衛隊3》嗎?我想這個坑包括復聯4中出現的坑,也只能在這部電影中來填了,畢竟復聯4已經是終局收官之作了!你覺得呢?歡迎在下方留言區留言,並且點讚評論加個關注吧!我們下期繼續不見不散!
  • 《愛情公寓1》中的1處bug,到第五季,被陳美嘉一句話填了坑
    《愛情公寓1》中的1處bug,到第五季,被陳美嘉一句話填了坑《愛情公寓》這部電視劇還真的是給大家帶來了非常多的歡喜,而且從頭到尾出現了非常多無釐頭的臺詞和表情,但是大家卻發現他們在裡面胡編亂造的東西,竟然在現實當中都會有相應的存在,讓很多人覺得這部電視劇的編劇根本就是神預言,而且在節目的最后里面
  • 譯馬網創始人張馬成:再創業三年 享受填「坑」的每一天
    再創業3年 每天都在填「坑」回想這3年的再創業經歷,張馬成感慨頗深,「從傳統的翻譯公司進入網際網路行業,而且國內並沒有對標的公司可借鑑,可以說我們每天都在『填坑』。」其中,技術人才和翻譯服務行業信息化程度偏低,可謂是譯馬網成長途中最關鍵的兩個「坑「。
  • non-coding RNA databases匯總
    自從1950s後期,rRNA和tRNA的發現以來,各種RNA也相繼被發現鑑定,RNA世界逐漸變得豐富多彩,同時非編碼世界的研究之門也逐漸在打開(見表1 ncRNA分類)。21世紀初期,通過對人類和小鼠基因組分析發現,98%的序列被劃分到「junk「 DNA之列,除被注釋的mRNA之外,大多收轉錄本似乎是不能encode蛋白質的,而這些轉錄本便是ncRNA, ncRNA因此也正式進入科學家的視野。
  • 北鬥衛星一箭雙星,格洛納斯卻失聯3顆,這是合作還是「填坑」?
    北鬥衛星一箭雙星,格洛納斯卻失聯3顆,這是合作還是「填坑」?