使用CNVnator進行CNV檢測

2020-10-18 生信修煉手冊

CNVnator是一款CNV檢測軟體,基於Read-Depth的分析策略,通過對全基因組測序數據進行分析來預測CNV, 原始碼保存在github上,網址如下

https://github.com/abyzovlab/CNVnator

這個軟體的安裝比較複雜,我這裡直接使用別人裝好的docker鏡像進行處理,這也是docker的方便之處,直接從源中下載別人已經裝好的cnvnator的鏡像,代碼如下

docker pull diploid/cnvnator

具體的分析步驟如下

1.  EXTRACTING READ MAPPING FROM BAM/SAM FILES

CNVnator中依賴ROOT這個軟體包,這個軟體包是專門針對大數據的處理進行開發的,提供了統計分析,可視化,數據存儲等一系列功能,基於這個體系可以極大的加快運行速度,所以將原始的信息都存在root文件中,便於分析。

這一步將比對的信息存儲到後綴為root的文件中,代碼如下

cnvnator -root file.root -tree chr1.bam -chrom 1

-tree參數指定輸入的bam文件的名稱,-root文件指定輸出的root文件的名稱,-chrom指定需要分析的染色體,默認情況下分析所有的染色體,這裡我是測試,只分析了1號染色體。

2.  GENERATING A READ DEPTH HISTOGRAM

這一步是按照固定大小的窗口對基因組進行劃分,統計每個窗口內的read depth, 代碼如下

cnvnator -root file.root -his 1000 -chrom 1 -d genome_fa_dir

-his參數指定窗口的大小,單位為bp, -d參數指定參考基因組fasta文件所在的目錄。

3.  CALCULATING STATISTICS

這一步是必須的,代碼如下

cnvnator -root file.root -stat 1000

-stat指定窗口的大小,和第二步的-his參數的取值相同。

4. Partition

這一步進行segmentation,代碼如下

cnvnator -root file.root -partition 1000

-partition指定窗口的大小,和第二步的-his參數的取值相同。

5. Call CNVs

這一步分析每個segment區域的CNV, 代碼如下

cnvnator -root file.root -call 1000 > cnv.call.txt

-call指定窗口的大小,和第二步的-his參數的取值相同, 輸出結果默認列印到屏幕上,這裡重定向到文件中。

輸出文件的內容如下

第一列為CNV的類型,包括了deletion和duplication兩種類型,第二列為CNV的染色體區域,第三列為CNV的長度,第四列為歸一化之後的read depth, 歸一化到0-1的範圍,第五列到第八列為不同的evalue值,最後一類為q0,  後五列對應的解釋如下

對於原始的cnv call的輸出,還可以通過軟體自帶的腳本轉換為VCF格式,代碼如下

cnvnator2VCF.pl cnv.call.txt >cnv.vcf

CNVnator的功能強大,運行速度快,更多用法請參考官方文檔。

·end·

相關焦點

  • WES的CNV分析簡介
    所以WES的CNV檢測經典的用處就是檢測體細胞CNV,即SCNA變異,提供配對的癌和癌旁樣本來進行分析。和WGS的一致性採用了cnvnator和ERDS兩款軟體對WGS數據進行CNV檢測,然後和WES的結果進行一致性分析,以exon為單位進行評估,當一個exon 50%以上的區域落在CNV區域時進行計算,比較不同軟體檢測到的exon和WGS數據exon的overlap情況,結果如下
  • 單細胞轉錄組高級分析四:scRNA數據推斷CNV
    inferCNV是大名鼎鼎的broad研究所開發的,可以使用單細胞轉錄組數據分析腫瘤細胞CNV。相關文章2014年就發表在了Science上,之後算法不斷優化,分析結果也多次刊登在CNS文章上。原始數據進行標準化處理,去除測序深度不同造成的差異,結果是流程圖中的第1個熱圖;依據上文「分析原理」提到的公式把基因表達值轉換為
  • CNS圖表復現16—inferCNV結果解讀及利用
    現在最重要的目標就是根據這個圖表或者說inferCNV的結果文件,把上皮細胞裡面那些惡性的部分挑選出來,可以跟文章挑選好的進行對比。或者跟我們前面的上皮細胞聚類的結果進行對比!首先查看inferCNV結果文件夾,可以看到每個步驟的中間文件,都是保存下來了的:01_incoming_data.infercnv_obj02_reduced_by_cutoff.infercnv_obj03_normalized_by_depth.infercnv_obj
  • CNV檢測技術發展史,戲說
    這樣只要看看一個細胞裡面有沒有螢光信號,有幾個螢光信號就能檢測那些50,000~1,000,000的片段有沒有、有幾個了。這個方法跟釣魚差不多,就是大名鼎鼎的FISH技術了,直到現在依然是CNV檢測的細胞學金標準技術。雖說科學家們手上有不同位置的成百萬個染色體片段可以作為餌料來釣魚執法,看看想要檢測的細胞到底有沒有問題。
  • 是否考慮使用XRF進行內控檢測?
    XRF內控檢測的優勢節省時間節省運輸時間這一點相當明顯,進行XRF測量確實需要花費一些時間,但僅僅是幾分鐘,而非幾天。且若您能確保所有測試過程都在組織內部進行,您就可極大地減少標準生產時間。若能在組織內部進行測試過程,就可以按計劃發貨。更快地解決問題XRF測量結果可快速讓您知曉工藝(甚至基材)是否有任何問題。等到您從測試公司得知這一消息,然後再努力找到問題,便會耽誤解決問題的時間。儘管讓您的工藝恢復正常可能仍然是一項挑戰,但是如果能在組織內部進行測量,就能更快地找到根本原因並恢復正常工作。
  • 基於SNP晶片進行CNV分析中的基本知識點
    檢測CNV有多種技術手段,常見的有以下三種aCGH晶片SNP晶片NGS測序本文主要介紹SNP晶片檢測CNV的原理,本質是基於染色體區域內的SNP分型結果來判斷對應的拷貝數,示意圖如下LRRLRR全稱是log R ratio, 公式如下R代表的是A和B兩個allel螢光信號強度的總和,observed是實驗樣本中實際檢測到的數值,exprected是通過算法擬合的值,代表正常樣本的檢測值。
  • 使用Yolov5進行端到端對象檢測
    在本文中,我們不探討YOLOv5這個名字是否正規,我們只使用YOLOv5創建一個檢測模型,從創建數據集和注釋到使用它們出色的庫進行訓練和推斷。我們還使用它創建了一些其他文件,但在本例中不會使用它們。一旦我們完成了這些操作,我們就基本上建立了自定義數據集,並且只需要重新安排這些文件中的一些,以便在以後訓練模型時進行後續的訓練和驗證分割。
  • CNV解讀-CNV基本概念
    3). CNV常用檢測方法    CNV常用檢測方法有多種,這裡主要分享高通量的檢測方法。1). 比較基因組雜交晶片aCGH    將等量的待測DNA和正常對照DNA分別用紅色和綠色螢光染料標記,混合,然後與全基因組DNA晶片進行競爭性雜交。雜交後的晶片經雷射掃描,比較每個點紅光和綠光的發光強度。
  • TCGA CNV全攻略
    ,然後你就會看到下面兩個截然不同的:Merge_snp__genome_wide_snp_6__broad_mit_edu__Level_3__segmented_scna_hg19__seg Merge_snp__genome_wide_snp_6__broad_mit_edu__Level_3__segmented_scna_minus_germline_cnv_hg19
  • 使用Python,Keras和OpenCV進行實時面部活體檢測
    2.人臉活性檢測提醒一下,我們的目標是在某一時刻檢測到眨眼動作。我訓練了一個卷積神經網絡來區分眼睛是睜著還是閉著。選擇的機器學習模型是LeNet-5,該機器學習模型已經在Closed Eyes In The Wild(CEW)數據集上進行了訓練。它由大約4800張24x24大小的眼睛圖像組成。
  • 使用模板匹配在Python上進行對象檢測!(附代碼)
    了解如何在沒有機器學習或任何框架的情況下在Python上進行對象檢測每當我們聽說「 對象檢測 」時,我們就會想到機器學習以及不同的框架。但是我們實際上可以在不使用機器學習或任何其他框架的情況下進行對象檢測。在本文中,我將向您展示如何僅使用Python進行操作。
  • 16p13.11的CNV,臨床意義如何看?
    我感覺這是由於cnv的解讀質量目前並無相關的監督引起的吧,可能實驗室覺得解讀不規範還有遺傳諮詢師盯著啊,而且解讀偏嚴重最多就是產前引產了一些胎兒而已,沒出生就肯定沒什麼醫療問題,因此家屬不太可能來找麻煩,沒有家屬鬧事,科室太平無事醫院才不會管你那點破事。
  • 使用In-Sight 7000 視覺系統對汽車儀錶盤進行全面高效檢測
    使用In-Sight 7000 視覺系統對汽車儀錶盤進行全面高效檢測 作者:51Touch時間:2019-01-30 來源:觸控螢幕與OLED網     北京時間01月30日消息,中國觸控螢幕網訊,哈爾濱航天科技控股集團股份有限公司
  • 使用LBA分析方法進行大分子生物標誌物的定量檢測分析
    隨著醫藥產業的快速發展,產品研發效率和安全性越來越成為醫藥研發中關注的重點,很多傳統藥企和新興的生物技術公司往往會在藥物研發過程中使用生物標誌物以加速藥物研發進程和確保產品安全性。在對生物標誌物的檢測上,使用商業化的試劑盒可以說是目前大部分企業的首選。
  • 簡化電流感應:如何使用電流檢測放大器進行設計(三)
    電流控制反饋環路中使用的電流測量可以將電磁閥在整個溫度範圍內的阻抗變化從 40% 降低至 0.2%(使用 INA240 電流檢測放大器)。INA240 是一款高側雙向電流檢測放大器,可支持 -4V至 +80V 的大共模電壓。INA240 採用可抑制 dv/dt 信號的電路,專為在脈寬調製 (PWM) 應用中工作而設計。
  • 簡化電流感應,如何使用電流檢測放大器進行設計(一)
    目錄本文引用地址:http://www.eepw.com.cn/article/202001/409291.htm第1章:電流檢測概述,集成電阻器電流傳感器如何簡化PCB設計(√)多通道電流監測的常見用途使用數字電流傳感器進行功耗和能耗監測
  • 教你怎麼使用萬用表進行家居常用檢測
    千萬個電工應該都有萬用表在使用,它相當於電工的眼睛,可以避免被電擊,也可以幫我們維護設備排除故障。有些人用壞過多個萬用表,有些人一直使用同一個表很多年,因為使用方法會造成儀表的損毀。數字萬用表的表筆使用我們使用萬用表基本就是檢測電壓,電流及電阻的大小,我們分別介紹一下使用時,插孔是否正確,怎麼操作才會避免危險。
  • 新技術使用智慧型手機進行DNA檢測
    2020年5月12日訊 /生物谷BIOON /——中國幾家機構和美國一家機構的研究團隊已經開發出了POCKET DNA測試套件,這是一種小型、廉價的系統,使用3D列印集成晶片和智慧型手機對各種材料的小樣本進行DNA測試。在他們發表在Science Advances雜誌上的論文中,該小組描述了該系統及其可能的用途。
  • 簡化電流感應,如何使用電流檢測放大器進行設計(五)
    採用電阻器的共模電壓分壓器監測高壓高側電流檢測的最簡單方法是在設計中採用具有外部輸入電壓分壓器的低壓電流檢測放大器。例如,如果您為 80V 應用選擇 40V 共模電壓放大器,則需要將 80V 輸入共模電壓拆分為 40V 共模電壓。您可以使用外部電阻分壓器來拆分該電壓,如圖 1 所示。
  • Python代碼使用OpenCV進行Blob檢測|blob|opencv|二進位|算法_網易...
    blob是圖像中一組共享的區域,它們具有一些共同的屬性(例如灰度值,形狀,尺寸等)blob檢測的目的是識別並標記一些特定區域,blob檢測在自動化工業領域比較常見。  OpenCV提供了一種方便的方法來檢測blob並根據不同的特徵對其進行過濾。