外顯子技術是僅次於轉錄組的熱門 NGS 應用,尤其是在腫瘤研究方向,大量的癌症多組學隊列其實就是轉錄組加上外顯子而已。實際上並沒有專門的腫瘤轉錄組教程系列,但是腫瘤外顯子卻不然,如果大家三年前追過我的直播基因組活動,就應該知道同樣是DNA層面的測序,全基因組,外顯子組還有捕獲基因靶向測序,在腫瘤研究裡面不僅僅是找跟參考基因組不一樣的位點,就是所謂的變異位點而已。
腫瘤外顯子實驗設計裡面通常是對一個病人既測序其腫瘤組織又測序其正常組織(癌旁或者血液),這樣的話,分析流程裡面就需要分別獨立比對到參考基因組,然後篩選出那些出現在腫瘤組織裡面卻並沒有出現在同一個病人組織裡面的那些突變,就是我們所說的體細胞突變。雖然,目前我的B站74小時視頻並沒有腫瘤外顯子視頻教學課程,但是已有的WES視頻教學教程,加上我這幾年在生信技能樹陸陸續續寫的腫瘤相關教程,還有菜鳥團的腫瘤外顯子數據處理系列教程,目前整理到了https://www.yuque.com/biotrainee/wes 知識庫,已經足夠大家學會啦。為此,我奉上習題一套,大家如果做完這個小作業沒有問題就說明大家掌握了基礎的腫瘤外顯子分析流程了哦。
step1:讀文獻文章:A Targetable EGFR-Dependent Tumor-Initiating Program in Breast Cancer
自行搜索了解一些背景知識:
epidermalgrowth factor receptor (EGFR)
EGFR inhibition by gefitinib
triple-negative breast cancer (TNBC)
patient-derived xenografts (PDXs)
Deep single-cell RNAsequencing of 3,500 cells
主要是關注實驗設計
作者製作了一批TNBCs (成功率15/18)的PDX模型,然後用這些模型來測試其對 EGFR inhibitor gefitinib 敏感情況。前人報導該藥物在TNBC病人裡面有效率是38.7%,與他們的實驗想符合(6/18), 但是其中有一個人的反映比較特殊,就是 GCRC1735, 一個70歲的老奶奶,該藥物治療效果出奇的好。 所以就對這個老奶奶的腫瘤組織進行一系列的NGS探索。基因檢測表明該老奶奶有一個 pathogenic BRCA1 mutation (p.C1225Sfs) 和a somatic TP53 alteration (p.R249T) ,而EGFR基因上面既沒有突變也沒有拷貝數變異,EGFR 這個通路相關的基因也沒有太大的異常。
step2:查看測序數據數據都在SRA資料庫裡面, https://trace.ncbi.nlm.nih.gov/Traces/study/?acc=SRP100090 (bulk的外顯子和轉錄組測序),我們這個題目僅僅是關心腫瘤外顯子數據,如下:
在SRA資料庫下載比較慢,建議直接去EBI資料庫搜索並且下載即可。
step3:構建腫瘤外顯子流程環境主要是相關軟體和資料庫,其中軟體可以conda進行管理,GATK建議最新版,資料庫的話,下載會非常耗費時間。建議大家自行看視頻,慢慢學咯:https://space.bilibili.com/338686099/channel/detail?cid=94251
step4:跑SNV和CNV流程基本上參考我們菜鳥團的腫瘤外顯子數據處理系列教程即可,可以在https://www.yuque.com/biotrainee/wes 知識庫查看,或者看下面的目錄:
step5:重複出來SNV表格和IGV截圖文章附件有SNV列表,如下:
然後其中一個IGV截圖需要大家復現:
step6:看具體區域的CNV情況同樣的,查看指定區域的CNV情況,如下:
step7:SNV和CNV的基因列表和EGFR通路基因取交集如下所示:
step8:腫瘤組織的SNV和PDX模型的SNV的VAF散點圖在文章附件裡面有SNV列表,所以可以直接導入R裡面自行繪製散點圖,如下:
當然了,我們的作業是要求大家自行下載fq測序數據後走腫瘤外顯子流程,然後對自己得到的SNV列表進行繪製上面的腫瘤組織的SNV和PDX模型的SNV的VAF散點圖!
如果你獨立完成了作業,可以發你的筆記到我郵箱(jmzeng1314@163.com),如果你也對學徒培養感興趣,想在我們的指導下完成腫瘤外顯子等NGS數據分析,可以先看看我是如何培養學徒的:
當然了,學徒培養看緣分!(閱讀原文是我們昨天在生信菜鳥團推出的語雀知識庫哦)
不點讚也不打賞,為什麼呢?