推送作者:董純豪,張立超,陳中旭
小麥研究者們一直在探索更加方便和快速的克隆方法。高密度SNP晶片(9K、15K、90K、55K、660K、35K、820K)的開發和應用,已為基因發掘和分子標記輔助育種做出了重要的貢獻[1]。隨著高通量測序(Next-Generation Sequencing,NGS)的發展,全基因組測序(whole-genome sequencing,WGS)、外顯子捕獲測序(exome capture sequencing)、轉錄組測序(RNA-Sequencing)、抗病基因富集測序(R gene enrichment sequencing,RenSeq)以及結合集群分離分析方法(Bulked segregant analysis,BSA)發展而來的混池測序技術為小麥基因克隆工作帶來了極大的便利[2]。
在小麥BSA分析中,全基因組測序成本高因而使用較少。低成本的混池轉錄組測序BSR-Seq對樣品要求較高,需要對特定時期、特定組織進行取樣,且只能檢測到組織中表達的基因。外顯子捕獲測序是一種成本較低,無特定組織限制的高通量分析方法,因而有著更廣泛的應用前景。
本研究結合集群分離分析和外顯子捕獲測序方法,豐富和發展了混池外顯子捕獲測序技術(Bulked segregant exome capture sequencing,BSE-Seq)。首先,基於中國春基因組序列信息(IWGSC RefSeq v1.0)設計了新的外顯子捕獲探針,同時提出了一種能夠在基因定位和SNP分析中有效降低背景噪音算法—varBScore,利用該策略成功克隆了一個調控小麥葉色的基因TaYGL1,並通過基因編輯手段對目標基因進行了驗證[3]。
外顯子探針設計
外顯子探針序列(表1)主要基於中國春IWGSC RefSeq v1.0基因組信息,覆蓋了299,387,477 bp的區域,包含兩方面內容:(1) 中國春RefSeq Annotation v1.1中107,891 個High Confidence 基因和161,537 個Low Confidence基因以及其5』UTR和3』UTR區域;(2)從NCBI公共資料庫下載並分析了2,600份轉錄組數據,將從中分析出的新的轉錄本也設計成探針序列。由於基因組序列中gaps和重複序列的存在,最終探針覆蓋了約277,596,390 bp區段。
表1. 新設計260Mb小麥外顯子探針序列信息
varBScore基本原理
在小麥這樣一個龐大的基因組中,極端表型混合池中存在著大量變異位點,測序過程或者reads比對參考基因組時比對錯誤引發的變異均能造成基因定位過程中的背景噪音,引起定位上的偏差。為了解決這個問題,我們提出了一個新的分析SNP的算法,varBScore,通過在滑動窗口中計算差異位點的實際基因頻率(observed allele frequency)和期望基因頻率(expected allele frequency)之間的方差來評估變異位點與候選基因之間的連鎖關係。不同於△SNP-index利用差值來反映變異位點與候選基因間的連鎖關係,使用方差計算更加靈敏。除此之外,針對不同的混合池組成,可以根據其遺傳背景設置其期望基因頻率,比如,由一對隱性等位基因控制的質量性狀,F2分離群體構建的混合池,顯性表型混合池包含兩種基因型(AA:Aa=1:2),那麼a的期望基因頻率為1/3;同理,隱性表型混合池包含一種基因型(aa),則a的期望基因頻率為1。理論上講,與候選基因越連鎖的差異位點的實際基因頻率越符合期望基因頻率,從而獲得更高的varBScore值(圖1)。
varBScore可以通過如下公式計算:
圖1. F2群體中實際基因頻率、期望基因頻率和varBScore之間的關係
BSE-Seq分析的技術流程
本研究利用一個葉片呈黃綠色的突變體材料ygl1對BSE-Seq的有效性進行了評估和驗證。突變體ygl1由偃展4110 經過EMS誘變獲得,遺傳分析表明葉色表型由一對隱性等位基因控制。利用百農3217×ygl1 F3中基因型純合材料分別構建混合池,按照圖2所示流程進行了BSE-Seq分析,利用varBScore算法分析發現在Chr7A染色體671Mb位置有明顯的峰值(圖3A-B),進一步按照如下篩選標準確定候選基因:(1) 野生型表型混合池與突變體表型混合池基因型存在差異;(2) 優先考慮EMS類型的變異,即C-T或G-A 類型;(3) 保留能夠引發錯義突變、提前終止、起始/終止密碼子缺失等類型變異;(4) 選擇公共資料庫以及我們研究中葉片顏色正常的其它材料構建「背景庫」,檢測前三步篩選到的SNPs在「背景庫」中的變異情況,重點保留突變體混合池中特異存在的變異位點,這樣能夠有效篩除由測序、reads比對、同源基因引起的變異類型。經過篩選,我們發現TraesCS7A02G480700基因編碼區第921位鹼基由G突變為A,引發了編碼胺基酸的變化,功能注釋表明該基因編碼鎂離子螯合酶I亞基(chloroplast magnesium-chelatase subunit ch1I),該基因突變可能引發葉色改變,因此將其確定為候選基因,並進一步通過基因編輯技術驗證了該基因是目的基因TaYGL1(圖4)。
圖2. BSE-Seq分析技術流程
圖3. varBScore分析結果
圖4. TaYGL1基因編輯株系基因型與表型
2020年8月13日,該研究成果以「Combining a new exome capture panel with an effective varBScore algorithm accelerates BSA-based gene cloning in wheat」為標題在Frontiers in Plant Science在線發表,中國農業科學院作物所董純豪博士、張立超副研究員以及成都天成未來科技有限公司陳中旭為共同第一作者,劉旭老師和孔秀英老師為共同通訊作者。該研究得到國家轉基因研究項目(2016ZX08009001-001-004)、國家重點研發計劃(2016YFD0101001)、中國農科院科技創新工程和天山創新團隊計劃支持(2020D14002)。特別感謝中國農業大學孫其信老師團隊饋贈基因編輯載體系統。
參考文獻
1. Sun, C., et al., The Wheat 660K SNP array demonstrates great potential for marker-assisted selection in polyploid wheat. Plant Biotechnol J, 2020. 18(6): p. 1354-1360.
2. Bettgenhaeuser, J. and S.G. Krattinger, Rapid gene cloning in cereals. Theoretical and Applied Genetics, 2019. 132(3):p. 699-711.
3. Dong, C., et al., Combining a New Exome Capture Panel With an Effective varBScore Algorithm Accelerates BSA-Based Gene Cloning in Wheat.Frontiers in Plant Science, 2020. 11: p. 1249.
掃描二維碼
關注我們
小麥族多組學網站:http://202.194.139.32
投稿、合作等郵箱:13148474750@163.com