在我們進行作物育種研究的時候,很多作物,尤其是野生型的材料,多為outcrossing, 比如Brassica rapa和 Brassica oleracea由於自交不親和,其野生型材料的群體只能通過outcrossing獲得種子。除此之外,木薯,甘薯,茶樹,一些果樹等也是outcrossing植物。outcrossing的作物通常情況下很難通過自交獲得種子,其結果導致每個單株的基因組都是高度雜合,一對親本雜交後代的個體之間的基因型差異很大,而且很難獲得純合基因型,從而在遺傳上非常複雜,進行分子遺傳研究非常困難。此外,還有一些作物屬於多倍體,比如Striga hermonthica, 就是一個野生的outcrossing的異源四倍體植物,其遺傳研究很難。
為了解決這一困難,1月8日,Molecular Plant介紹一種新的方法:OutcrossSeq,能夠很好的提高outcrossing作物的基因分型,定位和遺傳育種的效率。該軟體大家可以通過如下連結獲得:
www.xhhuanglab.cn/tool/OutcrossSeq.html.
https://github.com/xhhuanglab/OutcrossSeq
1.OutcrossSeq pipeline
OutcrossSeq pipeline主要分為三個過程:sequencing,genotyping, and genetic mapping。如下圖:
sequencing:作者設計了用Tn5酶構建文庫進行多重測序。
genotyping:作者主要用GATK-pipeline進行 variants calling。筆者也曾介紹GATK-pipeline的使用。
GATK pipeline鑑定基因組變異的scripts
GATK 4.0 pipeline calling SNP
GATK 4.0 pipeline calling SNP更新
genetic mapping:GACD, MapQTL, QTLpoly and fastGWA等方法構建遺傳圖譜。
2. OutcrossSeq的幾個應用實例
作者舉了一些實用實例。
2.1 使用OutcrossSeq對核桃樹進行測序,單倍型分析和遺傳定位
2.2 兩個雜交水稻品種雜交後代的單倍型和致病基因的鑑定
2.3 用於多倍體植物的OutcrossSeq
2.4 使用OutcrossSeq對甘薯的農藝性狀和基因表達進行全基因組定位
3.軟體安裝
git clone https://github.com/xhhuanglab/OutcrossSeq.gitcd OutcrossSeq#list three modulesls #autopolyploid_crop diploid_outcrossing_species double_cross_populations readme.md3.1二倍體雜交模塊
過濾低質量variants
cd /OutcrossSeq/diploid_outcrossing_speciesperl diploid_cross_Genotype_filter.pl 5 parent1 parent2 100 0.6 demo_diploid 0.3計算每個窗口中每個樣本的kinship
perl diploid_cross_step1.pl 100000 1000 F1-chr5.geno 5 0.35clustering每個window
perl diploid_cross_step2.pl 5 60 0.35Haplotying across the chromosome
perl diploid_cross_step3.pl 5生成genotype文件
perl diploid_cross_step4.pl 5 5 demo3.2Double-Cross模型
過濾低質量variants
cd /OutcrossSeq/double_cross_populationsperl double_cross_Genotype_filter.pl demo_double 100 16 17 18 19Determine the genotype of the first allele
perl double_cross_step1.pl demo_double_parent.geno demo_double_offspring.geno 100000 5 1 6Determine the genotype of the second allele
perl double_cross_step2.pl demo_double_parent.geno demo_double_offspring.geno 100000 5 1 6Generate the genotype file
perl double_cross_step3.pl 5 5 6 1000003.3Autopolyploid Plant 模型
Select simplex or double-simplex SNPs
perl autopolyploid_Genotype_filter_step1.pl demo_autopolyploid-Parents 100 0.08 1Transform .vcf to .geno file
perl autopolyploid_Genotype_filter_step2.pl 5 demo_autopolyploid Parent1 Parent2Filter low-quality and error ratio sites
perl autopolyploid_step1.pl 5 demo_autopolyploidSelect relevant sites
perl autopolyploid_step2.pl select-demo_autopolyploid 5 50 0.9 3 100Select mark readsNum
perl autopolyploid_step3.pl demo_autopolyploid-readsNum.txt R2-select-demo_autopolyploidImputation missing SNPs
perl autopolyploid_step4.pl 5 R2-select-demo_autopolyploid-readsNum.txt R2-select-demo_autopolyploid.txtMerge genotype files
perl autopolyploid_step5.pl 5 5作者在文章中有非常詳細的介紹關於這個pipelien的應用。如果你正在做相關作物的研究,可以參考這個方法。
參考文獻:
Chen M#, Fan W#, Ji F#, Hua H, Liu J, Yan M, Ma Q, Fan J, Wan Q, Zhang S, Liu G, Sun Z, Tian C, Zhao F, Zheng J, Zhang Q, Chen J, Qiu J, Wei X, Chen Z, Zhang P*,Pei D*, Yang J*, Huang X*. Genome-wide Identification of Agronomically Important Genes in Outcrossing Crops using OutcrossSeq. Mol. Plant. doi: 10.1016/j.molp.2021.01.003 (2021). [link]