前言
2020 年 8 月 27 日,歐易生物與中南大學基礎醫學院法醫系主任郭亞東課題組合作項目,以題為「Chromosome‐level de novo genome assembly of Sarcophaga peregrina provides insights into the evolutionary adaptation of flesh flies」發表在 Molecular Ecology Resources (IF: 6.286),該研究首次獲得了棕尾別麻蠅高質量的參考基因組,該基因組將有助於肉蠅的適應性進化和系統發育研究。
中南大學基礎醫學院任立品博士為第一作者,文章中基因組組裝和比較基因組分析由歐易生物協助完成。
研究背景
棕尾別麻蠅(Sarcophaga peregrina),俗稱肉蠅,隸屬於雙翅目麻蠅科,常以腐肉為食,其生態習性與人類生活密切相關。由於其特殊的繁殖方式(卵胎生/卵寄生),麻蠅在與腐爛屍體相關的法醫調查中發揮著至關重要的作用。同時麻蠅也具有重要的生態學作用,可以作為人類和牲畜腸道傳染病和寄生蟲的媒介之一。目前麻蠅科內物種基因組信息較少,制約了這一類重要物種的研究。
研究技術
材料:野生棕尾別麻蠅近交 6 代後,用於進行基因組 de novo 測序
測序技術:Illumina,PacBio (110x),Hi-C (300x)
研究結果
1. 基因組測序和組裝
經流式細胞儀檢測計算,棕尾別麻蠅基因組大小約為 529.7 Mb;基因組 survey 測序預估雜合度為 2.92%,組裝之後 GATK 進行 SNP calling,雜合率為 1.65%。
利用 PacBio 獲得了 57.83 Gb subreads (subreads N50 = 13.90 Kb),subreads 經過 Canu v1.6 組裝並經Arrow v 2.1.0 polish 後,獲得的棕尾別麻蠅基因組大小為 560.31 Mb,Contig N50 = 3.84 Mb。通過 BUSCO 評估,組裝出了 97.1% 的完整單拷貝基因。
結合 Hi-C 數據,利用 Juicer 和 3D-DNA 進行染色體掛載,最終獲得的基因組大小為 548.19 Mb,掛載到6條染色體,掛載率為97.96%,BUSCO 評估顯示組裝出了 97.4% 的完整單拷貝基因,說明組裝結果比較完整。
圖片說明:棕尾別麻蠅基因組的組裝統計
圖片說明:棕尾別麻蠅全基因組(包含6條染色體)Hi-C 互作熱圖
圖片說明:棕尾別麻蠅與黑腹果蠅的基因組共線性比較
2. 基因注釋
利用 Augustus v3.0、SNAP、GlimmerHMM、GeneID 進行基因結構的 de novo 預測,通過結合轉錄組測序數據利用 PASA 和 TopHat 進行基因結構的預測,並利用 EVidenceModeler 進行基因模型的整合。最終獲得 15,710 個基因(其中 14,476 個蛋白編碼基因),平均每個基因含有 3.94 個外顯子,平均轉錄本長度、CDS 長度、外顯子長度分別為 7635.25 bp、1404.03 bp、356.4 bp。通過與 NR、Swissprot、TrEMBL、KEGG、KOG、GO、Pfam、InterProscan 資料庫比對進行了基因的注釋。通過 Rfam、TRNAscan-SE、RNAmmer,對 miRNAs、rRNAs、snRNAs、tRNAs 進行注釋。
為了識別串聯重複序列和轉座元件,使用 RepeatMasker、RepeatProteinMask 和Tandem Repeat Finder 對重複序列進行注釋。結果顯示重複序列約佔棕尾別麻蠅基因組 45.70%,其中 DNA 轉座子約佔 12.35%。同時利用 MicroSAtellite Identificaiton Tool 在基因組中鑑別到 456,324 個 SSRs。
3. 基因家族鑑定和系統發育分析
使用 DIAMOND,將蚊科的埃及伊蚊和甘比亞伊蚊,棕尾別麻蠅和其他 9 種雙翅目物種蛋白質序列進行比對,使用 OrthoFinder 進行比對結果的聚類。結果顯示,在棕尾別麻蠅中共鑑別到 9,636 個基因家族(包含 13,039 個基因),其中 13 個基因家族(106 個基因)是該物種所特有的。
圖片說明:棕尾別麻蠅基因家族鑑定結果
通過 MAFFT 和 Gbolcks 對 5,622 個單拷貝基因家族進行比對,利用 RAxML 進行系統進化樹構建,利用 MCMCTREE 估計分化時間,結果顯示 8 種蠅類聚集成一個大支,麻蠅科和麗蠅科親緣關係最近,它們之間的估計分化時間為 32.53 百萬年。而在麻蠅科內,棕尾別麻蠅和 S. bullata 親緣關係最近,它們約在 7.14 百萬年之間從共同祖先分化而來。
4. 基因家族的擴張與收縮
利用 Computational Analysis of Gene Family Evolution(CAFE) 進行基因家族的擴張與收縮分析,結果顯示 1,191 個基因家族發生收縮、568 個基因家族發生擴張,這些基因主要參與水解酶合成、胺基酸代謝、脂肪酸合成酶活性等信號通路。692 個基因受到了正選擇,它們主要參與脂肪酸α-羥化酶活性、表皮形態發生、轉移酶活性等。
圖片說明:棕尾別麻蠅的基因家族擴張與收縮分析結果
研究結論
本研究首次組裝獲得了棕尾別麻蠅染色體水平的基因組,基因組結構和功能分析揭示了肉蠅系統發育的多樣性。該基因組不僅為揭示棕尾別麻蠅和其他食腐肉物種的適應性進化提供了重要的資源,也為進一步研究昆蟲進化在大規模系統發育工程中的應用填補了空白。
參考文獻
Ren L, Shang Y, Yang L, et al. Chromosome-level de novo genome assembly of Sarcophaga peregrina provides insights into the evolutionary adaptation of flesh flies. Mol Ecol Resour2020; doi: 10.1111/1755-0998.13246.
END
本文系歐易生物原創
轉載請註明本文轉自歐易生物