基因組也有「體檢單」,趕緊了解一下

2021-02-18 安諾基因

體檢單小夥伴們肯定不陌生,身體好不好全由它說了算。同樣地,基因組也有自己的「體檢單」。「體檢單」的主要內容包括基因組的大小、GC含量、雜合度的高低以及重複序列的比例等。這些信息可為後期de novo測序和組裝策略的制定提供依據,這些基本信息的獲得需要通過基因組Survey分析來獲得。

基因組大小是基因組學研究的問題之一,其分析方法很多,K-mer分析是常用的評估基因組大小、重複與雜合的方法,基因組Suvey分析使用的就是K-mer分析。K-mer是指將一條長度為L的Read,連續切割,連續划動得到的(L-K+1 )個長度為K的核苷酸序列(圖2)。在基因組中,除由測序錯誤導致的低頻率K-mer外,K-mer的頻率與深度的分布應符合泊松分布。

 

圖1 K-mer序列

 

選取一定的測序數據使用jellyfish軟體進行K-mer分析,統計K-mer的頻率和深度信息。利用公式:基因組的大小(G)=K-num/K-depth可初步估計的基因組大小。其中K-num為全部K-mer的個數,K-depth為K-mer的期望深度(K-mer深度分布曲線的峰值對應的深度)。從K-mer曲線來看,如果主峰前約1/2位置有峰說明存在雜合,曲線存在拖尾說明存在一定比例的重複序列。對獲得的測序數據進行初步組裝,可以獲得物種的GC含量和判斷是否存在汙染。

先構建1-2個小片段文庫,測序深度為50X,文庫質檢合格後,進行高通量測序。完成測序後對下機數據進行如下分析:數據過濾、汙染分析、Survey的K-mer分析和Survey的組裝分析。具體分析流程如下圖:


圖2 基因組Survey分析流程

2015年發表在Nature Biotechnology上的陸地棉基因組,使用180GB小片段原始測序數據進行Survey分析,預估陸地棉基因組大小為2.5Gb。下圖展示的是陸地棉31-mer深度分布圖,從圖中可以看到兩個峰,對應的深度分別為49X和104X,主峰對應的深度為K-mer的期望深度,主峰後約2倍的位置為重複序列峰。


圖3 TM-1基因組大小的估計

橫軸表示K-mer的深度,即K-mer出現的次數,縱軸表示對應深度的K-mer的頻率。

2014年發表在Nature Communications上的棗樹基因組,通過小片段的測序數據進行Survey分析,預估基因組大小為444Mb。下圖藍線表示棗樹17-mer深度分布,紅線和綠線表示的是模擬的雜合度為1.8%和2.0%的基因組。從圖中可明顯看到棗樹基因組存在兩個峰,對應深度為30X和59X,其中深度30X對應峰為雜合峰,位於紅線和綠線之間,據此估計棗樹基因組的雜合率介於1.8%-2.0%之間,約為1.9%。從Survey分析中可以知道棗樹基因組是一個高度雜合的基因組。


 

圖4  棗樹基因組大小的估計

橫軸表示K-mer的深度,即K-mer出現的次數,縱軸表示對應深度的K-mer的頻率。藍線表示棗樹基因組,紅線和綠線分別表示模擬的雜合率為2.0%和1.8%的雜合基因組。

基因組Survey分析是基因組進行組裝前期非常重要的工作哦~今天小編先是系統地為大家介紹了基因組Survey分析相關內容,如果小夥伴們想要更深入學習基因組Survey分析,可以給小編留言哦~後續小編會持續為大家進行分享。

Liu B H, Shi Y J, Yuan J Y, et al. Estimation of genomic characteristics by analyzing k-mer frequency in de novo genome projects[J]. Quantitative Biology, 2013, 35: 62-67.

Marcais G, Kingsford C. A fast, lock-free approach for efficient parallel counting of occurrences of k-mers[J]. Bioinformatics, 2011, 27(6): 764-770.

Zhang T Z, Hu Y, Jiang W K, et al. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement[J]. Nature Biotechnology, 2015, 33(5): 531-5377.

Liu M J, Zhao J, Cai Q L, et al. The complex jujube genome provides insights into fruit tree biology[J]. Nature Communications, 2014, 5: 5315-5315.

相關焦點

  • 公務員體檢擔心沒過怎麼辦,了解一下代替檢辦法
    首先對於公務員體檢,或者事業單位體檢這兩都很正式,基本都是由所在市人社局組織的體檢,或者是組織部協調,之於前面的筆試面試我們就不說了,既然問到體檢這環節,那想必前面的已經歷過了。辛辛苦苦的準備自然不想在體檢環節閃了腰那會吐老血的,小編百度搜了一下,有家叫"百諾體檢"對這方面非常專業,上面介紹體檢一直以來,專業做全國各地區城市的公務員和事業單位體檢,擁有多種成功方案可選。百諾體檢在這裡一如既往建議大家在面試後抓緊做個體檢預檢,有人可能會問是事業單位體檢套餐還是公務員的體檢套餐?
  • 「AbMole科研」單分子測序全面分析CESC基因組的結構變異
    本期與您分享的是:單分子測序全面分析乳腺癌基因組的結構變異改進對癌癥結構變異(SVs)的識別,可以帶來更有針對性和更有效的治療選擇,並增進我們對疾病及其進展的基本了解。此外,研究者將SV和CNV數據整合到統一的核型圖結構中,以更準確地表達突變的癌症基因組。在已知的癌症相關基因中,發現了數百個只能通過長時間測序才能檢測到的變異。這些發現強調了需要對癌症基因組進行長時間的測序,以精確分析其遺傳的不穩定性。
  • 入職體檢前,請了解一下這些事情
    名偵探柯基 第九十三期體檢注意事項:1、體檢有分類,入職體檢、個人體檢等;2、入職體檢有五項,血常規、胸透、血壓、尿常規、>心電圖;費用140元;其中胸透的時候,需要脫掉上衣,直立並貼在儀器前,雙手叉腰,迷之尷尬;3、體檢時間周一至周五,周六可能也有工作人員,周日放假,一定要搞清楚時間,避免白白跑路。。。。。。
  • 抖音代古拉k個人資料背景詳細介紹 趕緊來了解一下吧!
    抖音代古拉k個人資料背景詳細介紹 趕緊來了解一下吧!時間:2018-04-19 13:36   來源:皮皮網   責任編輯:沫朵 川北在線核心提示:原標題:抖音代古拉k個人資料背景詳細介紹 趕緊來了解一下吧!
  • 陝汽重卡 | 買車買放心,免費的車輛體檢了解一下
    陝汽重卡 | 買車買放心,免費的車輛體檢了解一下 卡友小王最近訂了一輛陝汽重卡,看到嶄新的重卡,高高興興交了錢本打算立刻把車開回家,這時4S店的工作人員告知卡友小王,這車再做個體檢才能完成交車。
  • 體育單招生必須參加普通高考統一體檢
    一方面,考生可以了解自己的身體健康狀況;另一方面,體檢結果將作為考生檔案的一部分,供高校錄取時參考。 凡參加普通高考報名的都需要參加體檢,並且符合教育部、衛生部、中國殘疾人聯合會制定的《普通高等學校招生體檢工作指導意見》的相關要求。
  • 中國科學家領銜「破譯」綿羊基因組
    由中國科學家領銜的一個國際科研小組5日宣布,歷經5年時間,他們完成了對綿羊基因組的測序、組裝及分析工作。這項成果使人們對反芻動物生物學有了嶄新認識。
  • 細菌的核區和基因組
    【基因組】細菌的基因組一般是作為具有一個複製起點的獨立單位而進行複製的,遵循半保留的複製規律,最終由一個DNA母環複製為兩個子環。細菌基因組基因組的特點:1、細菌的染色體基因組通常由一條環狀雙鏈DNA分子組成,細菌的染色體相對聚集在一起,形成一個較為緻密的區域,稱為類核
  • 24歲單身女體檢遭「破處」 體檢單顯示已婚(圖)
    小王接受《零距離》記者採訪  原標題:未婚當已婚,姑娘體檢丟「清白」,遇這事的不止她一個……  單位組織體檢,本是件好事兒,但對於在24歲未婚的王女士來說,卻如同遭遇了一場噩夢  小王是個思想傳統的女生,她覺得在體檢中心遭遇了不公的待遇。  只是常規的單位體檢為何遭遇這種意外呢?
  • 入職體檢一般都有哪些流程?
    目前根據入職體檢的一些要求,和流程,基本上都是按照入職的企業的性質不一樣來確定的,今天旭日升體檢小編為你分析一下一般都有哪些不同性質的體檢!讓大家都可以提前了解一下!二、知名企業入職體檢:這些知名企業的體檢,就要根據單位的通知單來了,他們都有自己的要求,不是隨便去體檢就可以了,正常的他們都是指定醫院做的,有指定的三甲醫院,也有的是指定在一些專業的體檢中心做,像美年大健康、瑞慈、愛康國賓、普惠等這樣的聯鎖機構!套餐都是他們跟醫院聯繫好的,你到前臺直接報單位名字領取體檢表就可以!
  • 暨南大學Human Genetics發文 建立個人基因組組裝質控標準
    近年來,隨著長讀長的三代測序(單分子測序)技術的發展,基因組組裝的完整性有了大幅度提升。2016年,暨南大學等單位的研究人員利用三代測序和二代測序相結合的方式,組裝出了迄今為止完整度最高的個人基因組「華夏一號」漢族個人基因組(HX1)。該基因組填補了現行標準人類參考基因組GRCh38中數百個空缺,並測定了12.8Mb的漢族人特有序列,樹立了個人基因組拼接的新高度。
  • 未婚女子體檢時被帶著做了婦檢 致處女膜破裂
    在體檢單上,她勾填了未婚,「體檢中,未婚是不能進行婦檢的。」劉女士說。讓劉女士沒想到的是,做完視力檢查後,工作人員帶她來到了婦檢項目。因為之前不管是在這家體檢中心還是在其他地方體檢,她都沒有做過婦檢,便有些警惕。「我進去後多次問體檢醫生,自己為什麼要做這個項目。醫生是個強勢的老太太,說我就是要做這個,讓我麻利一點,趕緊躺上去。」
  • 高考體檢對志願填報有何影響?體檢注意事項務必了解
    高考體檢工作是普通高校招生工作的重要組成部分,高考體檢結果在考生填報志願時有很重要的參考意義。受新冠肺炎疫情的影響,2020年的高考體檢工作較往年相應推遲。小編從山東省教育招生考試院了解到,2020年高考體檢由各縣市區教育局組織,從今天起陸續啟動,考生要及時聽取學校通知,做好自我調整和準備。那麼考生們都有哪些注意事項呢?接下來我們就一起了解一下。
  • 體檢後的甲狀腺化驗單怎麼看?甲功三項、五項和七項各代表什麼
    體檢報告上的「異常」二字,是不是讓你很驚慌?結節、鈣化、功能亢進或減退……對於甲狀腺疾病,你究竟了解多少?體檢過後的化驗單數值什麼意思?不急,小妙為你依次解答!先來認識一下什麼是甲狀腺?而且甲狀腺結節可以是多發的,也可以是單發的,但是多髮結節的發生率要比單髮結節的要高一些,而且絕大多數的甲狀腺結節可以暫不處理,定期觀察,當然具體治療方式還與甲狀腺結節具體的病情有關。近年來,甲狀腺疾病發病率越來越高,甲狀腺結節、甲亢、甲減、甲狀腺癌也成為困擾人們的甲狀腺常見問題。
  • 科學家公布第一階段人類基因組「差異圖」
    由美國、中國、日本等國200多位科學家參加的「國際人類基因組單體型圖計劃(HapMap)」日前取得階段成果,科學家於26日公布了第一階段人類基因組單體型圖。科學家說,這份描述人類基因組中最常見差異的圖譜,將大大促進疾病和人類進化的研究。    人類基因組擁有大約32億對鹼基。
  • 嗣道全基因組SNP微陣列晶片檢測技術
    嗣道全基因組SNP微陣列晶片檢測技術 時間: 2018-11-23 14:01  來源: 求醫網   編輯: 偲
  • 科學家完成穀子基因組測序
    隨著水稻、玉米、高粱、短柄草等重要禾本科物種的基因組相繼被解密,科研人員更加迫切地希望能夠破解更多的重要禾本科作物基因組,以期能揭示重要禾本科作物的保守性及差異性、闡明禾本科作物的基因組進化過程、進一步挖掘作物重要性狀功能基因。穀子是重要的禾本科作物之一,其脫殼前被稱為穀子,脫殼後被稱為小米,是中國古代最重要的糧食作物,被稱為「五穀之首」,從南到北均曾被廣泛種植。
  • 郭碧婷陪向佐做婚前體檢,當拿到結果單的那一刻,向太郭碧婷擔憂
    郭碧婷陪向佐做婚前體檢,當拿到結果單的那一刻,向太郭碧婷擔憂郭碧婷和向佐這對情侶可以說是最近最讓人羨慕的情侶了,因為兩個人參加了一檔綜藝節目真人秀,《我家小兩口》,兩個人也是在裡面的互動很甜蜜啊,向佐更是對待郭碧婷非常的溫柔,兩個人已經是求過婚了
  • 我國科學家完成鯉魚全基因組序列圖譜繪製
    在國家「863」計劃、「973」計劃和國家自然科學基金、公益性行業科研專項等資助下,中國水產科學研究院聯合中國科學院、哈佛大學、奧本大學等單位組建的國際合作團隊完成了鯉魚全基因組序列圖譜繪製,並揭示其獨特的全基因組複製事件,這是國際上首個完成全面解析的異源四倍體硬骨魚類基因組圖譜
  • ...張國捷/周琦等首次發表鴨嘴獸和針鼴的基因組,為哺乳動物的演化...
    ,並利用其信息對哺乳動物的演化以及單孔目性染色體演化進行了分析,為深入了解哺乳動物的重要演化歷程提供了新的結果。得益於本研究產生的兩個高質量的單孔目基因組,研究團隊首次構建出2n=60條哺乳動物的祖先染色體,為人們研究哺乳動物早期演化過程中基因組的變化提供了重要信息。