歡迎關注」生信修煉手冊」!
基因組結構元件的可視化有多種方式,比如IGV等基因組瀏覽器中以track為單位的展示形式,亦或以circos為代表的圈圖形式,比如在細胞器基因組組裝中,基因元件常用圈圖形式展示,示例如下
在biopython中,通過BiolGraphics子模塊可以對基因組結構進行可視化,支持線性和圈圖兩種可視化方式。其中,基因組結構信息存儲在genebank格式的文件中,首先通過Bio.SeqIO讀取結構信息,然後通過Bio.Graphics模塊進行可視化。
以下列數據為例,先來看下可視化的用法
>https://www.ncbi.nlm.nih.gov/nuccore/NC_005816
首先是讀取gb文件,代碼如下
接下來提取gb文件中的feature信息,構建用於繪圖的數據結構,代碼如下
最後進行繪圖即可,代碼如下
輸出結果如下
對於圈圖,只需要修改簡單修改繪圖的參數即可,代碼如下
輸出結果如下
除了圈圖之外,biopython還可以繪製染色體圖。最簡單的繪圖,只需要提供染色體名稱和對應的長度即可,代碼如下
輸出結果如下
更進一步,可以在染色體上添加注釋,標記基因組結構元件在染色體上的分布,代碼如下
輸出結果如下
相比circos,biopython的track可能沒有那麼多種豐富的表現形式,但是也有其獨特性。更重要的是,在染色體上標記特定元件的這種可視化方式,應用非常廣泛,snp, ssr, cnv, genge等等都可以進行標記。
·end·
—如果喜歡,快分享給你的朋友們吧—
原創不易,歡迎收藏,點讚,轉發!生信知識浩瀚如海,在生信學習的道路上,讓我們一起並肩作戰!
本公眾號深耕耘生信領域多年,具有豐富的數據分析經驗,致力於提供真正有價值的數據分析服務,擅長個性化分析,歡迎有需要的老師和同學前來諮詢。