很多情況下,我們為了研究一個蛋白的重要性,需要查看這個蛋白在多個物種,以及與這個蛋白家族中其它蛋白的相似性,並構建進化樹。今天我們就來說一下具體的方法,先介紹蛋白序列的獲取和序列比對。
以Sox家族的蛋白為例,我們首先通過Uniprot資料庫(http://www.uniprot.org/)獲取蛋白序列:
我們直接在搜索框中輸入sox,單擊search:
這樣我們能看到各個物種中展示的結果,其中人裡面有175個:
我們全部選擇後單擊左上角的下載,然後選擇fasta格式的非壓縮文件後直接單擊GO就可以了:
這是打開後是序列,我們看到包括了Sox9,Sox2,Sox11等蛋白的序列,這樣我們就拿到Sox家族的各條序列了,接來下我們進行序列比對。
接下來我們要用的工具軟體是MEGA,可以從官網(http://www.megasoftware.net/)下載:
下載後打開後的界面:
接下來我們導入剛才查到的序列,單擊Align選項下的Edit/Build Alignment,
創建新alignment,選擇蛋白protein:
打開新的界面:
在這裡面我們直接把剛才的序列複製進來就好了:
接下來我們進行比對,在Alignment裡面有Alignment by ClustalW和Muscle兩個選項,其中ClustalW常用於兩序列比對,Muscle速度快,用於序列多的時候進行的比對,這裡我們選擇Muscle,選擇所有序列後進行比對:
這裡我們用默認的參數進行計算,序列比較多的話需要等一下:
上面是比對好的結果,圖還是比較漂亮的,不過軟體在導出圖片的時候沒有給出方法,大家先截圖使用吧。
下期我們來介紹構建進化樹的方法,看看如何做出下圖的進化樹:
有科研問題要問?上科研微論壇!
關注後獲取《科研修煉手冊》1、2、3、4、5,基金篇精華合集