「實用教程」- 使用PyMOL的Align進行蛋白結構疊合比對

2020-11-29 中大唯信

Align

align首先執行序列比對,然後進行結構疊加,進行多次迭代以便進行微調,在蛋白序列相似性大於30%的時候可以達到良好的效果。

用途

Align常常在結構生物學以及虛擬篩選中使用,當對不同的蛋白結構並對其進行比較時,我們就可以使用align比較蛋白結構,查看兩者之間的差異,這個結構上的差異有一個量化的指標就是RMSD。它的概念和計算方式,都會在下面列出。目前,pymo是一個很流行的三維蛋白結構顯示工具。本次的目的是,使用pymol對蛋白結構進行align,結果可以通過肉眼觀測或者RMSD進行量化。

用法

align mobile, target [, cutoff [, cycles [, gap [, extend [, max_gap [, object [, matrix [, mobile_state [, target_state [, quiet [, max_skip [, transform [, reset ]]]]]]]]]]]]]

解釋:

mobile =字符串:需要移動的對象名 target =字符串:目標的對象名 cutoff = 浮點數:截斷值,默認2.0 cycles =整數:最大循環數,默認5 gap, extend, max_gap: 序列對比參數 object = 字符串:創建的一個比較對象名,默認無 matrix = 字符串: 序列比對的替換矩陣的文件名,默認BLOSUM62 mobile_state =整數: 移動選擇的對象狀態,默認全狀態 target_state = 整數:目標選擇的對象狀態, 默認全狀態 transform = 0/1: 是否做疊加,默認1

Alignment Objects

可以使用object = somename參數創建align對象。align對象可以:

(1)對比序列查看器

(2)對比原子對結果展示3D查看器中的線條

(3)可以保存到clustalw序列比對文件

RMSD

單位是埃 RMSD,root-mean-square deviation,也就是均方根偏差。原子位置的均方根偏差是疊加蛋白質的原子(通常是骨架原子)之間的平均距離的量度。注意,RMSD計算可以應用於其他非蛋白質分子,如小的有機分子。在球狀蛋白質構象的研究中,通常在剛體進行完疊加後通過計算Cα原子坐標之間的RMSD來表徵三維結構的相似性。

等式:

其中δi是原子i與參考原子之間的距離。計算時通常只計算為骨架重原子C,N,O和Cα或有時僅計算Cα原子。例如給出兩套原子坐標,v和w,計算他們的RMSD就是,如下:

通常,RMSD用作兩種或更多種蛋白質結構之間相似性的定量測量,通常越低越好。

Examples

#獲取蛋白fetch 1oky 1t46#比較這兩個結構align 1oky, 1t46# 比較這兩個結構,比較比較對象命名為:alnobj,並且將alnobj保存為clustalw 文件,文件名為alignment.alnalign 1oky, 1t46, object=alnobjsave alignment.aln, alnobj

結果

alignment.aln文本內容

PS

附加滑鼠操作流程:1t46右側的A按鈕-->align-->to molecule-->1oky

參考網頁:https://pymolwiki.org/index.php/Align

相關焦點

  • 【實用教程】- 使用PyMOL的Align進行蛋白結構疊合比對
    align首先執行序列比對,然後進行結構疊加,進行多次迭代以便進行微調,在蛋白序列相似性大於30%的時候可以達到良好的效果。Align常常在結構生物學以及虛擬篩選中使用,當對不同的蛋白結構並對其進行比較時,我們就可以使用align比較蛋白結構,查看兩者之間的差異,這個結構上的差異有一個量化的指標就是RMSD。它的概念和計算方式,都會在下面列出。
  • 如何獲取蛋白序列並進行序列比對?
    今天我們就來說一下具體的方法,先介紹蛋白序列的獲取和序列比對。以Sox家族的蛋白為例,我們首先通過Uniprot資料庫(http://www.uniprot.org/)獲取蛋白序列:這是打開後是序列,我們看到包括了Sox9,Sox2,Sox11等蛋白的序列,這樣我們就拿到Sox家族的各條序列了,接來下我們進行序列比對。
  • 「3DEXPERIENCE教程」使用xGenerative Design模塊製作參數化LOGO
    注意圖中「/」節點「Formula」一欄有公式。如圖所示參數化修改菱形大小。將曲線的輸出連到之前生成基礎四邊形的節點。由於之後要進行布爾運算,因此我們如圖所示擠出並加蓋。如圖所示進行環形陣列。如圖所示,將開始生成的「Srf - Disc」偏移一個厚度。
  • 「Bionano系列」下機原始數據過濾和評估
    cohortQC: 主要是MQR運行腳本HybridScaffold: 單酶系統和雙酶系統混合組裝工具腳本Pipeline:從頭組裝的腳本RefAligner:用於序列聯配和組裝RefGenome:hg19和hg38的cmp文件SVMerge: 用於合併單酶系統得到SV結果UTIL: 運行從頭組裝的一些實用
  • 可能是全網最好的pymol教程
    Load the PDB file • pymol> fetch 1w2iHide everything and then show protein cartoon • PyMOL> hide everything, all • PyMOL> show cartoon
  • 科學家發明蛋白序列比對新工具
    領導這一研究的是慕尼黑大學基因中心的Johannes Söding博士,他表示,「我們的方法能延伸序列分析的廣度和力度,從而能方便之後的蛋白結構和功能的解析。」 蛋白存在於生命中幾乎所有生化過程中,一個蛋白的功能很大程度上依賴於其20種胺基酸排列組合的順序,以及胺基酸序列組成的三維空間結構。
  • 谷歌開放GNMT教程:如何使用TensorFlow構建自己的神經機器翻譯系統
    編碼器將源語言句子轉換成「意義」向量,然後通過解碼器輸出翻譯結果。具體來說,神經機器翻譯系統首先使用編碼器讀取源語言句子,構建一個「思想」向量,即代表句義的一串數字;然後使用解碼器處理該容器,並輸出翻譯結果,如圖 1 所示。這就是我們通常所說的編碼器-解碼器結構。
  • Graphpad 作圖教程 | 手把手教你繪製「森林圖」
    選擇「Column」, 我們繼續使用 sample data 來進行演示,選擇「Start with a sample data to follow a tutorial」。如下圖選擇「Special uses of column tables」裡的「Metanalysis (forest plot)」子選項,後點擊 「creat」。
  • JMC | 利用計算機視覺方法研究蛋白口袋的新方法ProCare
    基於幾何型依賴於對目標分子表面的預先計算來確定可觸及的口袋,而基於能量型則依賴於計算目標蛋白和幾個探針原子在三維晶格上的相互作用能,最後,基於進化型的工具需要對同一家族的靶點進行多重序列或結構比對,以確定與特定配體結構識別相關的進化保守基序。有趣的是,結構耐藥性或配位性,可以通過在已知的可給藥和不可給藥位點集上訓練的機器學習模型,快速計算出來。
  • AI超實用實例教程,一看即懂!|矩形|筆刷|視窗|漸變|圖樣_網易訂閱
    ,從2020年3月23日的第一期開始,至今已經更新到了第40期,設計師寶藏教程,趕緊學習啊!  拉出矩形與文字轉90度重複排列整齊;從視窗中叫出符號,把排列好的圖形製作成符號;用鋼筆工具拉出一個弧形,使用效果→ 3D →迴轉;輸入旋轉數值、自右側迴轉、按下「對應線條圖」;從符號中叫出剛剛的圖形;使用「縮放以符合
  • 怎麼確定小分子與蛋白的活性位點
    B:拓撲結構相似性,電荷分部的相似性。一類化合物能結合多個口袋的話,那結合就是競爭性的。挨個dock,最後把結果放在一起可以分析。也可以先看一下文獻有沒有特殊位點比如離子通道蛋白就有這種例子。主要看你的目標來定。殷賦科技:看看我們公眾號的文章,《如何確定對接口袋》。
  • 還不會使用PyTorch框架進行深度學習的小夥伴,看過來
    選自heartbeat.fritz.ai作者:Derrick Mwiti機器之心編譯參與:Geek AI、王淑婷這是一篇關於使用 PyTorch 框架進行深度學習的教程,讀完以後你可以輕鬆地將該框架應用於深度學習模型。
  • Nat Methods:蛋白序列比對新工具HHblits更快更準
    蛋白存在於生命中幾乎所有生化過程中,一個蛋白的功能很大程度上依賴於其20種胺基酸排列組合的順序,以及胺基酸序列組成的三維空間結構。因此對於序列相似的蛋白來說,生物信息學方法能預測出其進化相關性,從而預測出相似的結構和功能。
  • 華為雲聯合國內高校最新研究:新冠病毒所有關鍵蛋白同源模建結果...
    研究者將 SARS-CoV 的各個蛋白對應的序列比對到 2019-nCoV 基因組上,選擇 best match 的比對區域,作為該蛋白對應的在 2019-nCoV 的一級序列。通過這種方法,獲得了 2019-nCoV 的共計 20 個蛋白質的序列,包括非結構蛋白 16 個(NSP1-16)與結構蛋白 4 個(S,M,N,E)。
  • Methods:德發明蛋白序列比對新工具——HHblits
    蛋白存在於生命中幾乎所有生化過程中,一個蛋白的功能很大程度上依賴於其20種胺基酸排列組合的順序,以及胺基酸序列組成的三維空間結構。因此對於序列相似的蛋白來說,生物信息學方法能預測出其進化相關性,從而預測出相似的結構和功能。
  • 非常實用的微信使用技巧大全 看看你知道幾個
    微信,小夥伴們每天都在用,但有些隱藏小技巧可能大部分人都不全知道,今天帶來了非常實用的微信使用技巧,建議收藏!1、創建「假」微信身份很多APP在登錄的時候,都會關聯微信身份,讀取微信頭像、暱稱、地區和性別等信息,如果不想暴露自己的隱私的話,可以在授權登錄的時候,選擇新建一個「假身份」信息,這樣隱私會更安全。
  • 輸白蛋白後是否要「常規」利尿?這 4 點教你判斷!
    「科室平時在輸白蛋白或球蛋白之後半小時都靜推 20 mg 呋塞米,上級說是減輕心臟負荷。如果沒有心功能不好的話,一般情況我都不推。真要推的話,原理是什麼?」對於嚴重低蛋白血症的患者,補充白蛋白是為了保持基礎血漿白蛋白水平以維持機體正常穩態。2)提高免疫力✕參與機體免疫過程的是球蛋白,並非白蛋白。3)補充血容量,廣泛用於危重患者  ✕《美國大學醫院聯合會人血白蛋白、非蛋白膠體及晶體溶液使用指南》提出:擴充血容量首選晶體溶液,其次為非蛋白膠體,最後是白蛋白。
  • iPhone XS如何使用屏幕小圓點?蘋果手機輔助觸控使用教程
    iPhone XS 如何使用小白點?蘋果手機輔助觸控使用教程。可以使用「輔助觸控」控制設備,實現捏合、多指清掃或 3D Touch。如何打開「輔助觸控」?● 前往「設置」-「通用」-「輔助功能」-「輔助觸控」,然後開啟「輔助觸控」;● 打開 Siri,使用語音命令「打開輔助觸控」;● 前往「設置」-「通用」-「輔助功能」-「輔助功能快捷鍵」,然後打開「輔助觸控」;如何使用
  • Creo工程圖全套教程
    繪圖模板文件也是一個後綴為.drw的模板文件,可以保存在次磁碟中的任意位置,通過「使用模板」-「瀏覽」選擇調用;當然為了減少操作環節,在Creo軟體中應該將其放置在指定路徑中,並通過系統配置文件(config.pro)中設置選項「template_drawing」並指向所定製的工程圖模板文件
  • TensorFlow 2.0開源工具書,30天「無痛」上手
    作者 lyhue1991 表示,這本書對「人類用戶極其友善」,以「Don't let me think」為最高追求,「如果說通過學習 TensorFlow 官方文檔掌握 TensorFlow2.0 的難度大概是 9 的話,那麼通過學習本書掌握 TensorFlow2.0 的難度應該大概是 3。」