分子量計算

2021-01-21 生物小角

連結:https://bioxtas-raw.readthedocs.io/en/latest/saxs/saxs_mw.html。

翻譯:劉廣峰

這是RAW-BioSAXS教程的第二篇,本教程涵蓋了根據SAXS數據計算分子量的基本原理和操作。具體的操作可以參看之前的一篇:分子量的計算。

 

概述

有許多方法可以根據SAXS數據計算分子量。RAW程序支持四種最常用的方法:

Ø 利用絕對強度I(0)計算分子量[1]。

Ø 通過與參考標準進行比較計算分子量[1]。

Ø 利用Porod參數計算分子量[2]。

Ø 利用體積相關性計算分子量與[3]。

ATSAS軟體還支持兩種其他方法,如果安裝了ATSAS,RAW將顯示這些方法:

Ø 通過將散射與已知結構進行比較來估算分子量[4]。

Ø 通過貝葉斯推論從其他分子量方法計算分子量[5]。

所有這些方法都有優缺點,要使用和信任哪一種方法在一定程度上取決於數據的詳細信息。無論如何,計算分子量對於驗證樣品的低聚狀態很重要。

 

為什麼要計算分子量?

SAXS分子量計算並非十分準確,通常的經驗法則是不確定性約為10%(或更高)。因此,不應使用SAXS來確定樣品的分子量,諸如多角度光散射(MALS)之類的方法更加準確。根據SAXS數據計算分子量的主要原因是要確定溶液中蛋白質的低聚狀態。特別是如果正在研究可以形成同二聚體或更高階低聚物的系統,則SAXS分子量計算應足夠準確,以表明要測量的低聚物狀態。因此,分子量是一種重要的診斷方法,可用於驗證溶液中的成分。

 

如何計算分子量?

因為有很多方法可以根據SAXS數據計算分子量,所以這裡僅列出上面提到的方法的簡短摘要。一般而言,這些方法可分為兩類:濃度依賴型和濃度無關型。依賴於濃度的方法需要知道SAXS池中樣品的濃度,這通常意味著它們與SEC-SAXS測量不兼容。濃度無關的方法不需要了解濃度,因此對於SEC-SAXS測量非常有用。

 

通過絕對強度I(0)計算分子量

SAXS數據通常置於絕對比例上,因此強度值具有單位(通常為cm-1)。這意味著I(0)值可以直接與樣品中的電子數量、樣品的濃度和對比度相關[6]。如果已知樣品的濃度和對比度,則可以計算電子總數,然後將其用於確定樣品的分子量。這種方法的準確性可以通過測量或計算蛋白質微分比容(例如,使用MULCh)來提高。如有必要,調整樣品和緩衝液的電子密度也會提高準確性。分子量計算公式如下:

 

其中MW是分子量,c是濃度,NA是阿伏伽德羅常數,ΔρM是單位質量的散射對比度。

在文獻[1]中評估了此方法的準確性,發現大多數蛋白質的誤差均<〜10%。

 

通過與標準品比較計算的分子量

零角處的散射I(0)與大分子的分子量、溶液中大分子的濃度和對比度成正比。如果測量了已知分子量和濃度的參比樣品,則可用於校準具有已知濃度(假設參比樣品與樣品的對比度一致)的任何其他散射曲線的分子量[1]。分子量計算如下:

 

其中MW是分子量,c是濃度,下標m和st分別表示目標大分子和標準品的量。

 

利用波羅德(Porod)體積計算分子量

Porod體積名義上是大分子在溶液中的排除體積。可以直接從散射曲線計算得出,首先計算Porod不變量:

 

其中Qp是Porod不變量。然後計算Porod體積為:

 

其中I(0)是零角度的散射。一旦確定了體積,就可以通過簡單地乘以大分子的密度來確定分子量。

 

由於Qp由0到∞的積分確定,因此實際積分必須以某種方式近似。有多種方法,包括在ATSAS datmw程序中實現的「Porod」和「 Qp」方法。RAW使用文獻[2]中所述的SAXSMoW 2方法,該方法根據散射曲線中可用的數據範圍將校正因子應用於Porod體積。然後,將平均蛋白質密度用於計算分子量。如果已知大分子更精確的密度,則可以提高該方法的準確性。

在文獻[2]中,他們發現球蛋白的分子量計算中值不確定度為12%。相比之下,在[5]中,他們使用大量的模擬曲線測試集發現該方法的分子量中值高3%,而該方法的中值絕對偏差為5%。具有模擬噪聲的數據的不確定性較高。儘管存在異常值,但對於大多數系統而言,分子量不確定性約為10%,這似乎是合理的。

 

從相關體積計算分子量

在文獻[3]中,他們將相關體積定義為:

 

他們憑經驗發現比率Vc2/ Rg與分子量成對數比例,公式如下:

 

其中c和k是根據理論散射曲線的擬合結果憑經驗確定的常數。他們發現蛋白質和RNA的常數不同。對於蛋白質,c = 0.1231和k = 1,而對於RNA,c = 0.00934 和k= 0.808(注意:c和k在原始論文中定義略有不同)。

在[3]中,他們發現,分子量分布的理論不確定性約為理論值的5%,而實驗分布的不確定性約為10%。相比之下,在[5]中,他們使用大量的模擬曲線測試集發現該方法的分子量中值低2%,而該方法的中值絕對偏差為7%。具有模擬噪聲的數據的不確定性較高。可以合理地說,對於大多數系統,分子量的不確定性約為10%,儘管存在異常值。

 

與已知結構比較確定分子量

文獻[4]描述了一種機器學習方法,該方法基於與PDB中已知結構數據比較,將SAXS數據分為形狀類別。通過找到形狀和尺寸最接近的結構(方法名稱:Shape&Size),就可以獲得樣品分子量的估計值。

在[4]中,他們發現,對於用於測試的理論散射曲線,該方法計算的分子量在90%的測試數據的預期值的10%範圍內。在[5]中,他們發現對於測試數據集,分子量中值是正確的,中值絕對偏差是4%。同樣,可以合理地說,對於大多數系統,此方法的分子量不確定性約為10%,儘管存在異常值。

 

貝葉斯方法推斷分子量

文獻[5]描述了一種利用貝葉斯推論來計算分子量的方法,該方法是根據Porod體積,相關體積以及與已知結構方法的比較來計算分子量。本質上,它需要一個龐大的理論散射曲線測試數據集,使用每種方法計算每種分子的分子量,然後為每種方法創建概率分布,以描述在給定真實分子量的情況下獲得特定計算分子量的概率。將所有方法中的概率結合在一起,從而估算出最可能的分子量。

他們發現,對於所使用的理論散射曲線,此方法的分子量中值準確,中值絕對偏差為4%。總體而言,他們報告說它比任何一種單獨的方法都更準確。可能是此方法的不確定性~5%通常比其他方法的10%小。

 

不同分子量計算方法的優缺點是什麼?

 每種方法都有各自的優缺點,並且對於某些類型的數據而言往往會更好。每種方法都需要對I(0)進行良好的測定,而所有與濃度無關的方法都需要Rg,這通常意味著在所有情況下都需要良好的吉尼爾擬合。同樣,文獻[5]指出所有與濃度無關的方法都不太適用於平面和環狀蛋白質。

 

通過絕對強度I(0)計算分子量

優點:

1、當所有參數已知時,可以非常準確。

2、具有正確的參數時可用於蛋白質或RNA/DNA。

缺點:

1、需要準確的樣品濃度。

2、需要精確的絕對強度。

3、最好大分子的散射對比度已知。

4、最好知道微分比容。

 

通過與標準品比較計算的分子量

優點:

1、對於相同條件下的相似標準品和樣品,可以非常準確。

2、具有正確的標準品可用於蛋白質或RNA/DNA。

缺點:

1、需要準確的樣品濃度。

2、參考標準品應具有與樣品相同的散射對比度(即在相似的緩衝液中)。

3、標準品和樣品應具有相似的形狀(即相同的微分比容)。

 

利用波羅德(Porod)體積計算分子量

MoW方法請參考文獻[2]。

優點:

1、適用於大多數分子形狀[5]。

2、當數據的信噪比合理時,比相關體積方法更準確[5]。

缺點:

1、當大分子具有柔性或在溶液中延展時,應該小心(儘管[5]發現情況並非總是如此)。

2、在某些情況下可能需要調整蛋白質密度(默認值:0.83 kDa / nm3),如果大分子不是蛋白質,則會失敗。

3、對緩衝液扣減敏感。

 

從相關體積計算分子量

優點:

1、當信噪比較低時,比其他方法更準確[5]。

2、有扣減有誤差時,比其他方法更準確[5]。

3、對於柔性或延展的大分子應準確[3](儘管[5]發現並非總是如此)。

4、適用於蛋白質和RNA/DNA。

缺點:

1、對於高信噪比數據,其準確性不及其他方法[5]。

2、對於延展大分子,其準確性不如Porod體積MoW方法[5]。

3、小於15-20 kDa的大分子具有較大的不確定性(根據經驗,以及經驗係數是從20 kDa及更大的尺寸範圍生成的事實)。

4、對於蛋白質核酸複合物無效。

5、qI(q)的積分必須收斂(請參見下圖)。

 

兩個圖都顯示了qI(q)的積分與q的關係。左圖顯示積分值收斂的數據,即,隨著q的增加,積分值在高q處基本不變。右邊的圖顯示了積分值尚未收斂的數據,即,隨著q的增加,積分值在高q時增加。右邊的數據無法通過相關體積方法,給出準確的分子量。

 

與已知結構比較確定分子量

優點:

1、除低信噪比數據外,最準確的獨立於濃度的方法[5]。

2、存在扣減錯誤時相對準確。

缺點:

1、對於柔性系統沒有結果。

2、僅適用於蛋白質。

 

貝葉斯方法推斷分子量

優點:在大多數情況下,比單獨的與濃度無關的方法更準確[5]。

缺點:

1、遇到大的扣減錯誤不適用。

2、僅適用於蛋白質。。

 

常見問題

無法從SAXS數據中獲得預期的分子量,該怎麼辦?

   來自良好SAXS數據的分子量具有相對較大的不確定性(通常~10%),對於低信噪比數據可能會嚴重惡化。如果出現錯誤,需要採取的措施取決於要確定的內容。

   如果確定樣品在溶液中是穩定的(不易於聚集/降解),或者有證據表明樣品全部處於一種狀態(例如,SEC-SAXS實驗中的一個尖銳的洗脫峰),如果您的分子量有一點偏差是沒關係的。在這種情況下,如果只是試圖確定樣品的低聚狀態。能清楚地區分,那就可以;不能,則需要使用其他方法測量分子量。

   如果樣品在溶液中不穩定(易於聚集/降解),則需要使用另一種方法測量樣品的分子量。好的方法包括多角度光散射(MALS)或分析超離心(AUC)。最好的方法是進行SEC-MALS-SAXS實驗,在與SAXS數據相同的洗脫液中收集MALS數據,從而消除有關樣品在MALS和SAXS測量之間的變化問題。

 

需要確定「小分子」是否綁定到「大分子」,或者想確定結合化學計量,可以用SAXS做到嗎?

   這在一定程度上取決於分子的相對大小。但是,如果「小分子」物體很小,例如~20 kDa,而「大分子」物體很大,例如~250 kDa,則SAXS數據不太可能可靠地確定綁定和未綁定之間的差異(250 kDa或270 kDa),或 1:1和2:1結合(270 kDa或290 kDa)。在這種情況下,應該進行分子量的其他表徵。最好的方法是進行SEC-MALS-SAXS實驗,在該實驗中以與SAXS數據相同的洗脫液收集MALS數據。

 

參考文獻

1. Mylonas, E. & Svergun, D. I. (2007). J. Appl. Crystallogr. 40, s245–s249. DOI: 10.1107/S002188980700252X

2. Piiadov, V., de Araújo, E. A., Oliveira Neto, M., Craievich, A. F. & Polikarpov, I. (2018). Protein Sci. 2–22. DOI: 10.1002/pro.3528

3. Rambo, R. P. & Tainer, J. A. (2013). Nature. 496, 477–481. DOI: 10.1038/nature12070

4. Franke, D., Jeffries, C. M. & Svergun, D. I. (2018). Biophys. J. 114, 2485–2492. DOI: 10.1016/j.bpj.2018.04.018

5. Hajizadeh, N. R., Franke, D., Jeffries, C. M. & Svergun, D. I. (2018). Sci. Rep. 8, 7204. DOI: 10.1038/s41598-018-25355-2

6. Orthaber, D., Bergmann, A. & Glatter, O. (2000). J. Appl. Crystallogr. 33, 218–225. DOI: 10.1107/S0021889899015216


相關焦點

  • 有關平均分子量的計算問題
    當然,在介紹完物質的量概念,討論了分子量的多種計算方法,知道了氣體相對密度與分子量的關係,再進行平均分子量的計算。例2,爆鳴氣是由2份氫氣與1份氧氣混合而成的。求其平均分子量。解,在知道,相同情況下氣體的體積比就是分子個數比後,應該會列出下式,    。
  • 氨綸聚合預聚反應分子量理論分析及計算
    一、分子量計算的意義及理論基礎:高分子是由小分子單體聚合而成的,雖然兩者的化學結構相似,但是物理性能卻有很大的差異,其許多優良的性能是由於分子量大而得來的,並且,這些性能還隨著分子量的增加而提高,同時,當分子量增大到一定數值後,高分子的強度、彈性等指標提高的速度又會減緩,最後趨於某一極限值。
  • 配方設計:氨綸預聚反應平均分子量的計算
    一、分子量計算的意義及理論基礎:高分子是由小分子單體聚合而成的,雖然兩者的化學結構相似,但是物理性能卻有很大的差異,其許多優良的性能是由於分子量大而得來的,並且,這些性能還隨著分子量的增加而提高,同時,當分子量增大到一定數值後,高分子的強度、彈性等指標提高的速度又會減緩,最後趨於某一極限值。
  • 核酸分子量、拷貝數計算方法
    1A260 吸光度值=ds DNA50mg/ml=ss DNA33mg/ml=ss RNA40mg/ml(OD260) x (dilution factor) x [33 或40或50]/ (1000) = mg/mlMW = 克/摩爾 1 摩爾= 6.02 x 1023 摩爾分子(拷貝數)平均分子量
  • 多元醇羥值、羥基含量與分子量之間的關係及計算公式
    羥值、羥基含量、分子量是關於多元醇性能、質量、品種以及配方設計時重要的參數和指標。3)分子量多元醇分子量一般是數均分子量。化合物分子量為相對原子質量的總和,所以相對分子質量(Relative molecular mass),用符號Mr表示。相對分子質量在數值上等於摩爾質量,但單位不同,摩爾質量的單位是g/mol。
  • 如何計算蛋白序列的長度、分子量、等電點等信息
    ExPASy ProtParam在線獲取ExPASy ProtParam 是一款在線蛋白質分析軟體,它可以計算一個蛋白質序列的各種理化參數,例如胺基酸序列長度、等電點、分子量等等。其用法如下:輸入一條蛋白質序列:
  • 層析、電泳與蛋白質分子量測定
    如果知道這種成分在蛋白質中的準確數量,就可以計算出蛋白質的分子量。不過對於未知蛋白,一般只能計算出最低分子量。也可以測定多種成分的含量,或結合其它方法來計算真實分子量。滲透壓也可以用來測定分子量。在理想溶液中,滲透壓與溶質形狀無關,是濃度的線性函數。
  • 高考課程 化學 14 混合氣體平均相對分子量的計算方法
    名校名師完整全系列課程 化學 14 混合氣體平均相對分子量的計算方法 高考考點 大綱知識點-->《高考課程 化學 13 氣體相對分子量的計算
  • 乙酸鈉投加量的計算 附實例計算
    而澱粉等高分子的糖類物質需轉化成乙酸、甲酸、丙酸等低分子有機酸等最易降解的有機物,然後才被利用;甲醇雖然是快速易生物降解的有機物,但甲醇必須轉化成乙酸等低分子有機酸才能被微生物利用,所以出現了利用乙酸鈉作為碳源比用澱粉、甲醇進行反硝化速度快很多的現象。 同時,甲醇作為一種易燃易爆的危險品,當採用甲醇作為外加碳源時,其加藥間本身具有一定的火災危險性。
  • 乙酸鈉(碳源)投加量的計算!附實例計算!
    而澱粉等高分子的糖類物質需轉化成乙酸、甲酸、丙酸等低分子有機酸等最易降解的有機物,然後才被利用;甲醇雖然是快速易生物降解的有機物,但甲醇必須轉化成乙酸等低分子有機酸才能被微生物利用,所以出現了利用乙酸鈉作為碳源比用澱粉、甲醇進行反硝化速度快很多的現象 。同時,甲醇作為一種易燃易爆的危險品,當採用甲醇作為外加碳源時,其加藥間本身具有一定的火災危險性。
  • 使用BiopharmaLynx軟體分析蛋白完整分子量
    賈偉                             沃特世科技(上海)有限公司實驗中心對蛋白藥的分子量進行測定,可以在完整蛋白水平,對其進行宏觀表徵,以初步確定蛋白的表達是否正確。
  • 液相干貨分享 | 如何正確測量聚合物的分子量
    GPC 三種應用方向對比使用 GPC 來測量聚合物分子量和分子量分布,除了將不同聚合度的組分分離之外,我們還需要另外兩點信息:不同保留時間流出組分的濃度和分子量各保留時間流出組分的分子量信息的得到卻不是特別容易,常規 GPC 是選用一組不同分子量的窄分子量分布標準品,來對色譜柱進行標註,得到保留時間 - 分子量的曲線,再由校正曲線來計算樣品的分子量。常用的標準品種類很少,如果標準品和樣品的化學結構、拓撲結構不同,得到的樣品分子量就不是樣品的絕對分子量,而是相對於標準品的相對分子量。
  • 關於氨綸及聚氨酯材料分子量的一些看法
    2、氨綸大分子的平均分子量及分子量分布對其性能有重要影響,在配方設計中,相對分子量的計算非常重要,顯然擴鏈反應中的終止劑是用來調節平均分子量高低的,平均分子量隨著終止劑比例的降低而升高,至於具體是怎麼調節或者說調節的結果是怎麼呈現出來的,有機會我們一起探討。
  • 陰離子聚丙烯醯胺分子量和pam粘度有什麼關係?
    是不是分子量越大粘度就越大呢?首先,聚丙烯醯胺屬於有機高分子絮凝劑,只要是高分子有機物的溶液粘度都是很大的,並且隨著分子量的上升粘度也隨之上漲,因此,陰離子聚丙烯醯胺分子量越大粘度也就越大。為什麼分子量越大粘度就越大呢?
  • 各類碳源、氮源、磷酸鹽添加量計算方法!
    北極星水處理網訊: 一、 碳源添加量計算方法1、葡萄糖作為添加C源( C6H12O6 分子量180g/mol)47%,可換算成0.501 g COD澱粉糖蜜總糖含量50%,葡萄糖含量約為50%,可換算成0.503 g COD 二、 氮源添加量計算方法1、硝酸鈉作為添加N源(NaNO3 分子量84.99 g/mol)硝酸鈉含氮量16.5%,若需添加1g N源,則需添加NaNO3 1/0.165=6.06 g
  • 汙水調試投加汙泥量及營養源的計算!
    【中國環保在線 汙水處理】此文介紹投加量的計算於活性汙泥法,汙泥的投加一般選擇相同、相近工藝的汙泥,投機量為有效容積的5-10%的濃縮汙泥,幹泥為每噸水2-3KG。 :   投加汙泥量為:10000*2=20000KG=20T   碳源添加量計算方法   普通汙泥培養一般按CNP比100:5:1計算,目前對C的爭議比較多,有些認為是COD,有些認為是BOD(註:如有不同意見或者想討論一下的朋友可按文末提示加群討論),實際投加中按COD
  • 膠原蛋白肽分子量對吸收過程的影響研究
    PepT1可轉運 2—5肽 ,其中二肽的轉運速度最快,五肽以上的肽則不能運轉,因此分子量是影響多肽吸收率的關鍵因素。為了考察膠原蛋白肽的分子量範圍對吸收率的影響,我們進行了相關實驗。首先考察動物體內脯氨酸羥基化修飾比例隨時間的變化,在此基礎上選取3種不同分子量範圍的膠原蛋白肽,檢測經灌胃後大鼠血液和尿液中羥脯氨酸的含量及動態變化,在此基礎上考察膠原蛋白肽的分子量範圍等對多肽吸收速率的影響。實驗採用凝膠過濾色譜比較了兩種膠原蛋白肽和明膠的分子量範圍。
  • 聚丙烯醯胺分子量選擇方法
    分子量是聚丙烯醯胺產品的一個重要指標,分子量的高低會影響到聚丙烯醯胺的效果,但是一定是分子量越高,價格越貴效果就越好嗎?答:「不一定。」,如何正確的選擇合適分子量的聚丙烯醯胺產品呢?首先我們先來了解下三種離子型的聚丙烯醯胺的分子量。
  • DFT的計算量
    打開APP DFT的計算量 本站 發表於 2008-10-30 12:59:19 DFT的計算量離散傅立葉變換在實際應用中是非常重要的
  • 高中化學:物質的量濃度的計算
    一、注意溶質是什麼溶液中的溶質是什麼,是運用物質的量濃度表達式進行計算時首先要考慮的,對有些特殊情況,如、