連結:https://bioxtas-raw.readthedocs.io/en/latest/saxs/saxs_mw.html。
翻譯:劉廣峰
這是RAW-BioSAXS教程的第二篇,本教程涵蓋了根據SAXS數據計算分子量的基本原理和操作。具體的操作可以參看之前的一篇:分子量的計算。
概述
有許多方法可以根據SAXS數據計算分子量。RAW程序支持四種最常用的方法:
Ø 利用絕對強度I(0)計算分子量[1]。
Ø 通過與參考標準進行比較計算分子量[1]。
Ø 利用Porod參數計算分子量[2]。
Ø 利用體積相關性計算分子量與[3]。
ATSAS軟體還支持兩種其他方法,如果安裝了ATSAS,RAW將顯示這些方法:
Ø 通過將散射與已知結構進行比較來估算分子量[4]。
Ø 通過貝葉斯推論從其他分子量方法計算分子量[5]。
所有這些方法都有優缺點,要使用和信任哪一種方法在一定程度上取決於數據的詳細信息。無論如何,計算分子量對於驗證樣品的低聚狀態很重要。
為什麼要計算分子量?
SAXS分子量計算並非十分準確,通常的經驗法則是不確定性約為10%(或更高)。因此,不應使用SAXS來確定樣品的分子量,諸如多角度光散射(MALS)之類的方法更加準確。根據SAXS數據計算分子量的主要原因是要確定溶液中蛋白質的低聚狀態。特別是如果正在研究可以形成同二聚體或更高階低聚物的系統,則SAXS分子量計算應足夠準確,以表明要測量的低聚物狀態。因此,分子量是一種重要的診斷方法,可用於驗證溶液中的成分。
如何計算分子量?
因為有很多方法可以根據SAXS數據計算分子量,所以這裡僅列出上面提到的方法的簡短摘要。一般而言,這些方法可分為兩類:濃度依賴型和濃度無關型。依賴於濃度的方法需要知道SAXS池中樣品的濃度,這通常意味著它們與SEC-SAXS測量不兼容。濃度無關的方法不需要了解濃度,因此對於SEC-SAXS測量非常有用。
通過絕對強度I(0)計算分子量
SAXS數據通常置於絕對比例上,因此強度值具有單位(通常為cm-1)。這意味著I(0)值可以直接與樣品中的電子數量、樣品的濃度和對比度相關[6]。如果已知樣品的濃度和對比度,則可以計算電子總數,然後將其用於確定樣品的分子量。這種方法的準確性可以通過測量或計算蛋白質微分比容(例如,使用MULCh)來提高。如有必要,調整樣品和緩衝液的電子密度也會提高準確性。分子量計算公式如下:
其中MW是分子量,c是濃度,NA是阿伏伽德羅常數,ΔρM是單位質量的散射對比度。
在文獻[1]中評估了此方法的準確性,發現大多數蛋白質的誤差均<〜10%。
通過與標準品比較計算的分子量
零角處的散射I(0)與大分子的分子量、溶液中大分子的濃度和對比度成正比。如果測量了已知分子量和濃度的參比樣品,則可用於校準具有已知濃度(假設參比樣品與樣品的對比度一致)的任何其他散射曲線的分子量[1]。分子量計算如下:
其中MW是分子量,c是濃度,下標m和st分別表示目標大分子和標準品的量。
利用波羅德(Porod)體積計算分子量
Porod體積名義上是大分子在溶液中的排除體積。可以直接從散射曲線計算得出,首先計算Porod不變量:
其中Qp是Porod不變量。然後計算Porod體積為:
其中I(0)是零角度的散射。一旦確定了體積,就可以通過簡單地乘以大分子的密度來確定分子量。
由於Qp由0到∞的積分確定,因此實際積分必須以某種方式近似。有多種方法,包括在ATSAS datmw程序中實現的「Porod」和「 Qp」方法。RAW使用文獻[2]中所述的SAXSMoW 2方法,該方法根據散射曲線中可用的數據範圍將校正因子應用於Porod體積。然後,將平均蛋白質密度用於計算分子量。如果已知大分子更精確的密度,則可以提高該方法的準確性。
在文獻[2]中,他們發現球蛋白的分子量計算中值不確定度為12%。相比之下,在[5]中,他們使用大量的模擬曲線測試集發現該方法的分子量中值高3%,而該方法的中值絕對偏差為5%。具有模擬噪聲的數據的不確定性較高。儘管存在異常值,但對於大多數系統而言,分子量不確定性約為10%,這似乎是合理的。
從相關體積計算分子量
在文獻[3]中,他們將相關體積定義為:
他們憑經驗發現比率Vc2/ Rg與分子量成對數比例,公式如下:
其中c和k是根據理論散射曲線的擬合結果憑經驗確定的常數。他們發現蛋白質和RNA的常數不同。對於蛋白質,c = 0.1231和k = 1,而對於RNA,c = 0.00934 和k= 0.808(注意:c和k在原始論文中定義略有不同)。
在[3]中,他們發現,分子量分布的理論不確定性約為理論值的5%,而實驗分布的不確定性約為10%。相比之下,在[5]中,他們使用大量的模擬曲線測試集發現該方法的分子量中值低2%,而該方法的中值絕對偏差為7%。具有模擬噪聲的數據的不確定性較高。可以合理地說,對於大多數系統,分子量的不確定性約為10%,儘管存在異常值。
與已知結構比較確定分子量
文獻[4]描述了一種機器學習方法,該方法基於與PDB中已知結構數據比較,將SAXS數據分為形狀類別。通過找到形狀和尺寸最接近的結構(方法名稱:Shape&Size),就可以獲得樣品分子量的估計值。
在[4]中,他們發現,對於用於測試的理論散射曲線,該方法計算的分子量在90%的測試數據的預期值的10%範圍內。在[5]中,他們發現對於測試數據集,分子量中值是正確的,中值絕對偏差是4%。同樣,可以合理地說,對於大多數系統,此方法的分子量不確定性約為10%,儘管存在異常值。
貝葉斯方法推斷分子量
文獻[5]描述了一種利用貝葉斯推論來計算分子量的方法,該方法是根據Porod體積,相關體積以及與已知結構方法的比較來計算分子量。本質上,它需要一個龐大的理論散射曲線測試數據集,使用每種方法計算每種分子的分子量,然後為每種方法創建概率分布,以描述在給定真實分子量的情況下獲得特定計算分子量的概率。將所有方法中的概率結合在一起,從而估算出最可能的分子量。
他們發現,對於所使用的理論散射曲線,此方法的分子量中值準確,中值絕對偏差為4%。總體而言,他們報告說它比任何一種單獨的方法都更準確。可能是此方法的不確定性~5%通常比其他方法的10%小。
不同分子量計算方法的優缺點是什麼?
每種方法都有各自的優缺點,並且對於某些類型的數據而言往往會更好。每種方法都需要對I(0)進行良好的測定,而所有與濃度無關的方法都需要Rg,這通常意味著在所有情況下都需要良好的吉尼爾擬合。同樣,文獻[5]指出所有與濃度無關的方法都不太適用於平面和環狀蛋白質。
通過絕對強度I(0)計算分子量
優點:
1、當所有參數已知時,可以非常準確。
2、具有正確的參數時可用於蛋白質或RNA/DNA。
缺點:
1、需要準確的樣品濃度。
2、需要精確的絕對強度。
3、最好大分子的散射對比度已知。
4、最好知道微分比容。
通過與標準品比較計算的分子量
優點:
1、對於相同條件下的相似標準品和樣品,可以非常準確。
2、具有正確的標準品可用於蛋白質或RNA/DNA。
缺點:
1、需要準確的樣品濃度。
2、參考標準品應具有與樣品相同的散射對比度(即在相似的緩衝液中)。
3、標準品和樣品應具有相似的形狀(即相同的微分比容)。
利用波羅德(Porod)體積計算分子量
MoW方法請參考文獻[2]。
優點:
1、適用於大多數分子形狀[5]。
2、當數據的信噪比合理時,比相關體積方法更準確[5]。
缺點:
1、當大分子具有柔性或在溶液中延展時,應該小心(儘管[5]發現情況並非總是如此)。
2、在某些情況下可能需要調整蛋白質密度(默認值:0.83 kDa / nm3),如果大分子不是蛋白質,則會失敗。
3、對緩衝液扣減敏感。
從相關體積計算分子量
優點:
1、當信噪比較低時,比其他方法更準確[5]。
2、有扣減有誤差時,比其他方法更準確[5]。
3、對於柔性或延展的大分子應準確[3](儘管[5]發現並非總是如此)。
4、適用於蛋白質和RNA/DNA。
缺點:
1、對於高信噪比數據,其準確性不及其他方法[5]。
2、對於延展大分子,其準確性不如Porod體積MoW方法[5]。
3、小於15-20 kDa的大分子具有較大的不確定性(根據經驗,以及經驗係數是從20 kDa及更大的尺寸範圍生成的事實)。
4、對於蛋白質核酸複合物無效。
5、qI(q)的積分必須收斂(請參見下圖)。
兩個圖都顯示了qI(q)的積分與q的關係。左圖顯示積分值收斂的數據,即,隨著q的增加,積分值在高q處基本不變。右邊的圖顯示了積分值尚未收斂的數據,即,隨著q的增加,積分值在高q時增加。右邊的數據無法通過相關體積方法,給出準確的分子量。
與已知結構比較確定分子量
優點:
1、除低信噪比數據外,最準確的獨立於濃度的方法[5]。
2、存在扣減錯誤時相對準確。
缺點:
1、對於柔性系統沒有結果。
2、僅適用於蛋白質。
貝葉斯方法推斷分子量
優點:在大多數情況下,比單獨的與濃度無關的方法更準確[5]。
缺點:
1、遇到大的扣減錯誤不適用。
2、僅適用於蛋白質。。
常見問題
無法從SAXS數據中獲得預期的分子量,該怎麼辦?
來自良好SAXS數據的分子量具有相對較大的不確定性(通常~10%),對於低信噪比數據可能會嚴重惡化。如果出現錯誤,需要採取的措施取決於要確定的內容。
如果確定樣品在溶液中是穩定的(不易於聚集/降解),或者有證據表明樣品全部處於一種狀態(例如,SEC-SAXS實驗中的一個尖銳的洗脫峰),如果您的分子量有一點偏差是沒關係的。在這種情況下,如果只是試圖確定樣品的低聚狀態。能清楚地區分,那就可以;不能,則需要使用其他方法測量分子量。
如果樣品在溶液中不穩定(易於聚集/降解),則需要使用另一種方法測量樣品的分子量。好的方法包括多角度光散射(MALS)或分析超離心(AUC)。最好的方法是進行SEC-MALS-SAXS實驗,在與SAXS數據相同的洗脫液中收集MALS數據,從而消除有關樣品在MALS和SAXS測量之間的變化問題。
需要確定「小分子」是否綁定到「大分子」,或者想確定結合化學計量,可以用SAXS做到嗎?
這在一定程度上取決於分子的相對大小。但是,如果「小分子」物體很小,例如~20 kDa,而「大分子」物體很大,例如~250 kDa,則SAXS數據不太可能可靠地確定綁定和未綁定之間的差異(250 kDa或270 kDa),或 1:1和2:1結合(270 kDa或290 kDa)。在這種情況下,應該進行分子量的其他表徵。最好的方法是進行SEC-MALS-SAXS實驗,在該實驗中以與SAXS數據相同的洗脫液收集MALS數據。
參考文獻
1. Mylonas, E. & Svergun, D. I. (2007). J. Appl. Crystallogr. 40, s245–s249. DOI: 10.1107/S002188980700252X
2. Piiadov, V., de Araújo, E. A., Oliveira Neto, M., Craievich, A. F. & Polikarpov, I. (2018). Protein Sci. 2–22. DOI: 10.1002/pro.3528
3. Rambo, R. P. & Tainer, J. A. (2013). Nature. 496, 477–481. DOI: 10.1038/nature12070
4. Franke, D., Jeffries, C. M. & Svergun, D. I. (2018). Biophys. J. 114, 2485–2492. DOI: 10.1016/j.bpj.2018.04.018
5. Hajizadeh, N. R., Franke, D., Jeffries, C. M. & Svergun, D. I. (2018). Sci. Rep. 8, 7204. DOI: 10.1038/s41598-018-25355-2
6. Orthaber, D., Bergmann, A. & Glatter, O. (2000). J. Appl. Crystallogr. 33, 218–225. DOI: 10.1107/S0021889899015216