將計算的核磁(NMR)數據與實驗數據做回歸分析,判斷化合物結構或相對構型。
特色本工具支持電子表格在線編輯功能,支持Excel數據複製粘貼,提供詳細的統計數據,高亮顯示偏差較大的原子,幫助用戶分析結構,判斷構型。
預備知識以下內容了解概念即可,不必專研數學公式,連概念都不想了解的,可以直接跳過!
計算值校正方法採用計算預測的化學位移值往往與實驗值存在不小偏差,其中存在 系統誤差。為消除這一誤差,需要對計算值進行校正。主要有兩種方法:
標度法
該方法採用預先擬合好的標度參數,依據以下公式進行校正:
回歸分析法
為克服 標度法的缺點,我們採用 回歸分析法。該方法不依賴任何經驗參數,直接對每個結構(構型)的計算值進行線性回歸,最大程度上消除計算方法和實驗條件對於特定分子結構的 系統誤差。
一元線性回歸模型計算值與 實驗值之間存在 系統誤差和 隨機誤差。採用 一元線性回歸模型對 計算值進行校正,可消除 系統誤差。該模型的一般形式如下:
採用普通最小二乘法(ordinary least squares,OLS)對參數
通常採用以下兩個統計量來評價偏差大小:
CMAD:corrected mean absolute deviation,校正的平均絕對偏差;
CLAD:corrected largest absolute deviation,校正的最大絕對偏差。
通過比較 擬合值與 實驗值的偏差,可識別 異常值,對結構分析很有幫助。而對回歸模型進行統計檢驗,還可判斷其準確性和比較不同模型的擬合優度。
統計檢驗對 一元線性回歸模型的統計檢驗主要包括以下三方面:
擬合優度檢驗
擬合優度反映模型的擬合程度,統計量是決定係數R2(coefficient of determination) (是相關係數 r 的平方)。R2越接近1,則回歸線擬合程度越好;反之越差。
均方根偏差評價
均方根偏差(root mean square deviation,RMSD)可衡量 計算值與 實驗值之間的偏差,它極易受到 異常值的影響。對於非常接近的兩個化合物,大部分原子的化學位移值差異很小,只有個別原子的差異比較明顯,RMSD能夠有效反映這一特點。
F檢驗
擬合優度檢驗反映的是模型的擬合程度,F檢驗則用於檢驗回歸方程的顯著性:
F:F檢驗的統計量,該值越大,回歸方程越顯著;
p:F檢驗的檢驗水平,該值< 0.01時,表明回歸方程是顯著的。
入口平臺地址:https://cloud.yinfotek.com
功能入口:平臺左側菜單欄【計算方案】->【小工具】->【波譜分析】->【NMR分析】
步驟1. 上傳文件
上傳實驗圖譜數據和量化計算輸出文件,點擊【計算】。
實驗數據格式可採用 兩列式或 三列式(見下圖):
首列為 位置編號(可為任意字符),第二列為 化學位移,無 列名。
首列為 位置編號(同上),第二列為 等價位置(磁等價的 位置編號),第三列為 化學位移,無 列名。
關於 等價位置的寫法,需要稍加說明:
例如,下圖 三列式中, 37和 35等價,只需在 37旁邊寫上 35,但不用在 35旁邊寫 37;
又例如,位置 a、 b、 c是等價的,須在 b、 c旁邊都寫上 a,而非在 c旁邊寫 b。
計算文件為NMR量化計算的輸出文件。
對於 xls和 xlsx格式,若有多個工作簿(sheet),該工具僅讀取第一個;
目前僅支持 Gaussian09的輸出文件,後續更新會增加對 Gaussian16、 ORCA和 NWChem的支持。
2. 選擇核磁類型與數據
選擇要分析的 核磁類型(13C NMR或 1H NMR)、 實驗數據以及計算的 構象。
3. 填寫原子編號
由於 位置是用戶自定義的標識符號,與計算用的分子結構原子序號並無聯繫。因此,需要用戶將視圖中的數字編號填在表格中對應 位置的 原子編號處。
如果上傳的實驗數據採用 兩列式格式,而後發現存在等價位置,可在表格的 等價位置列補填。
值得注意的是,當存在等價原子時,須用英文逗號 ,將等價原子編號連起來,寫在每個對應 位置的 原子編號單元格。
例如,苯環鄰位原子 10和 88等價,對應位置編號是 34和 38,則在 34和 38行都寫上 10,88(無空格,如下圖)。
4. 回歸分析
點擊【回歸分析】,稍等片刻即返回每個構象和平均構象的統計數據、 計算值、 擬合值及 偏差。分析要點:
當 CLAD ≥ 10 ppm時,單元格會紅色高亮顯示;當 5 ppm ≤ CLAD ≤ 10 ppm時,單元格會黃色高亮顯示;
查看散點圖,也能發現 異常值或直觀感受 擬合程度。顯然,計算值與實驗值相當吻合時,數據點應落在對角線附近,明顯偏離對角線的數據點都是值得注意的。
當平均構象的統計數據不好時,剔除個別構象可能會有所改善。
重複上述操作,分析其他結構(構型),統計結果最好的最有可能是實際結構(構型)。
當遇到碳譜結論與氫譜結論不一致的情況,可用 DP4方法來輔助判斷。後期會有文章專門介紹,敬請留意。
5. 下載文件
點擊【下載全部】,下載Excel數據和散點圖文件。
Excel數據文件給出了各個構象和平均構象的全部數據,包括:化學位移值、統計量、能量和比例以及TMS值。
總結本篇教程介紹了使用殷賦雲計算平臺【NMR回歸分析】小工具進行核磁碳譜/氫譜分析的操作流程及注意事項。
NMR分析是一項複雜的探索性的工作,尤其當計算值與實驗值偏差較大時,如何解讀和解決往往是非常有挑戰性而有價值的問題。限於篇幅,本文無法詳細討論各種情況。有疑問的讀者,請在評論區留言,更推薦加入 殷賦科技學術交流群(公眾號回復「加群」),一起探討。
連結[1]http://cheshirenmr.info/ScalingFactors.htm
請登錄https://cloud.yinfotek.com或「閱讀原文」進入殷賦雲計算平臺!