【小工具教程】NMR回歸分析

2021-02-18 殷賦科技
用途

將計算的核磁(NMR)數據與實驗數據做回歸分析,判斷化合物結構或相對構型。

特色

本工具支持電子表格在線編輯功能,支持Excel數據複製粘貼,提供詳細的統計數據,高亮顯示偏差較大的原子,幫助用戶分析結構,判斷構型。

預備知識

以下內容了解概念即可,不必專研數學公式,連概念都不想了解的,可以直接跳過!

計算值校正方法

採用計算預測的化學位移值往往與實驗值存在不小偏差,其中存在 系統誤差。為消除這一誤差,需要對計算值進行校正。主要有兩種方法:

標度法

該方法採用預先擬合好的標度參數,依據以下公式進行校正: 實踐表明,該方法對柔性大分子的準確性不太令人滿意。

回歸分析法

為克服 標度法的缺點,我們採用 回歸分析法。該方法不依賴任何經驗參數,直接對每個結構(構型)的計算值進行線性回歸,最大程度上消除計算方法和實驗條件對於特定分子結構的 系統誤差。

一元線性回歸模型

計算值與 實驗值之間存在 系統誤差和 隨機誤差。採用 一元線性回歸模型對 計算值進行校正,可消除 系統誤差。該模型的一般形式如下: 

採用普通最小二乘法(ordinary least squares,OLS)對參數 

通常採用以下兩個統計量來評價偏差大小:

 CMAD:corrected mean absolute deviation,校正的平均絕對偏差;

 CLAD:corrected largest absolute deviation,校正的最大絕對偏差。

通過比較 擬合值與 實驗值的偏差,可識別 異常值,對結構分析很有幫助。而對回歸模型進行統計檢驗,還可判斷其準確性和比較不同模型的擬合優度。

統計檢驗

對 一元線性回歸模型的統計檢驗主要包括以下三方面:

擬合優度檢驗

擬合優度反映模型的擬合程度,統計量是決定係數R2(coefficient of determination) (是相關係數 r 的平方)。R2越接近1,則回歸線擬合程度越好;反之越差。

均方根偏差評價

均方根偏差(root mean square deviation,RMSD)可衡量 計算值與 實驗值之間的偏差,它極易受到 異常值的影響。對於非常接近的兩個化合物,大部分原子的化學位移值差異很小,只有個別原子的差異比較明顯,RMSD能夠有效反映這一特點。

F檢驗

擬合優度檢驗反映的是模型的擬合程度,F檢驗則用於檢驗回歸方程的顯著性:

 F:F檢驗的統計量,該值越大,回歸方程越顯著;

 p:F檢驗的檢驗水平,該值< 0.01時,表明回歸方程是顯著的。

入口

平臺地址:https://cloud.yinfotek.com

功能入口:平臺左側菜單欄【計算方案】->【小工具】->【波譜分析】->【NMR分析】

步驟

1. 上傳文件

上傳實驗圖譜數據和量化計算輸出文件,點擊【計算】。

實驗數據格式可採用 兩列式或 三列式(見下圖):

首列為 位置編號(可為任意字符),第二列為 化學位移,無 列名。

首列為 位置編號(同上),第二列為 等價位置(磁等價的 位置編號),第三列為 化學位移,無 列名。

關於 等價位置的寫法,需要稍加說明:

例如,下圖 三列式中, 37和 35等價,只需在 37旁邊寫上 35,但不用在 35旁邊寫 37;

又例如,位置 a、 b、 c是等價的,須在 b、 c旁邊都寫上 a,而非在 c旁邊寫 b。

計算文件為NMR量化計算的輸出文件。

對於 xls和 xlsx格式,若有多個工作簿(sheet),該工具僅讀取第一個;

目前僅支持 Gaussian09的輸出文件,後續更新會增加對 Gaussian16、 ORCA和 NWChem的支持。

2. 選擇核磁類型與數據

選擇要分析的 核磁類型(13C NMR或 1H NMR)、 實驗數據以及計算的 構象。

3. 填寫原子編號

由於 位置是用戶自定義的標識符號,與計算用的分子結構原子序號並無聯繫。因此,需要用戶將視圖中的數字編號填在表格中對應 位置的 原子編號處。

如果上傳的實驗數據採用 兩列式格式,而後發現存在等價位置,可在表格的 等價位置列補填。

值得注意的是,當存在等價原子時,須用英文逗號 ,將等價原子編號連起來,寫在每個對應 位置的 原子編號單元格。

例如,苯環鄰位原子 10和 88等價,對應位置編號是 34和 38,則在 34和 38行都寫上 10,88(無空格,如下圖)。

4. 回歸分析

點擊【回歸分析】,稍等片刻即返回每個構象和平均構象的統計數據、 計算值、 擬合值及 偏差。分析要點:

當 CLAD ≥ 10 ppm時,單元格會紅色高亮顯示;當 5 ppm ≤ CLAD ≤ 10 ppm時,單元格會黃色高亮顯示;

查看散點圖,也能發現 異常值或直觀感受 擬合程度。顯然,計算值與實驗值相當吻合時,數據點應落在對角線附近,明顯偏離對角線的數據點都是值得注意的。

當平均構象的統計數據不好時,剔除個別構象可能會有所改善。

重複上述操作,分析其他結構(構型),統計結果最好的最有可能是實際結構(構型)。

當遇到碳譜結論與氫譜結論不一致的情況,可用 DP4方法來輔助判斷。後期會有文章專門介紹,敬請留意。

5. 下載文件

點擊【下載全部】,下載Excel數據和散點圖文件。

Excel數據文件給出了各個構象和平均構象的全部數據,包括:化學位移值、統計量、能量和比例以及TMS值。

總結

本篇教程介紹了使用殷賦雲計算平臺【NMR回歸分析】小工具進行核磁碳譜/氫譜分析的操作流程及注意事項。

NMR分析是一項複雜的探索性的工作,尤其當計算值與實驗值偏差較大時,如何解讀和解決往往是非常有挑戰性而有價值的問題。限於篇幅,本文無法詳細討論各種情況。有疑問的讀者,請在評論區留言,更推薦加入 殷賦科技學術交流群(公眾號回復「加群」),一起探討。

連結

[1]http://cheshirenmr.info/ScalingFactors.htm

請登錄https://cloud.yinfotek.com或「閱讀原文」進入殷賦雲計算平臺

相關焦點

  • 大數據學習資料下載,新手攻略,數據分析工具、軟體使用教程
    大多數傳統公司和網際網路小運營、產品團隊夠用了。3. 第三階段(數據分析師)統計學熟練(回歸、假設檢驗、時間序列、簡單蒙特卡羅),可視化,PPT和excel一定要溜。這些技術就夠了,能應付大多數傳統公司業務和網際網路業務。4.
  • Stata:斷點回歸分析教程
    此後30年, 該方法並未引起學術界的重視,直到1990年以後, 斷點回歸設計開始被應用於各種領域,並且近年來成為因果分析和政策評估領域最重要的研究方法。Hahn et al(2001)提供了斷點回歸在計量經濟學理論基礎。目前,斷點回歸在教育經濟學、勞動經濟學、健康經濟學、政治經濟學以及區域經濟學的應用仍方興未艾。
  • SPSS教程11:相關分析與效度
    相關分析是回歸分析的前提條件,在具體的研究中,只有變量之間相關顯著,才有可能做進一步的回歸分析,這在中介作用檢驗中是必須的前提步驟。效度即是指數據測量的準確性。即測量結果的和所需要考察的內容的吻合度。一般在做研究時,要報告自己數據的信效度以確定接下來一系列研究是否可信可行。在統計學中,有很多種測量效度的標準和方法,比如效標效度、聚合(收斂)和區分效度、結構效度。
  • SPSS教程-回歸分析
    //SPSS//Course//回歸分析SPSS01圖線性回歸分析由ANOVA(方差分析)表可知F統計量的觀測值為592.25,顯著性概率為0.000,即拒絕原假設,說明因變量和自變量的線性關係是非常顯著的,可建立線性模型。由係數表可知回歸模型的常數項為-4993.281,自變量「國內生產總值」的回歸係數為0.197。
  • 【SPSS數據分析】最小二乘回歸模型在生物醫藥統計分析中的應用詳解(2)——【杏花開生物醫藥統計】
    它通過最小化誤差的平方和尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據,並使得這些求得的數據與實際數據之間誤差的平方和為最小。最小二乘法還可用於曲線擬合。其他一些優化問題也可通過最小化能量或最大化熵用最小二乘法來表達。    1801年,義大利天文學家朱賽普·皮亞齊發現了第一顆小行星穀神星。
  • SAS回歸分析教程
    本節先講述如何用SAS/INSIGHT進行曲線擬合,然後進一步講如何用SAS/INSIGHT進行線性回歸,簡單介紹SAS/INSIGHT的廣義線性模型擬合,最後介紹如何用編程進行回歸分析。為擬合樣條曲線,只要選「Curves | Spline」,使用預設的GCV準則(廣義交叉核實)來選取光滑係數(光滑係數c越大,得到的曲線越光滑,但擬合同時變差,光滑係數c小的時候得到的曲線較曲折,而擬合較好),就可以在散點圖的基礎上畫出樣條曲線。可以用光滑係數c的滑塊來調整曲線的光滑程度/擬合優度。對於本例,GCV準則得到的樣條曲線與回歸直線幾乎是重合的,說明直線擬合可以得到滿意的結果。
  • 科學網—一本接地氣的數據分析教程
    匈牙利人的數學很棒,所以我對這兩位匈牙利人撰寫的數據分析教材充滿期待。 本書為未來的數據分析師提供了工具、方法和技巧,幫助他們回答現實生活中的相關問題,也幫助他們在回答相關問題時選擇適當的方法,並對分析結果給予可視化展示和解釋,以更好地支撐工商管理、經濟和公共政策領域的決策。
  • 應用sklearn工具做線性回歸分析
    具體而言,回歸分析所要解決的問題主要有:(1)確定因變量與自變量之間的回歸模型,並依據樣本觀測值對回歸模型中的參數進行估計,給出回歸方程。(2)對回歸方程中的參數和方程本身進行顯著性檢驗。(3)評價自變量對因變量的貢獻並對其重要性進行判別。
  • python數據分析--回歸函數及線性回歸分析
    2.工具數據分析有很多成熟的工具可以使用,如R、python、spss等。此處我們選用python進行分析。首先,我們需要安裝並導入python數據分析常用的庫。__version__)3.線性回歸分析Y= aX + b + e ,e表示殘差。
  • R語言從入門到精通:Day13-R語言回歸分析
    在前面兩次的教程中,我們學習了方差分析和回歸分析,它們都屬於線性模型,即它們可以通過一系列連續型 和/或類別型預測變量來預測正態分布的響應變量。
  • 主成分回歸分析在SPSS中的實現
    要想看到更多計量推文,可以關注「學術無界」,鎖定每周六的推文,當然也可以申請加入「小白計量組」啦~ 好的,已關注「學術無界」,並和小編取得聯繫了。對了,今晚推什麼呢? 今晚講「主成分回歸在SPSS中的應用」,準備好喔,要放大招了~ 分析—描述統計—描述,將需要進行標準化處理自變量選入變量框,如果要作回歸分析,則也需要將因變量選入變量框。
  • 大數據分析Python NumPy庫使用教程
    NumPy 是一個運行速度非常快的數學庫,主要用於數組計算,包含: 1)一個強大的N維數組對象 ndarray 2)廣播功能函數 3)整合 C/C++/Fortran 代碼的工具 4)線性代數、傅立葉變換、隨機數生成等功能
  • 谷歌分析工具教程:一篇教你學會操作Google Analytics
    如果要做谷歌SEO優化,你需要使用各種工具來輔助我們提高工作效率,之前給大家介紹了三款免費好用的谷歌優化工具。而這次要給大家帶來一個谷歌分析工具——Google Analytics (GA)教程。它被廣泛用於谷歌網站流量分析,一塵SEO本篇文章將教會你操作使用 Google Analytics 的主要功能。
  • 線性回歸時,你還不會做殘差分析?來看基本教程!
    一個回歸模型必然有殘差,成功的模型必然也有相應的變量來解釋y的變異。一般情況下,自變量越多,殘差越小,這意味著更多的y的變異被解釋掉了。因此多因素回歸比單因素更好,更有意義。因此,回歸分析時,我們希望殘差變異越小越好。殘差變異越小,意味著更多的變異被已知的自變量解釋了,意味著我們用回歸模擬真實世界的效果越好。那麼,如何評價回歸分析模擬真實現象的效果呢?
  • 大數據分析python自回歸模型
    什麼是自回歸模型?我們首先需要確定要在分析中包括多少個滯後(過去值)。 具有更多滯後的自回歸模型 例如,有關氣象條件的時間序列將不僅僅依賴於一天前的天氣統計數據。可以肯定地說,它將使用過去7天的數據。因此,該模型應考慮最多7個周期的值。
  • 數據小兵我是如何學習SPSS統計分析工具的?(內附教學視頻及安裝包下載地址)
    不得不說,我們的電腦正在變為一個存儲器,存儲了太多你當時認為不可多得的稀缺資源,最終的結果是,它們安安靜靜的佔據了你的硬碟,而不是轉換成為知識。選一本內容豐富、案例詳實的教程SPSS統計分析工具,在我的認識中,它本應該像Excel那樣在國內流行和熟知,因為它是一個基礎的統計分析工具,擁有完備的數據分析方法體系。
  • 快速數據分析教程:無序多分類Logistic回歸
    如果是二元Logistic回歸,默認以數字0作為參考項(通常用數字0表示不願意,不喜歡,不會等)如果是多分類logistic回歸,SPSSAU默認以數字最小的一項作為參考項。如果想更換參考項,可在【數據處理->數據編碼】裡進行設置,把參考項的數值設為最小的數值即可。
  • 乾貨 :18個免費的探索性數據分析工具
    這些工具不需要你較精確仔細地編寫代碼,只需要你點點滑鼠就能完成工作。http://www.openoffice.org/download/無論你正準備步入數據科學領域還是已經在這個領域小有建樹,你會知道過去這麼多年以來,excel 一直以來都是數據分析領域不可缺少的一部分(最常用的工具之一)。
  • 建立非線性回歸預測模型,來看R教程!
    但是,建立線性回歸模型有很多前提條件(可以參考:SPSS操作:簡單線性回歸(史上最詳盡的手把手教程))。由於實際的臨床研究中,變量之間關係複雜,因變量和自變量之間並非呈現線性關係,如果強行建立線性回歸模型,就會影響模型的預測準確性。對於此類數據,應該如何處理呢?之前醫咖會發布過的《R語言課程》,王九誼老師在「多項式回歸、分段回歸、限制性立方樣條...」視頻課程中已做了詳細介紹。
  • VBA教程:從零開始打造自己的VBA小工具
    今天來給大家講解如何從零開始打造屬於自己的VBA小工具。使用WPS個人版同學,需要先安裝VBE插件,在我們的群文件中搜索 WPSVBA 就能找到安裝包,注意看安裝說明哦,按要求安裝,就能正常使用VBA了!首先來了解一下什麼是小工具,為什麼要製作小工具?