統計學課堂 - 如何理解數學模型

2020-12-06 InsightfulScience
官方中文版教程 www.graphpad-prism.cn

01數學模型到底是什麼?

非線性回歸的關鍵在於將模型擬合至數據中,這就提出了一個問題:什麼是模型?

數學模型是對物理、化學或生物狀態或過程的描述。使用模型可幫助思考化學和生理過程或機制,因此你可設計更好的實驗並理解結果。將一個模型擬合到你的數據,將獲得可在模型背景中進行解讀的最佳擬合值。

數學模型既不是假設,也不是理論。與科學假說不同,模型不能通過實驗直接驗證。因為所有模型既真又假……模型的驗證並非說它是「真的」,而是它產生了與重要問題相關的良好的可檢驗假設。——R. Levins, Am.,《科學家》54:421-31,1966

使用模型的目的不一定是完美描述系統。一個完美模型可能有太多有用的參數。相反,目的是找到儘可能簡單的模型來描述自己的實驗體系。我們希望一個模型足夠簡單,這樣就能使模型擬合到數據,但又得足夠複雜,以與的數據很好地擬合併給到一些參數,以幫助自己理解體系,得出有效的科學結論,並設計新的實驗。

我們一起來了解數學模型的作用概念,下文簡要描述了三個常用模型:

作為濃度函數的光密度背景:比色化學分析基於一個簡單的原理。向樣本中加入適當的反應物,引發化學反應,反應產物是有色物質。終止反應時,有色產物的濃度與待檢測的物質的初始濃度成正比。

模型:由於光密度與有色物質的濃度成正比,光密度也與所檢測的物質的濃度成正比。

現實檢查:從數學上講,該方程適用於任何x值。但結果僅當某些值下才有意義。

1)負的X值沒有意義,因為濃度不能是負值;

2)反應不再受物質濃度限制時,該模型可能在高物質濃度下失效;

3)如果溶液變得非常暗(光密度非常高),以至於幾乎沒有光到達檢測器,則模型在高濃度下也可能失敗。此時,儀器的噪聲可能超過信號;

一個模型只適用於一定範圍的值是很正常的。只需要意識到這些限制,不要試圖使用超出其有用範圍的模型。

指數衰減每當某事發生的速度與剩餘的數量成正比時,使用指數方程。例如,配體與受體分離、放射性同位素的衰變和藥物的代謝。表示為微分方程:

將微分方程轉換成在可定義任何時間的Y值的模型需要一些演算。只有一個函數的導數與指數函數Y成正比。同時對微分方程的兩側進行積分,得到一個新的指數方程,該方程將Y定義為X(時間)、速率常數k和Y在時間為0時的值(Y0)的函數。

平衡結合配體與受體相互作用時,或基質與酶相互作用時,結合遵循質量作用定律。

測量結合的量,也就是RL複合物的濃度,將其繪製在Y軸上。改變添加配體的量,我們可假設它與游離配體的濃度(L)相同,因此形成了X軸。一些簡單(但乏味)的代數可得出該方程:

02不會選擇模型怎麼辦?借力軟體程序

非線性回歸目的是將模型擬合到數據中。程序會找到模型中參數的最佳擬合值(可能是速率常數、親和力、受體數量等),從而方便科學地解讀這些最佳擬合值。模型的選擇是一個基於科學的決定。應根據自己對化學或生理學(或遺傳學等)的理解作出判斷,而非僅僅基於圖表的形狀。

一些程序是會自動將數據擬合成數千個方程,然後向你推薦與數據擬合最佳的方程。這樣的程序確實很具有吸引力。但有一個問題,這些程序並不了解你的實驗科學背景。與數據擬合最佳的方程可能不符合有科學意義的模型,這些方程無法解讀參數的最佳擬合值,相應的結果就不大可靠。

如果你的目的是簡單地為模擬或插值創建一條平滑的曲線,那可以讓程序幫你推薦選擇模型。這樣,我們可以不關注參數的值或模型的意義,只需要關注曲線是否很好地擬合數據,且不會產生過大擺動,就OK了。

但,曲線擬合的目的是為了將數據擬合到基於化學、物理或生物原理的模型時,不建議直接使用程序推薦的模型。科學決策還是需要基於實驗體系來決定,而非計算機的算法。

這裡推薦大家了解一下GraphPad Prism提供的理解模型含義的提示,或許讓你的選擇更科學。這裡用描述酶活性的米氏方程作為底物濃度的函數舉例:

Y=Vmax*X/(Km +X)

提示01確信你知道X和Y的含義和單位

在此示例中,Y為酶活性,根據不同的酶,可用不同單位表示。X為底物濃度,單位為摩爾或微摩爾或其他濃度單位。

提示02計算參數的單位

在示例方程中,參數Km加到了X上。只需添加用相同單位表示的東西就有意義了,因此Km必須用與X相同的濃度單位表示。這意味著單位在X/(Km+X)中被抵消,因此Vmax必須用與Y相同的酶活性單位表示。

提示03算出在X極限值下Y的值

因為X為濃度,不能為負。但其可為零。將X=0代入方程,你會發現Y也是零。讓我們也來看看X變得很大時會發生什麼。X相比於Km變大時,分母(X+Km)的值與X非常接近。因此,X/(X+Km)接近1.0,Y接近Vmax。因此,X變得非常大時,模型的圖表必須在Y=Vmax處趨於平穩。

提示04算出在X特定值下Y的值

因為Km是以與X相同的單位表示的,可想像下如果X等於Km會發生什麼?在此情況下,X/(Km+X)等於0.5,因此Y等於Vmax的一半。這意味著Km是導致速度等於最大速度Vmax一半的底物濃度。

提示05用不同的參數值繪製模型

繪製一系列具有不同參數值的曲線可幫助我們直觀了解參數的含義。如需使用Prism實現這一點,可以使用分析「創建一系列理論曲線」

更多精彩 www.graphpad-prism.cn

相關焦點

  • 19個數學和統計學公開課推薦
    內容目錄:初級數學水平/統計學數據科學數學技巧描述統計學入門推論統計學入門概率和數據入門無處不在的數學:有限數學應用概率:基礎概念&離散隨機變量數學生物統計學訓練營 1線性代數應用 第一部分數學思維入門中級數學水平/統計學貝葉斯統計學:從概念到數據分析博弈論 1博弈論 2 :高級應用數據科學的高級線性模型 1:最小二乘數據科學的高級線性模型
  • 關於數據科學中數學和統計學的完全指南
    數學和統計學對學習數據科學至關重要,因為這些學科構成了所有機器學習算法的基礎。成為一名數據科學家,除了對程式語言要有很好的了解,還必須要掌握機器學習算法、數據驅動方法。但數據科學並不只涉及這些領域。在本文中,您將了解數學和統計學對數據科學的重要意義以及如何將其用於建立機器學習模型。
  • 大數據下的「應用統計學」與「經濟統計學」,如何抉擇?
    一、源於數學,各有側重統計學是一門很古老的學科,單從字面上來分析「統計」一詞的含義,一言以蔽之,「統」指「統括」,「計」指「計算」,這兩個動詞合二為一,意思是對某一現象有關的數據進行搜集、整理、計算以及分析,通過這樣的手段以達到整理所測對象數據、推斷關注對象的本質、甚至預測對象未來的目的。
  • 統計學是什麼?| 統計學七支柱
    下文節選自《統計學七支柱》, 已獲人郵圖靈許可, [遇見數學] 特此表示感謝「統計學是什麼?」早在1838年就有人提出過這個問題(與英國皇家統計學會有關),此後這個問題又被反覆提起。多年來,鐵打的問題和流水的答案已成為該討論的特點。綜合問題和答案可以看出,持續的疑問源於,統計學並不是一個單一學科。
  • 課堂內外:巧用相似求弦長
    那麼如何求AH的值呢?透過同學們的共同努力,他們想到了三種解法。 解法一:面積法 解:因為∠A=∠A,∠AHC=∠ACB所以△AHC∽△ACB所以AH/AC=AC/AB即AH/6=6/10故AH=3.6,AD=2AH=7.2小結:透過三種方法的對比,同學們發現利用相似的方法計算量最小,並且發現這就是我們之前所熟悉的母子相似三角形模型
  • ...大學——醫學統計預測模型、數理統計醫學應用模型和生物數學模型
    、數理統計醫學應用模型和生物數學模型 聯繫方式 E-Mail:       電話:       郵編: 250012 地址: 山東省濟南市文化西路44號山東大學公共衛生學院
  • 數學模型:讓我們更好地理解氣味!
    但是科學家們一直在奮鬥,想要準確理解是什麼讓氣味分子的每種組合形成其獨特的氣味,或者通過其結構預測某個分子是讓人愉悅,或者有毒,還是根本沒有氣味。採用在草莓、番茄、藍莓和鼠尿等不同樣本中發現的氣味分子的現成數據,他們採用了統計學方法,基於在這四種樣本中這些分子一起出現的頻率,將它們放到了一張圖上。
  • 統計學專業介紹,專業說
    近年來,隨著網際網路以及人工智慧行業的迅速崛起,加之金融行業的持續升溫,統計學逐步躋身於比較熱門的專業之一,人們意識統計學及數學是從事諸多行業的重要基礎,不管是做大數據、做機器人還是金融精算,都離不開統計知識的學習,因此許多數學基礎比較好的同學都將統計學納入了報考專業的考量範圍,但實際上統計學與大家心目中所想的可能還是有所差異的,社會上也普遍存在一些片面的理解,那我們今天就來聊一聊
  • 聽聽這位老教授多年心血練就的最實用統計學
    不過大多數統計學出身的學者推崇數學模型驅動的路子,在他們看來,直接從一堆實際數據出發做預測分析的「野路子」,是登不了學術的大雅之堂的。因此相當多的統計學者並沒有積極投身機器學習的研究、教學和應用中,與機器學習界的交流也遠遠不夠。吳喜之教授則走的是一條實用應用之路。吳喜之教授是我國著名的統計學家,退休前在中國人民大學統計學院任統計學教授。
  • 觀點| 我們該如何學習機器學習中的數學
    數學在機器學習中非常重要,不論是在算法上理解模型代碼,還是在工程上構建系統,數學都必不可少。通常離開學校後很難有機會靜下心學習數學知識,因此我們最好能通過閱讀小組或讀書會等形式營造環境,並專注學習那些在實踐中常常需要用到的數學知識。數學達到什麼水平才可以開始機器學習?人們並不清楚,尤其是那些在校期間沒有研究過數學或統計學的人。
  • 統計學的實質是什麼?--寫給所有將要或者正在學習統計學的朋友們
    不過,大部分初學者對這樣的統計學定義依然一知半解。統計學的本質是什麼?統計學是數學嗎?如果不是數學,它和數學有什麼關係?我們統計分析的目的是什麼?它的原理難以理解,如何應用統計原理於數據分析呢?今年秋季以來,作為一名浙江中醫藥大學的醫學統計學教授,通過不斷地學習與反思,本人總結出一些出關於統計學本質、統計思維的關鍵感悟。特此撰寫長文進行梳理,來幫助學習者來理解統計學。本篇文字約5000字,閱讀時間為14分鐘。
  • 那個容易被遺忘的統計學名詞——standard deviation
    今天我們一起來聊聊統計學中常見的一個名詞——standard deviation。
  • 2001.6:關於統計學的性質與發展問題
    對於學科性質的理解既是學術問題,也有思想認識問題,只能通過研討和交流來加深理解,以達到提高認識、促進學科健康發展的目的。我的基本觀點是:既不贊成統計學屬於數學範疇,也不贊成統計學屬於經濟學範疇,更不贊成「社會經濟統計學」與「數理統計學」分立的觀點。
  • 機器學習才不只是統計學的美化!
    另外,許多模型都近似於統計函數:由邏輯組成的分類模型的softmax輸出;將訓練圖像分類器的過程處理為邏輯回歸。雖然,單從技術角度來說,這種觀念思路是正確的,但將整個機器學習簡單歸化為統計學的附屬物就太過一概而論了。統計學是數學領域,涉及對數據的理解和解釋。機器學習則只是一類計算算法(所以,它其實誕生於計算機科學)。
  • 數學與應用統計學
    數學與應用數學:本專業培養學生掌握數學科學的基本理論和方法,具有運用數學知識和運用計算機解決實際問題的能力,經過科學研究初步訓練,能從事研究工作的高級專門人才從事科技、教育、經濟等部門的教學工作,或在生產、經營、管理部門的實際應用、開發、研究和管理工作。
  • 「學好數學的秘密不在課堂」
    原標題:「學好數學的秘密不在課堂」 「初中是數學學習的關鍵過渡期,這對初中數學教師的教學能力和教學方法提出了挑戰。」昨天,美國芝加哥大學數學系教授扎爾曼·尤西斯金在華東師範大學分享了他多年的教學研究成果,並接受文匯報記者採訪。
  • 什麼是統計模型?統計模型在實際生活中的應用
    你好 歡迎來到徵服統計學,一群來自北卡羅來納大學教堂山分校的遺傳學部門的朋友們,給我們帶來了徵服統計學這個節目,今天我們將會討論什麼是模型,「模型」這個詞語常被用於許多語境,當我是孩子的時候 「模型」是我用膠水粘合的玩具,當我長大了一些 「模特」就是那些衣著時髦的人,現在我是一名成年人了 「模型
  • 統計學:從數據入手 探尋事物內在規律
    大部分人對統計學的認識只停留在表面階段,認為統計學就是簡單的收集、整理和記錄數據。其實不然,統計學不僅僅是簡單的收集整理數據,它是一門通過分析挖掘數據內在數量規律性的科學,是一門研究如何解釋、分析和應用數據的方法論科學,是一門融合自然科學和社會科學的學問。 浙江大學數學系蘇中根教授說:「統計學專業是學習和研究隨機現象(不確定現象)規律的一門學科。
  • 統計學知識大梳理(終極篇)
    我的理解,《概率論與數理統計》更專業一些,偏理工科,會有大量公式的推導,知其然,知其所以然;而統計學這本書更基礎,側重於概念現象的解釋,一般會直接給出結論,而不要求掌握結論的數理推導過程,文理科皆可用。但不管是哪門課程,前期都是先講概率和概率分布。概率論是統計學的基礎,而隨機事件的概率是概率論研究的基本內容。
  • 《數學之美》告訴你如何使用數學思維解碼世界
    在書中,我們將會知道數學是如何破解文字的秘密,是如何傳遞信息,又是如何影響人類發展的。下面我們先從一個文字開始,來感受數學的神奇之處。文字背後的邏輯文字是一個偉大的發明,它將整個人類文明信息的傳播提升了不止一個數量級,也正是從這個時候開始,文化、甚至說文明才真正的在人類社會誕生。