從HQI和p值了解手持拉曼的識別與驗證技術

2021-02-15 瑞士萬通

如今,可攜式設備的發展已為製藥行業的質量控制、質量保證和製造帶來了全新的技術革命,使原材料識別和驗證方式發生了巨大變化。可攜式設備的性能已顯著提高,並在某些情況下,其數據質量不亞於實驗室儀器。

拉曼光譜法是快速識別未知樣品的重要方法之一,而在手持式拉曼光譜儀中,用作光譜數據分析的兩種最常見的數學表示形式為Hit Quality Index(HQI)和p-values(p值)。其中HQI是未知樣品匹配的首選方法,而p值最適合驗證已知樣品的身份。我們以Mira P來說明。

資料庫匹配是光譜學中用於研究未知物質的一種行之有效的方法,通常將未知樣品的光譜譜圖與已知材料的經過驗證的光譜圖庫進行互相關聯並比較, 然後通過計算HQI來量化每個潛在匹配項的相關程度(相似度)。

HQI的值介於0到1.0之間,數值越大,則表示未知樣品譜圖與已知的參考圖譜之間的相似度越高,未知樣品和參考之間的相關性最高為1。在典型行業,例如製藥領域中通常將最小HQI設置為0.95,以此來判定未知樣品與標準圖譜是否「匹配/不匹配」。

注意:HQI只反映未知譜圖與已知圖庫的相關性,並非衡量所測材料的純度。因此可能導致非常相似的材料的發生錯誤識別。換句話說,使用HQI進行分析可導致誤報。如下所示分子及其譜圖:

與基於光譜之間相似性的識別技術不同,該驗證方法基於各個光譜之間的差異,稱為主要成分分析(PCA),這是一種統計分析,可將複雜的數據集縮減為最能描述數據的基本特徵。該方法將高度相關的光譜轉換為一小組正交變量,並繪製出散點圖,並以此建模。

PCA散點圖與模型極限組合成為參考模型,模型極限由置信區間確定,置信區間由霍特林統計量而來。下圖中分別為置信度為90%和95%的橢圓,可以用來對樣本進行測量。將每個樣本光譜投影到PCA模型上,以查看其是否符合模型極限。

當將樣品光譜投影到模型空間上時,我們得到的結果為p值。在統計學上,當p值小於α(顯著性水平)時,我們可以拒絕原假設(H0)。對於PCA分析和拉曼光譜的驗證來說,原假設(H0)表示「測得的光譜屬於所用構建模型「,通常我們選取α=0.05。此時使用PAC模型以及統計得到的p值,即可表明脂肪酸之間的無限區別。

注意:PCA模型的有效性完全取決於訓練集。訓練集是模型群體中高度相關的光譜庫。通常至少收集20種具有某種允許變化的單一物質的光譜來構建訓練集。

本文闡述了Mira P手持式光譜儀的識別和驗證方法,分別針對不同應用的獨特分析。

當樣品身份未知時,我們使用HQI進行識別;

當需要確認樣品時,我們使用p值進行驗證。

PEOPLE YOU CAN TRUST | 萬般信任 精通分析

400-604-0088

  Marketing@metrohm.com.cn

相關焦點

  • p值誤我?——「貝葉斯因子」了解一下
    文章信息:跳出傳統假設檢驗方法的陷阱——貝葉斯因子在心理學研究領域的應用發表於《應用心理學》2018年 24卷 3期寫在前面:p值p值是指在一個概率模型中,統計摘要(如兩組樣本均值差)與實際觀測數據相同
  • 美國宣布禁用p值,原來p值很危險,如何取代p值?
    今天談的當然是不一樣的題目,雖然它是一個很重要、很嚴肅的題目,但我希望大家可以輕鬆一點,所以也要放兩部電影片段給大家看,一部是《玉蘭花》,另一部則是《班傑明的奇幻旅程》,這兩部電影都有助於我們來了解今天要談論的主題:p 值的陷阱。  科學的統計學危機:p 值有什麼問題?  為什麼要談論 p 值的問題?
  • 【p值之爭】史丹福大學陸教授有話說
    觀察到的p-值是個統計量,也就是統計觀測值。自身有方差。有時看著p值很小,置信區間卻很寬。但所有的替代方案都會存在同樣的問題。所以p值是評價隨機影響的重要指標,是必要條件之一。但不是充分條件。只用p值決定科研成果是對p值的錯誤使用。醫生不會用一個指標去診斷疾病」。「臨床意義在先,統計學意義在後。無臨床意義的研究不需要統計驗證。」
  • 【統計】p值和FDR
    那麼我們通常所說的p值的計算公式可以簡單寫成:p值衡量的是一個原本應該是𝐻0的判斷被錯誤認為是𝐻1(𝑟𝑒𝑗𝑒𝑐𝑡𝐻0)的比例,所以它是針對單次統計推斷的一個置信度評估。從另一個方向理解,在假設𝐻0成立的前提下,即先假設「兩組沒有差異」,比較兩組的差值,如果差值符合正態分布,p值越小,說明「兩組沒有差異」的概率越小,通常情況下,當p值小於0.05時,認為是小概率事件,即「兩組沒有差異」「幾乎不可能發生。我們接受𝐻1,「兩組有明顯差異」,就是我們經常在論文裡看到的陽性結果。
  • 給數據科學家直白解釋P值的含義
    最近,有人問我如何向外行人簡單地解釋 p 值。我發現這很難做到。即使對了解 p 值的人,解釋 p 值總是一個令人頭疼的問題,更不用說對不懂統計學的人了。我去維基百科找了一些東西,這是它的定義:在統計假設檢驗中,對於給定的統計模型,p 值或概率值是在原假設為真時,統計值(如兩組間的樣本均值差)與實際觀察結果相等或更大的概率。
  • StatQuest生物統計學 - 線性擬合的R2和p值
    ,了解了直線擬合和曲線擬合的一般方法,但是如何衡量線性擬合的效果呢?數據擬合後的效果由兩個參數來衡量:一個是R2,另一個是p值。R2是擬合所能解釋的數據波動的比例由於隨機誤差和變量效應的存在,對於任何任何測定數據相應變量Y,它的值都可以由變量效應X以及隨機誤差來表示:Y=X+Error或者Y=X1+X2+X3+...+Error。
  • 沿用還是棄用P值:還是讓它錦上添花吧!| BMC Journal
    the philosophy of medicine 期刊:Philosophy, Ethics, and Humanities in Medicine 作者: Sara Asato & James Giordano 發表時間:2019/06/11 DOI:10.1186/s13010-019-0077
  • 聽說P界值要從0.05降到0.005?不,這不是真的不是真的
    Ioannidis, 2018)鑑於對p值存在廣泛的誤解,誤用和過度信任,為了控制假陽性結果的誕生,建議降低檢驗水準到0.005你這是不想讓研究生畢業的節奏啊!同樣的研究要驗證p更重要的,既然知道問題來自於誤解和誤用,那不去解決這些根本問題,還是提議「權衡之策」:對「無辜」的p值本身下手,真的很好嗎?P值是什麼?我們組間差別的t檢驗為例:比如我們要驗證一種新的治療方法它的治療效果不同於傳統的治療方法。
  • 驚爆| p值不是什麼?【連載3】
    [注1]」中國藥業人若想「不畏浮雲遮望眼[注2]」,除了提升自己的思維和理念,還有其他辦法嗎?統計學,不好學!接來下的文字很「專業」,敬請硬著頭皮往下看。【續昨】p值不是什麼?我本來放這部電影都是為了在教學上解釋 p 值的概念,可是後來當我注意到對於 p 值的爭議之後,覺得其實這一部電影也可以用來幫我們了解為什麼用 p 值來做統計推論有可能是錯的。
  • 被Nature科學家封殺的P值,到底有什麼意義?
    顯然,這種為了發表文章而人為地達到p<0.05要求的做法,是嚴重違背實事求是的科學精神和學術道德的,當然也嚴重損害了假設檢驗的聲譽。那麼P值的真正含義是什麼呢?因此,我決定講清楚p值是什麼,以及如何將它們用於假設檢驗,以期有助於你更加直觀透徹地理解p值,顯然我們不能跳過對其他相關概念和p值定義的基本理解,但我保證會以一種直觀的方式進行解釋,而不是直接向你扔去一堆技術術語。
  • P值之死
    為什麼P值沒有達到人們的期望?它的問題到底在哪?現在和數說君一起來梳理一下P值和假設檢驗的歷史,並從中尋找答案吧。KarlPearson很多統計學家誤以為關於P值的正式文獻是費雪發表的,其實不然,最早在文獻中正式闡述P值及其計算的,是統計學家Karl Pearson,你可能不了解他,但是他的Pearson卡方檢驗你一定知道,這篇關於卡方檢驗的文章當時被發表在《哲學雜誌》上,文章中一同被介紹的,還有一個被叫做「P值」的東東,見史料。
  • 人臉識別技術介紹和表情識別最新研究
    作者:夏初來源:公眾號|計算機視覺工坊(系投稿)一、人臉識別技術介紹人臉識別作為一種生物特徵識別技術,具有非侵擾性、非接觸性、友好性和便捷性等優點。為提高人臉識別準確率,人臉校正可以儘可能的降低由於姿態和表情導致的人臉變化,獲取正面或者平靜狀態下的人臉照片。特徵提取利用不同的特徵,對圖片進行相似度的衡量和評價。人臉識別主要包括一對一或者一對多的應用場景,對目標人臉進行識別和驗證。人臉表達模型主要分為2D,2.5D,3D。2D人臉指的是RGB,灰度和紅外圖像,是確定視角下表徵顏色或紋理的圖像,不包括深度信息。
  • 【Minitab技巧】為什麼輸出中的 F 值和 p 值顯示為星號?
    星號表示無法計算的缺失值,這是因為模型是飽和的,而且誤差自由度不足。假設一個飽和全因子 DOE 模型的示例:包含因子 A、B 和 C 而無仿行、無中心點且無區組的 3 因子、二水平設計。此設計包含 8 個試驗遊程。分析設計時,選擇通過包含所有主效應(A、B、C)和所有交互作用項(AB、AC、BC、ABC)來擬合飽和模型。
  • 二、統計檢驗與p值
    我們以零假設為基礎,計算概率(p值),做出統計推斷。如果p值小於閾值,則拒絕零假設,接受備擇假設。有時候會有學生找我說,幫忙算個p值,我就會問,你的零假設是什麼?這句話等同於問「你想幹嘛?」,神奇的是,有些時候有些人就真的不知道自己想幹嘛!
  • JAMA:p值檢驗,你用對了嗎?
    研究表明,文章作者報告p值的越來越多,但他們誤解了p值的含義。p值是報告科學結論是否真實的統計學意義的概率值。研究人員發現,因為p值常被誤用,對p值使用的增多並不代表生物醫學研究或數據分析水平的提高。"研究人員通常對p值的使用技術不佳,用有偏見的方式使用,因此變得非常具有誤導性。"
  • 美國統計協會關於統計顯著性和p值的說明
    研究者往往希望將P值⽤於描述零假設成⽴的具體真實性有多⼤,或者是在隨機抽樣中抽取到觀察數值的實際可能性是多少,但是P值與⼆者都相去甚遠。事實上,P值是關於我們如何去解釋特定假設的數據,⽽不是對這⼀假設的解釋本⾝。(3)科學的結論和政策的制定不可以僅僅基於p值是否通過特定的閾值。
  • 為什麼做科研都追求結果達到顯著性水平(p值小於0.05)?
    - 來源 / 南心網數據統計分析博客 -- 編輯 / 三倉小編 -在科學研究中,人們都希望結果達到顯著性水平,即p值小於0.05,例如希望兩組結果具有顯著性差異,兩個變量存在顯著性相關,回歸係數達到顯著性水平,等等。在做研究假設時,我們絕大多數也是在做p值顯著的假設。那麼,人們為什麼那麼熱衷p值達到顯著性?
  • 九成以上研究者或無法正確理解p值
    一項針對Science、Nature和PNAS三本頂級雜誌的調查表明,在過去的20年,出現在三本雜誌中的圖表仍高度、且越來越依賴於p值(Cristea & Ioannidis, 2018)。但是,如此常用的p值在統計學界和科學界其實褒貶不一。
  • 800名科學家聯名主張廢除p值!斯坦福教授:沒有p值將充滿廢話
    【新智元導讀】統計顯著性和p值是衡量研究可靠性的重要標準。這個標準是怎麼來的?今年3月Nature上一篇主張廢除p值的文章,為何獲得800位科學家聯名支持?如果沒有p值門檻,研究質量會出現大滑坡嗎?戳右邊連結上 新智元小程序 了解更多!每年,全球有數百萬學生修讀統計學課程。隨著世界上的數據量越來越大,統計學已成為越來越受歡迎的話題。
  • 射頻識別技術工作原理和分類
    千家安防網:射頻識別(RFID)技術近幾年得到了飛速的發展,本文主要就射頻識別技術工作原理、標準及分類進行探討,讓我們更深入的了解射頻識別(RFID)技術。下面我們正式開始。