論文中對數據進行統計學處理時需要注意的問題

2020-11-29 一式無憂

進行科研論文寫作,通常需要對取得的數據進行統計學處理。達晉編譯提醒大家,對此需要注意以下的問題。

一、對基線資料進行統計學分析。搜集資料應嚴密遵守隨機抽樣設計,保證樣本從同質的總體中隨機抽取,除了對比因素外,其他可能影響結果的因素應儘可能齊同或基本接近,以保證組間的齊同可比性。因此,應對樣本的基線資料進行統計學分析,以證明組間的齊同可比性。

二、選擇正確的統計檢驗方法。研究目的不同、設計方法不同、資料類型不同,選用的統計檢驗方法則不同。例如:2組計量資料的比較應採用t檢驗;而多組(不小於3組)計量資料的比較應採用方差分析(即F檢驗),如果組間差異有統計學意義,想了解差異存在於哪兩組之間,再進一步做q檢驗或LSD-f檢驗。許多作者對多組計量資料進行比較時採用兩兩組間t檢驗的方法是錯誤的。又如:等級資料的比較應採用Ridit分析或秩和檢驗或行平均得分差檢驗。許多作者對等級資料進行比較時採用卡方檢驗的方法是錯誤的。

三、假設檢驗的推斷結論不能絕對化。假設檢驗的結論是一種概率性的推斷,無論是拒絕Ho還是不拒絕Ho,都有可能發生錯誤(Ⅰ型錯誤和Ⅱ型錯誤)。因此,假設檢驗的推斷結論不能絕對化。

四、P值的大小並不表示實際差別的大小。研究結論包括統計結論和專業結論兩部分。統計結論只說明有無統計學意義,而不能說明專業上的差異大小。P值的大小不能說明實際效果的「顯著」或「不顯著」。統計結果的解釋和表達,應說對比組間的差異有(或無)統計學意義,而不能說對比組之間有(或無)顯著的差異。P≤0.01比P≤0.05更有理由拒絕Ho,並不表示P≤0.01時比屍≤O.05 時實際差異更大。只有將統計結論和專業知識有機地結合起來,才能得出恰如其分的研究結論。若統計結論與專業結論一致,則最終結論也一致;若統計結論與專業結論不一致,則最終結論需根據專業知識而定。判斷被試因素的有效性時,要求在統計學上和專業上都有意義。

五、假設檢驗的結果表達。P值傳統採用0.05和0.01這2個界值,現在提倡給出P的具體數值和檢驗統計量的具體數值(小數點後保留3位有效數字),主要理由有:一是以前未推廣統計軟體之前,需要通過查表估計P值,現在使用統計軟體會自動給出具體的P值和檢驗統計量的具體值(t值、F值等);二是方便根據具體情況判斷問題。例如P=0.051與P=0.049都是概率,不能簡單地斷定P=0.051無統計學意義而P=0.049有統計學意義;三是便於對同類研究結果進行綜合分析。

六、統計學符號的使用。統計學符號的使用應按照「統計名詞及符號」的規定,具體可參閱本刊投稿須知中的有關要求。

相關焦點

  • 醫學科研論文中常見的統計學問題
    為能有效促進統計學方法的正確使用,保證科研的科學性、可靠性,提高醫學科研論文質量,賽恩斯編譯對醫學科研論文中常見的統計學問題進行梳理和總結如下:一、實驗組與對照組沒有可比性。實驗組與對照組必須遵循均衡化的原則,即實驗組與對照組除處理因素不同外,其他可控制的非處理因素要儘可能保持一致,從而儘量排除非處理因素對結果的影響。各組間均衡程度越高,可比性越強。
  • 撰寫醫學論文這些統計學問題你要注意
    眾所周知,統計學主要是一門以統計學原理及方法為基礎,對科研數據進行採集,整理及分析的應用科學。在實際工作中,統計學問題已成為評價醫學論文質量高低的重要指標之一。統計學方法在應用過程中的錯誤與否會在一定程度上影響醫學科研結論的科學性、可靠性以及嚴謹性。
  • 醫學論文寫作中常見統計學問題分析
    統計學主要是一門以統計學原理及方法為基礎,對科研數據進行採集,整理及分析的應用科學,其在醫學研究工作中具有不可替代的重要地位。在臨床實際工作以及相關醫學研究中,統計學方法是醫務工作者在遭遇問題時獲取該問題的相關原因以及理論依據的重要途徑。
  • 大數據下的「應用統計學」與「經濟統計學」,如何抉擇?
    這些調查、問卷經過篩選和處理之後,將會變成一系列數字和圖表,這就是統計過程,而統計對我們的工作、生活乃至政府決策都產生著直接的影響。本文,將對與統計學有關的「應用統計學」與「經濟統計學」兩個專業進行對比分析。
  • 醫學寫作中數據的統計方法及結果常見問題及分析
    科學研究很早就已經從簡單的定性分析深入到細緻的定量分析,科研工作者要面對大量的數據分析問題,科研數據的統計分析結果直接影響著論文的結果分析。在醫學科研寫作中,實驗設計的方法直接決定了數據採取何種統計學方法,因為每種統計方法都要求數據滿足一定的前提和假定,所以論文在實驗設計的時候,就要考慮到以後將採取哪種數據統計方法更可靠。醫學統計方法的錯誤千差萬別,其中最主要的就是統計方法和實驗設計不符,造成數據統計結果不可靠。
  • 論文中統計報告的注意事項:多因素模型和診斷試驗|協變量|統計學|...
    ,改善論文質量。在之前的文章中,我們介紹了p值、置信區間、研究估計值等報告時要注意的問題,今天這篇文章我們再來看一看多因素模型和診斷試驗中統計報告的注意事項,以及結論和解釋部分要注意的問題例如,在接受活檢的患者中測量某標記物,可以報告如果採用該標記物的某個水平作為cutoff值,來確定患者是否需要活檢,照此執行將會進行多少活檢,又有多少的癌症被發現和遺漏。
  • 統計學需要一場變革
    這本書的書名在當時看起來並不會「暢銷」,但實際上這本書卻取得了巨大的成功,而且還使菲舍爾成為現代統計學之父。在這本書中,他著眼於研究人員如何將統計檢驗理論應用於實際數據,以便基於數據得出他們所發現的結論。當使用某個統計假設來做檢驗時,該檢驗能夠概述數據與其假設的模型之間的兼容性,並生成一個p值。
  • 關於數據科學中數學和統計學的完全指南
    :Unsplash 「數據科學家是程式設計師中最擅長統計學、統計學家中最擅長編程的人。」統計學–數據科學的數學和統計學統計學用於處理現實世界中的複雜問題,在此基礎上,數據科學家和分析師可以尋找有意義的數據趨勢和變化
  • 2001.6:關於統計學的性質與發展問題
    專業建設是為了培養適合社會需要的專業人才;學科發展是為了加深和拓展學科自身的研究方向。在我國,高等教育中現在已將統計學專業列歸理學門類,屬於專業目錄中的第一級專業。並且規定在授予學位時可視情況授予理學學位或經濟學學位。我認為這是一個進步,但又不完全合理;按照「大統計」思想,統計學可以劃分為統計理論、統計方法和應用統計三個層次。
  • 大數據時代,統計學專題及常見問題 - CSDN
    機器學習 Machine Learning:提供數據分析的能力,機器學習是大數據時代必不可少的核心技術,道理很簡單:收集、存儲、傳輸、管理大數據的目的,是為了「利用」大數據,而如果沒有機器學習技術分析數據,則「利用」就無從談起。
  • 醫學論文稿件中常見的統計描述問題
    統計學在醫學科學研究中佔有重要地位,統計學內容豐富且不斷發展,如未充分了解,容易導致在科研過程中普遍誤用。下面,達晉編譯對國內外醫學論文中常見的統計描述問題進行歸納:一、統計圖表問題。在對研究資料或研究結果進行描述時,統計表和統計圖是呈現數據特徵和分析結果的重要工具。製作統計表時要求層次清楚、主次分明、符合邏輯。醫學論文中的統計表經常存在以下問題:1.主謂顛倒:統計表的標目由橫標目(主語)和縱標目(謂語)構成,主語(被研究的事物)一般置於表的左側,謂語(說明主語的各項指標)一般置於表的右側,醫學論文中經常會發生主謂安排不合理或重複的情況。
  • 機器學習才不只是統計學的美化!
    人工智慧可見的發展不僅僅局限於大型計算機和更優的數據集。近期在深度神經網絡及其相關領域的成功,正說明了機器學習代表著科學技術進步的最前沿。機器學習!=統計學「當你集資時,需要人工智慧。當你招聘時,需要機器學習。當你執行任務時,需要邏輯回歸。」—推特網友正如標題所說,本文主要強調機器學習不只是統計學的美化。
  • 在寫作中注意這四個問題,論文順利發表!
    本文轉載自【微信公眾號:社科學術圈,ID:shkxquan】經微信公眾號授權轉載,如需轉載與原文作者聯繫我們都很清楚,對於每一篇論文而言,都是需要我們一個字一個字地去寫,去把它完成。但是寫和寫之間可能真的存在很大的不同。在我看來,如果能在落筆成文的整個進程之中一直注意到這樣四個問題的,論文的質量會有很大提升。
  • 統計學:從數據入手 探尋事物內在規律
    在2012年教育部最新頒布的本科專業目錄中,經濟統計重又劃歸為經濟類,授予經濟學學位;同時在統計學類中,新增加了應用統計學,和統計學一起授予理學學士學位。 這部分課程主要有:高等數學、線性代數、概率論與數理統計,有些要求較高的院校還會開設數學分析、解析幾何、常微分方程、偏微分方程、複變函數等。另一部分是專業課,專業課的重點更多是讓學生從統計的角度來思考問題。
  • 用Python一次性把論文作圖與數據處理全部搞定!
    結果——  「學妹這樣不行的呀,共聚焦顯微鏡下拍攝的兩個探針的信號,需要做共定位分析,去算一下共定位係數和 Pearson 相關係數吧。  數據圖除了做單因素方差分析還要重點看有沒有顯著性差異。」  以為拿到好數據就可以喘口氣,沒想到統計和作圖又開始讓人頭禿。
  • mba畢業論文數據分析方法有哪些?
    作者:新風學術網 數據處理和初步分析是根據待論證的論點,將實驗觀察等原始數據或二次數據進行統計學處理,並用相應文字或圖表表達,供在定量分析中應用。
  • 統計學是什麼?| 統計學七支柱
    自誕生至今,統計學的工作內容經歷了翻天覆地的變化:從極端強調「統計學家僅收集數據而不分析」,轉變為從計劃到分析的所有研究階段皆積極尋求與科學家的合作。並且,統計學工作者面對不同的科學領域時,需要相應調整自身角色:在某些應用中,我們接受基於數學理論推導的科學模型;而某些應用中,我們構建如牛頓力學體系一樣穩定的模型。
  • 提高數據分析的科學性與透明度,用統計學「反轉」中心法則
    而她的研究內容在很多人眼裡或許稍顯枯燥:針對前沿的生物學問題開發新的統計學方法,尤其著重於對大規模基因組和轉錄組數據進行分析方法的開發。 由於高通量實驗技術的發展,生命科學從一個靠觀察實驗為主的學科逐漸變得更加需要定量化,而這些大規模數據的產生也需要算法才能夠進行分析,從而總結出數學規律並用規律來刻畫事物的本質。
  • 統計學中p值的含義和顯著差異性分析
    通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。所有的檢驗統計都是正態分布的嗎?
  • 提高數據分析的科學性與透明度,UCLA統計學教授反轉中心法則
    「對我而言,回答了自己心中的問題或者做出一個新的發現,這種成就感要遠高於生活中的其他快樂。」李婧翌對《麻省理工科技評論》中國這樣說道。而她的研究內容在很多人眼裡或許稍顯枯燥:針對前沿的生物學問題開發新的統計學方法,尤其著重於對大規模基因組和轉錄組數據進行分析方法的開發。