碩博學術專欄——什麼是描述統計?

2021-02-20 講李學術

描述統計(descriptive statistics)是一套用以整理、描述、解釋資料的系統方法與統計技術,也是數據從初始狀態(raw data)成為可被理解的統計量數的一套操作程序。由於量化研究所搜集的資料數量通常十分龐大,如何以簡單明白的統計量數來描述大量資料,並作為彼此溝通的共同符號語言,便成為描述統計的主要責任。

描述統計對於量化數據的處理,主要有兩個途徑,第一,運用次數分配表來整理並描繪變量數值分布情形,並利用統計圖表來表現出數據的特性與分布情形。第二,透過描述統計量的運算,建立初步的統計指標,作為後續統計分析的基礎。

基本上,描述統計主要所處理的數據,是由樣本所獲得的原始資料所計算推導出的統計量數,稱之為統計量(statistic)。這些統計量直接由樣本所獲得的數據(例如某班學生的身高或體重數據)計算得出,是描述樣本數據特徵的最佳指標,通常以英文字母表示,例如與s。如果今天所處理的資料不是樣本資料,而是母體數據(例如全臺灣的青少年身高或體重數據),此時描述統計所產生的量數稱為參數或母數(parameter),用以描述母體數據的分布特徵,通常以希臘字母表示,例如μ與σ。

描述統計中,最重要的統計量數是用以描述測量觀察值集中情形的集中量數,以及用以描述這群測量觀察值分散狀況的變異或離散量數。此外,數據的分布特徵可以利用偏態與峰度係數來說明是否符合常態性。運用集中、變異、偏態、峰度四種量數可以完整說明一組數據的分布狀況,同時也符合所謂一至四級動差(moments)的數理原理,因此可以說是描述統計的四大基本量數。本章首先介紹次數分配的概念,再針對描述統計的四大基本量數。本章首先介紹次數分配的概念,再針對描述統計的四大基本量數進行說明,並配合SPSS軟體來示範操作方法。

相關焦點

  • 碩博學術專欄——偏態與峰度
    除了變異量數,描述統計量還可以利用偏態(skewness)與峰度(kurtosis)來描述數據的分布特徵。尤其是當研究者關注數據的分布是否為常態時,偏態與峰度時非常重要的指標。一個變量的數值除了具有中心位置與一定的分散程度,其數值的分布可能為對稱或不對稱。描述一個變量的對稱性(symmetry)的量數稱為偏態係數。
  • 碩博論文必備神器:百度學術推出開題助手
    . · 2015-11-26 15:44:44 ·產經 開題報告是指為闡述、審核和確定畢業論文題目而做的專題書面報告,是碩博研究生學術生涯的重要部分,也是學位論文研究寫作的先導和基礎。
  • 碩博學術專欄——主要的抽樣分配(二)
    F分配定義若有兩個獨立的卡方隨機變量x²(v1)與x²(v2),各自除以自己的自由度後相除,其比值稱為F隨機變量(F random variable):此一利用卡方比值所定義的統計分配,最早是由Fisher與1924年推導得出,後於1934年,Snedecor將此比值分配定名為Fisher的縮寫F分配以推崇其貢獻
  • 碩博學術專欄——中央極限定理
    正因為抽樣分配為常態分配這個基本假設的存在,樣本統計量的機率分配可以利用常態分配來表述,並據此來進行假設考驗。基於上述幾個特徵,樣本統計量可以根據抽樣分配的機率原理來推估母數,並估計抽樣誤差的大小,稱為中央極限定理(Central Limit Theorem)。
  • |學術|教學|知網|論文|本碩博_網易訂閱
    學術公開課  ID:academic_times  推薦理由:學術公開課服務數百萬碩博生和科研工作者,內容豐富,包括前沿的科研資訊、優質的科研學習課程、勁爆碩博就業信息等等,只要你需要的,我們都會努力提供服務,幫助你變身科研達人
  • 秘訣發布,科研學術兩不誤
    科研菌還建有多個學術討論&期刊投稿群,等您來加入!群內談論學術,科研,國自然,投稿選刊等問題!柳葉刀學術海內外本碩博聯誼平臺海內外本碩博聯誼平臺,全球高精尖本碩博單身交友相親平臺。在這裡你可以結識很多優質單身,可在輕鬆愉快地環境中交友、相親,並可學術交流,工作招聘、本碩博一站式服務。
  • 碩博學術專欄——單連續變量t檢驗
    自由度問題所謂自由度(degree of freedom)是指一組數據在計算特定統計量的過程中,可以自由變動的數目。以單一樣本平均數的Z檢驗來說,所有的樣本觀察值都可以直接應用於計算Z統計量,因此自由度等於樣本大小n,但是在單一樣本平均數的t檢驗中,由於母體標準差未知,必須利用樣本標準差來推估,因此耗費一個自由度去計算樣本平均數,使得單一樣本平均數的t檢驗的自由度為n-1。
  • 知網碩博論文查重收費標準
    知網碩博論文查重黎明馬上就要碩士畢業了而碩博畢業論文,收費標準大約在200到300元之間。其查重系統一般有「學術不端文獻檢測系統」(簡稱為知網vip5.1)與「學位論文學術不端檢測系統」(簡稱為知網tmlc2)兩個。這兩個系統的檢測字數大約在30萬字以內。有時候會出現字數在範圍內,但提交卻顯示失敗的情況,這種情況很有可能與表格、腳註有關。
  • 教育部動真格的了,倒查5年碩博學位畢業論文,看誰還敢論文造假
    而這個論文就是大家在進行各個學術領域和描述學術研究成果的一個文章,可以說學術論文就是對大學生學生生涯的一個檢測。大學畢業論文的重要性非常大,尤其是重點大學對於學生的畢業論文是非常的看重,很多學生在寫畢業論文的時候都是經歷了無數次的修改和查重,才最後勉強過關。
  • 《中華醫學統計百科全書. 描述性統計分冊》
    描述性統計分冊》 作者 總主編:徐天和   分冊主編:田考聰書號 ISBN 978-7-5037- 6468-4開本 16開裝幀 平裝出版時間 2012年4月定價 38元內容簡介:    《中華醫學統計百科全書》是一部醫學統計參考工具書
  • 碩博學術專欄——雙樣本平均數檢驗的抽樣分配
    於雙樣本檢驗的虛無假設為μx1-μx2=μ0,統計檢驗程序是針對兩個樣本的差異分數x1-x2來進行,或以差異分數D(difference)表示。此時,檢驗的抽樣分數(H0分配)亦需反應兩個樣本抽樣條件的不同,稱為差異分數抽樣分配(sampling distribution of the difference) 。
  • 統計學之描述性統計 | Descriptive Statistics
    「統計學就像比基尼,你所看到的就是真實顯露的,但隱藏起來的才是至關重要的」——無名氏統計是有一些枯燥,但同時也可以很有趣,不是麼?我們知道統計學包括描述性統計和推論統計,而今天的主題是描述性統計的介紹。什麼是描述性統計呢?
  • 知網學術不端檢測系統有哪些版本,都有什麼區別?
    知網學術不端檢測擁有6大子系統,涵蓋了專科、本科、碩博、學術期刊等論文檢查範圍,具體的子系統細分如下:PMLC(大學生論文檢測系統)知網學術不端PMLC檢測系統適用於大專、本科的論文查重檢測,具有檢測識別快速精準、線上實時全文檢測、院校內部互相比對、觀點剽竊自動檢測、跨語言互譯檢測、表格與公式檢測和圖片OCR識別處理等優勢。
  • 如何判斷碩博論文質量
    撰寫論文最重要的一點就是不要抄襲,也就是我們常說的學術不端行為。一個論文中一旦存在大量的學術不端行為那將會被查重軟體標紅,重發給論文作者進行修改。那麼查重軟體如何判斷碩博論文質量?一、碩博論文在哪個軟體檢測大部分的碩博高校都會給知網進行合作,無論是在平時的碩博士或者教師要查資料,或者是在碩士博士畢業的時候查重都是採用知網論文系統進行的。
  • 碩博學術專欄——常態分配
  • 中國知網官方碩博論文檢測平臺詳細介紹
    在你的碩士學位論文或博士學位論文滿足知網查重率,那就能判定你學位論文的水平了,還能利用知網把查重率較高的論文減少重複率,這就是知網最典型的作用了,知網VIP對碩博論文查重的學生,從業者而言是不可或缺的查重工具。
  • 從統計顯著性到顯著性統計
    美國統計協會在 2016 年發布《關於p值的聲明》, 在 2017 年開展以「 p<0.05 以外的世界」為主題的座談會,在 2019 年《美國統計學家》雜誌上發表特刊,讓統計學界對 p 值問題做出的響應走進公眾的視野。在特刊中,43 篇文章都圍繞著一個問題在討論:我們究竟做了什麼導致 p 值的作用在減弱。
  • 海南大學2020年碩博連讀博士研究生招生工作辦法
    2.我校在讀的2018級全日制、學術型、非定向、非在職碩士研究生(不含委託培養研究生、定向培養研究生、專業學位研究生)。 3.進入博士階段學習前(2020年9月1日)須完成碩士階段培養計劃規定的課程學習,學習成績優秀(無不及格科目),通過中期考核及開題報告。
  • 碩博論文對重複率有什麼要求?
    論文查重平臺有很多,基本上都可以查重所有論文,比如中國知網就是一個專業論文檢測平臺,碩博論文查重完全是可以選擇這個平臺的。碩博論文重複率標準是多少?不同學校對碩博論文的標準都是不一樣的,一般學校要求碩博論文查重標準是5%左右,但是不同的論文查重系統結果也會有不一樣的。比如知網論文查重是35%,可能其他放入論文查重是30%或者百分之40%都是有可能的,這就是論文查重系統的差異化。在碩博論文查重過程中,學校要求的查重系統是最準確的,其他的查重系統只能作為參考。
  • 機器學習數學基礎:數理統計與描述性統計
    概率論中, 我們研究隨機現象, 隨機變量, 但是我們是假設它們的分布已知, 比如已知某一隨機變量服從什麼分布, 在這個基礎上研究性質, 特點和規律(數字特徵啊, 隨機變量分布啊等), 而數理統計中, 我們研究隨機變量的分布未知或者一部分未知, 要去做的就是通過從未知分布中抽取多個樣本, 對這些數據進行統計分析, 從而研究隨機變量的分布等。