孔乙己自己知道不能和他們談天,便只好向孩子說話。有一回對我說道,你讀過書麼?我略略點一點頭。他說,讀過書,我便考你一考。茴香豆的茴字,怎樣寫的?我想,討飯一樣的人,也配考我麼?便回過臉去,不再理會。孔乙己等了許久,很懇切的說道,不能寫罷?我教給你,記著!這些字應該記著。將來做掌柜的時候,寫帳要用。我暗想我和掌柜的等級還很遠呢,而且我們掌柜也從不將茴香豆上帳;又好笑,又不耐煩,懶懶的答他道,誰要你教,不是草頭底下一個來回的回字麼?孔乙己顯出極高興的樣子,將兩個指頭的長指甲敲著櫃檯,點頭說,對呀對呀!茴字有四樣寫法,你知道麼?我愈不耐煩了,努著嘴走遠。孔乙己剛用指甲蘸了酒,想在柜上寫字,見我毫不熱心,便又嘆一口氣,顯出極惋惜的樣子。
【注】茴字的四種寫法到底是啥?標準答案是:上面都是草字頭,下面分別是回、囘、囬、廻。
言歸正傳,那麼今年的高考作文到底有多少種解法呢?前幾天師妹雖寫了滿分作文《統計學生的高考滿分作文》,可是今年的高考作文的解法遠不止這一種。
且看今年的高考作文題目:
【方法一】自然是最常用的卡方檢驗啦。卡方檢驗又稱Pearson卡方檢驗是在原假設下對資料的觀測分布(observed distribution)和期望分布(expected distribution)進行比較,主要用於檢驗兩個或多個總體率(或構成比)是否有差異,或兩個變量之間是否關聯。
【結果】單純從數字看,禿頂的挨打率為49.5%,非禿頂的挨打率為48.7%,似乎禿頂的挨打率高一點,可是無論是Pearson卡方、聯繫校正、還是Fisher精確概率法,P都>0.05,看來兩組人群挨打率的差別是沒有統計學意義的。
【相關文章】
四格表卡方、校正卡方、Fisher之SPSS實現
用Epi Info和SPSS進行四格表卡方、校正卡方和Fisher精確檢驗
[常見疑惑]這裡應該用卡方、校正卡方還是Fisher?
【視頻教學】醫學統計學--卡方檢驗01
【視頻教學】醫學統計學--卡方檢驗02
【視頻教學】醫學統計學-卡方檢驗03兼秩和檢驗01
【方法二】相對危險度(RR),相對危險度RR(Relative Risk)是前瞻性研究(隊列研究)中常用的指標,它是暴露組的發病率與非暴露組的發病率之比,用於說明前者是後者的多少倍,是用來表示暴露與疾病聯繫強度的指標。
【結果】RR=1.044,禿頂的挨打率是非禿頂的1.044倍耶,可是其95%CI(0.823,1.324)包含了0,還是沒有證據表明禿頂的挨打率高於非禿頂的。
【相關文章】
令人困擾的RR值和OR值
【方法三】Logistic回歸,在醫學科學研究中,經常會遇到因變量為二進位(二分法)數據(binary,dichotomous data),如疾病的發生或不發生、治癒或未愈、生存或死亡、取0和1的值等。同時,可能有多個自變量對因變量(或結果變量)產生影響,就可用二元Logistic回歸進行分析,這一方法在醫學流行病學研究中具有極廣泛的應用。
【結果】頭髮回歸係數的Wald檢驗,Wald 卡方為0.127,OR=1.087(0.687,1.720),可見髮型對於家長的態度是沒有影響的。
【相關文章】
Logistic 回歸:β、OR、RR與P值
四格表(12):二元Logistic回歸
【實戰】四格表Logistic回歸之SPSS實現
小議Logistic回歸模型
【乾貨】Logistic 回歸:從入門到進階
【方法四】雙樣本二項分布總體率檢驗是確定兩個總體比例是否有統計學差異的假設檢驗,以確定它們之間是否存在統計學差異。Minitab提供兩種假設檢驗Fisher精確檢驗(Fisher's exact test)和正態近似檢驗(normalapproximation test),當任何一個樣本的事件數(number of events)或非事件數小於5時,正態近似檢驗將不準確。而Fisher's精確檢驗對於所有樣本量都是準確的,但只能用於原假設為總體比例相等。
【結果】禿頂的挨打率為49.4949%,非禿頂的挨打率為47.4137%,別以為小數點位數多就有用,結果還是一樣,Z=0.36,P=0.772>0.05,差別還是沒有統計學意義。
【方法五】列聯繫數,屬於獨立性卡方檢驗,可用於描述兩個分類變量之間的關聯程度,係數值介於0至1之間,係數值越接近0,說明兩個分類變量幾乎沒有關係,越接近1,說明關係越密切,四格表資料的列聯繫數最大值為0.707,如需獲得更大的係數值,則決於表格的行數與列數。
【結果】列聯繫數接近0,表明孩子頭髮和父母態度這兩個分類變量幾乎沒有關係。
【相關文章】
四格表(10):兩名義變量的關聯性的列聯繫數
【方法六】Cramer V係數和φ係數,均屬於獨立性卡方檢驗,可用於描述兩個分類變量之間的關聯程度。Cramer V係數介於0至1之間,係數越漸近1表示行列關聯很強,接近0表示關聯很弱或不相關。φ係數只能用於四格表資料,介於在-1至+1之間,反映行列關聯的程度和方向。
【結果】Cramer V係數和φ係數均接近0,表明孩子頭髮和父母態度這兩個分類變量幾乎沒有關係。
【相關文章】
四格表(11):兩名義變量關聯性的Cramer V係數和φ係數
這個例子還有很多統計方法,比如參考【SPSS】牛刀殺雞:用廣義線性模型計算率的95%CI,【Minitab】雞刀殺雞:計算率的95%CI的簡易方法,率及其95%可信區間的計算分別計算禿頂和非禿頂挨打率的置信區間並進行比較,可能有些統計方法小編還沒學會,你對本次高考作文還有什麼解題思路,不妨留言說說。
【後記】相同的數據可以根據不同的分析目的,採用多種統計方法進行分析,因此讀者在統計分析時,不要局限於某種單一統計方法,換一種思路可能會海闊天空。當然也不能天馬行空,隨意使用各種統計方法,至於選擇何種統計方法往往取決於您的數據特點和設計要求。這次高考作文所得到的全是陰性結果,但不能隨意將結果捨棄哦,有時候陰性結果也能夠寫一篇很漂亮的文章的。
(2003年)全國統計教材編審委員會推薦使用教材·統計分析系列
《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》
《SPSS Statistics中文版統計分析教程電子書》
作者:李志輝 羅平主編
出版社:電子工業出版社
出版時間:2015年8月
定價:59.00元
頁數:468頁
開本:16開
【回復關鍵詞(單個詞)獲取下載地址】
學習資源包:SPSS ;文章目錄:文章 或 art
配套電子書:book 或 電子書
免費(試用)統計工具:
tool、minitab、epiinfo、epidata 或 size
投稿:mchgz@163.com
一起學SPSS統計互助QQ群:292265982
一起學SPSS統計互助微信群,請加小編微信:lizh_SPSS_001
小編給大家推薦一個值得關注訂閱號
更多值得關注的醫學健康類訂閱號,請回復「靠譜」