趕鴨子上架,靠網易公開課再學一次統計學也是醉了。幾個沒學過的和經常搞錯的概念記錄下來記錄下……
統計,先記清楚數,記清楚口徑
莖葉圖:莖是10位(類),葉子是個位(種),可以看到一個按照十進位的分布(各類上的種的分布)
箱線圖:middle half其實是25%-75%的分布
Inferrential 的統計,不僅是時間的推算,也包括部分到整體的推算
μ 是總體的,X是sample的,sigma是整體的,s是sample的
樣本方差用n-1,證明是個好點的估計量
樣本方差是總體方差的好估計量,但標準差卻不是
在population情況下,方差可以被簡化為每一項的平方的均值 - mean的平方
隨機變量裡,隨機變量並不是一個要算的東西,而是一個map隨機過程到值得工具
z-score 是離mean有多少個標準差,不一定是正態分布
68 - 95-99.7 rule告訴百分之多少的數字fall within 1-2-3 標準差,在正態分布裡
中心極限定理:在實際工作中,只要n足夠大,便可以把獨立同分布的隨機變量之和當作正態變量。這種方法在數理統計中用得很普遍,當處理大樣本時,它是重要工具
Sampling distribution of sample mean: 會和原來的mean一致
詢問一個sample的mean和整體mean的差異,等價於整體的mean和sample的距離
sample的deviation可以看做是整體的代言,卻和sampling distribution的deviation完全兩回事 —— 後者是關於mean的分布的
p值,是在0假設的條件下,能夠出現採樣結果的概率
x-y的方差 = 兩個方差之和,而不是差
SE最小化的計算用到了偏微分
最小方差的直線的係數m的計算,分分合合,攘外安內
R2說明多少變動是趨勢線可以解釋的
m可以被看做cov(x,y)/var(x)
卡方分布:檢查理論分布和實際觀測的吻合
聯合卡方分布的自由度:行-1*列-1
可汗學院依舊是我目前接收到的最有效的教育方式,簡單通俗而且高度足夠,我對Khan的崇拜依舊是排在Top的。
Long-press QR code to transfer me a reward
愛,就賞點吧
As required by Apple's new policy, the Reward feature has been disabled on Weixin for iOS. You can still reward an Official Account by transferring money via QR code.