[Memo] 時間序列/多元統計/生存分析/數據挖掘

2021-02-08 渥然丹者

大三下學期學的挺用心的,就寫篇Memo大概記錄一下這些課程使用的材料or有參考價值的一些信息,以供大家參考。下面的內容包含以下幾門課程的若干資料:時間序列分析,多元統計分析,生存分析,數據挖掘。


注意:

老師課上使用的ppt不能夠提供。主要提供課本、可以參考的習題、其他與本課程相關的資料的下載地址。(均為網絡公開連結)下載可能需要繞牆(比如gen.lib.rus.ec),否則可能無法打開連結/下載成功。

 

全部內容僅供參考,不單純以考試為導向。

(周一的時間序列&數據挖掘,周二的多元,周四的生存分析,哈哈)



時間序列分析

課本:Time Series Analysis With Application in R (second edition)


課本下載:

在gen.lib.rus.ec網站搜索英文課本可找到,地址 http://gen.lib.rus.ec/book/index.php?md5=FFEE7CD924A7D9329F3F66323E8DA17C,如圖。點擊title右側連結可下載。 




書中習題答案下載:

(很容易找到,可搜索「課後習題答案-時間序列分析及應用(R語言原書第2版)」)

http://vdisk.weibo.com/s/CdmLnxwa4JvdF?from=page_100505_profile&wvr=6。

答案不要照抄,是有錯誤的;而且很多R代碼中調用的package在現在版本中的R已經沒有了,所以部分調用的包以及調用的函數也只作參考。李老師上課會寫代碼,感覺非常實用。



多元統計分析:

課本:應用多元統計分析(王學民 著)


相關資料:

移步王學民老師主頁(http://bb.shufe.edu.cn/ ,不需要登陸,進入教師主頁),有「《應用多元統計分析》……配書資料下載」。

內含ppt,書後練習答案,sas/jmp程序等各類文件,配合書使用。


相關資料地址:

http://bb.shufe.edu.cn/bbcswebdav/institution/%E7%BB%9F%E8%AE%A1%E5%AD%A6%E7%B3%BB/teacherweb/1987000028/index.htm



生存分析:

參考課本:The Statistical Analysis of Faliure TimeData (Second Edition)

(但是課上授課順序並不按照課本順序)


課本下載:http://gen.lib.rus.ec/book/index.php?md5=D00D7A83B13492D4937473B235F2B2FA

參考習題:自己沒看到比較完整的習題冊,基本就是google了一些survival課程的finalexam看一看。可以看看生存分析的題目大概長啥樣,開拓一下思路,絕大多數是沒有答案的。:-) 就隨便看看吧……。

印象裡面Lu Wenbin老師的一門Survival analysis的期末試卷感覺出的還挺不錯的,他的課程連結放在下面其他資料中。


其他資料:有時候遇到不太理解的概念,就試著找找相似課程,看看它們是怎麼講的,不過即使是同一門課程,講的側重點很多也不太一樣。

真的僅供參考啦。

NCSU survivalanalysis: http://www4.stat.ncsu.edu/~lu/ST745/ST745.html

Princetonsurvival analysis: http://data.princeton.edu/pop509

Lowa survivaldata analysis: http://myweb.uiowa.edu/pbreheny/7210/f15/index.html

Stanfordsurvival analysis: https://web.stanford.edu/~lutian/stat331.HTML




數據挖掘:

參考課本:Anintroduction to statistical learning with applications in R(但是講課順序會不太一樣,不過不知道勉勉黃會不會一直用這本哈哈)


課本下載:http://gen.lib.rus.ec/book/index.php?md5=F69A8BC47AF131BFA33EE8D6E360D579


其他的參考課本:(主要的課本沒看懂就再翻翻)

Patternrecognition and machine learning (Christopher M.Bishop)

Theelements of statistical learning (second edition)

機器學習(周志華,清華大學出版社)


其他:

推薦的python sklearn包(很多現成的數據挖掘方法整合在裡面)的講解網站:

http://scikit-learn.org/stable/index.html




好啦,就是這些。

Bye~


相關焦點

  • Python數據分析實戰:用Pandas 處理時間序列
    ,在數據科學和機器學習的背景下,時間序列分析所包含的內容更加複雜。工業領域中,一些監測數據,比如天氣溫度,也是一元時間序列。但是時間序列不止有一元時間序列,當同一個時間戳對應的觀測對象不只一個時,我們就有了多元時間序列。比如某個城市的空氣PM2.5的預測,我們可以通過PM2.5的歷史時間觀測值來預測。我們也可以通過當天(或者近期)的其他觀測對象來預測,比如風速,溫度,溼度等。多
  • 時間序列分析(三):平穩時間序列分析之數據準備
    平穩時間序列是時間序列中一類重要的時間序列,對於該時間序列,有一套非常成熟的平穩序列建模方法,這也是本節中將重點介紹的部分。對於非平穩序列,可以通過差分、提取確定性成分等方法,將轉化成平穩序列,再運用平穩序列建模方法進行建模。在實際操作中,由於樣本數據的匱乏,要根據樣本數據要找到生成樣本的真實隨機過程基本是不太可能的。
  • R語言時間序列分析
    鄭連虎,在數學學院取得理學學位的文科生,中國人民大學碩博連讀生在讀,山東大學管理學學士、理學學士個人公眾號
  • 國家外匯管理局整理髮布外匯統計時間序列數據
    日前,國家外匯管理局在政府網站(www.safe.gov.cn)上按照時間序列集中發布了外匯統計數據。這是國家外匯管理局首次系統性地整理和發布外匯統計時間序列數據。    近年來,適應涉外經濟發展的需要,國家外匯管理局按照國際通用指標和技術標準編制了國際收支平衡表、國際投資頭寸表、外匯儲備規模、外債餘額與結構等一系列統計數據,對分析涉外經濟形勢、監測跨境資本流動等發揮了重要作用,同時,社會公眾對外匯統計數據的關注度也與日俱增。
  • 統計數據挖掘在知客CRM中的應用分析
    (二)主要統計方法  1.運用描述性統計分析方法對數據進行初步分析。描述性分析是對初步整理後的數據資料進行分析,並用統計量描述這些資料的一種方法。它主要包括了相對指標分析、圖表法、集中趨勢和離散趨勢分析、相關分析等。  相對指標是運用對比的方法,反映某些相父事物之間數量聯繫程度的綜合指標。
  • 【新書推薦】【2019.03】MATLAB時間序列方法與實踐(江渝)
    全書將分三篇,*篇介紹時間序列的定義、基本概念、分析方法概況等基本知識。第二篇系統介紹時間序列的分析方法和分析模型,對於每個方法,都將介紹方法的原理、步驟、及詳細的MATLAB實現過程。第三篇將介紹幾個時間序列方法在經濟、金融等領域的實際應用案例。作者簡介江渝,上海財經大學數學學院副教授,日本北海道大學理學博士。
  • 「發個筆記」時間序列分析方法(實驗向):上手時序分析-SPSS
    時間序列是數理統計中應用性較強的分支之一,專門用於處理與時間有關的數據。可以試想一下,我們身邊有哪些和時間相關的數據?在大部分(保守一點)數據挖掘軟體的算法中,要求數據是分類屬性形式,也就是數據離散。因此常常需要將連續屬性的數據通過斷點進行劃分,最後歸屬到不同的分類,即離散化。
  • R語言學習路線和常用數據挖掘包
    有這種疑問的人有福了,因為筆者將根據自己的經歷總結一下R語言書籍的學習路線圖以使Ruser少走些彎路。本文分為6個部分,分別介紹初級入門,高級入門,繪圖與可視化,計量經濟學,時間序列分析,金融等。《Statistics with R》和《The R book》。之所以說這兩本書高級,是因為這兩本書已經不再限於R基礎了,而是結合了數據分析的各種常見方法來寫就的,比較系統的介紹了R在線性回歸、方差分析、多元統計、R繪圖、時間序列分析、數據挖掘等各方面的內容,看完之後你會發現,哇,原來R能做的事情這麼多,而且做起來是那麼簡潔。讀到這裡已經差不多了,剩下的估計就是你要專門攻讀的某個方面內容了。
  • Kdnuggets調查 | 數據科學家用得最多的十種數據挖掘算法
    ,這相比於 2011 的相似調查顯示的結果有了巨大的增長與 2011 年關於數據分析/數據挖掘的調查相比,我們注意到最常用的方法仍然是回歸、聚類、決策樹/Rules 和可視化。圖 2:職業對算法的使用偏好我們注意到,產業數據科學家們更傾向於使用回歸、可視化、統計、隨機森林和時間序列。政府/非營利更傾向於使用可視化、主成分分析和時間序列。
  • 一文理清:大數據、數據挖掘、數據分析、數理統計之間的關係
    2.數理統計與數據挖掘的區別 更普遍的觀點認為,數據挖掘是數理統計的延伸和發展,如果一定要加以區分,它們又有哪些區別呢?數據挖掘在如下幾個方面與數理統計存在比較明顯的差異。數理統計的基礎之一就是概率論,在對數據進行數理統計分析時,分析人員常常需要對數據分布和變量間的關係作假設,確定用什麼概率函數來描述變量間的關係,以及如何檢驗參數的統計顯著性。但是,在數據挖掘的應用中,分析人員不需要對數據分布做任何假設,數據挖掘中的算法會自動尋找變量間的關係。因此,相對於海量、雜亂的數據,數據挖掘技術有明顯的應用優勢。
  • 專家講座:價值提升—數據統計分析與數據挖掘
    然而,很多地區的移動公司經營分析人員由於對分析流程、方法和軟體使用缺乏系統了解,因此經營分析的報告只停留在數據和信息的流水帳式的通報,缺乏對客戶、業務、營銷、競爭方面的深入分析,由此電信經營分析價值和意義大打折扣。本課程著眼於數據的分析和統計,教授如何挖掘數據背後的規律和隱含的信息。
  • 數據分析基礎內容介紹 — 模型、工具、統計、挖掘與展現
    第四層是Data Mining數據挖掘層,數據挖掘與數據分析(統計分析)有什麼區別呢,數據分析往往是統計量和算法比較清楚,數據挖掘往往是目標不是很清楚,在實現目標的過程中採用什麼方法不能確定,所以數據挖掘比數據分析難度要高很多。
  • 【乾貨】統計學×數據分析|信度|卡方|施測|統計量|正態分布_網易...
    、時間序列分析  動態數據處理的統計方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題; 時間序列通常由4種要素組成: 趨勢、季節變動、循環波動和不規則波動。  時間序列預測的應用  系統描述: 根據對系統進行觀測得到的時間序列數據,用曲線擬合方法對系統進行客觀的描述;  系統分析: 當觀測值取自兩個以上變量時,可用一個時間序列中的變化去說明另一個時間序列中的變化,從而深入了解給定時間序列產生的機理;  預測未來: 一般用ARMA模型擬合時間序列,預測該時間序列未來值;  決策和控制:
  • 小叮噹數據挖掘(一):初識數據挖掘
    (3)從機器學習和統計的角度看KDD3.數據挖掘的應用(1)資料庫分析和決策支持市場分析和管理針對銷售關係資料庫 、數據倉庫 、事務(交易)資料庫 、先進的資料庫和信息存儲 、面向對象和對象-關係資料庫 、空間和時間數據 、時間序列數據和流數據 、文本資料庫和多媒體資料庫 、異種資料庫和遺產資料庫 等。5.可以挖掘什麼類型的模式?
  • 乾貨 | 當前流行的教育數據挖掘與學習分析工具
    WEKA有一組廣泛的分類、集群和關聯挖掘算法,可以單獨使用,也可以結合使用。用戶可以從命令行、圖形用戶界面(GUI)或Java API調用算法。2.SPSSSPSS主要是一個統計軟體包,提供一系列統計測試、回歸框架、相關性和因子分析。
  • 什麼叫數據挖掘_數據挖掘技術解析
    數據挖掘是一個多學科交叉領域,涉及神經網絡、遺傳算法、回歸、統計分析、機器學習、聚類分析、特異群分析等,開發挖掘大型海量和多維數據集的算法和系統,開發合適的隱私和安全模式,提高數據系統的使用簡便性。   數據挖掘與傳統意義上的統計學不同。統計學推斷是假設驅動的,即形成假設並在數據基礎上驗證他;數據挖掘是數據驅動的,即自動地從數據中提取模式和假設。
  • 大數據分析與數據分析的根本區別在哪裡?
    如今大數據分析和數據分析火爆,要說時機,可謂處處都是時機,關鍵要明了的一點是,大數據分析和數據分析兩者的根本區別在哪裡,只有真正了解了,才會知曉更加適合自己的領域是大數據分析師還是數據分析師。畢竟職場如戰場,時間就是生活,不容兒戲,更不容怠慢。下面我來好好告訴大家兩者的本質區別到底是什麼!
  • 數據挖掘入門:校園數據的分析與挖掘
    方案簡介:在學生數據量劇增以及教育目標日趨複雜的情況下,僅用人工來分析學生數據是不現實的,藉助SPSS統計分析和數據挖掘工具對大量學生數據進行深層次分析,可以挖掘出學生各項數據中隱藏的重要信息。對國防生選拔培養來說,選培辦成立的時間不長,對國防生培養的分析判斷往往根據經驗,分析結果有時並不能滿足實際管理應用。採用數據挖掘這一科學的分析方法,來發現並分析影響國防生培養的規則或模式,幫助選培辦掌握國防生發展的趨勢,確定教育管理的重點方向。特別是國防生的流失問題,是實際工作開展中的重點和難點問題。
  • 技術應用 | 當前流行教育數據挖掘與學習分析工具概覽
    WEKA有一組廣泛的分類、集群和關聯挖掘算法,可以單獨使用,也可以結合使用。用戶可以從命令行、圖形用戶界面(GUI)或Java API調用算法。2.SPSSSPSS主要是一個統計軟體包,提供一系列統計測試、回歸框架、相關性和因子分析。
  • 迅速上手的時間序列分析教程
    時間序列是指以固定時間為間隔的、由所觀察的值組成的序列。根據觀測值的不同頻率,可將時間序列分成小時、天、星期、月份、季度和年等時間形式的序列。有時候,你也可以將秒鐘和分鐘作為時間序列的間隔,如每分鐘的點擊次數和訪客數等等。 為什麼我們要對時間序列進行分析呢?因為當你想對一個序列進行預測時,首先要完成分析這個步驟。