今天給大家介紹一款在開源世界裡集萬千寵愛於一身的軟體——R語言
這個問題相信不用我多說了,簡單粗暴的說:R 是一個有著統計分析功能及強大作圖功能的軟體系統。我們一般使用R-Studio作為它的編輯環境。
認識一種語言,我們要從它的歷史說起。
那就得先從另一款語言S談起,(嗨不是你們腦海裡的大S,小S啦!)S語言是由 AT&T貝爾實驗室John Chambers等人開發的一種用來統計編程的語言。S語言目前有兩種實現版本,一種是現在由TIBCO經營的商業軟體 S-plus, 另一種就是免費開源的R語言。
1992年,Auckland大學的Robert Gentleman 和 Ross Ihaka 為了能夠更有效地開展大學裡的統計入門課程的教學,他倆決定引入S語言來開發一套軟體,1994年該軟體最初版本基本成型。這就是後來我們用到的R的雛形啦。
對,這就是它的爸爸們啦,
這下知道我們的明星語言為什麼要姓R了吧
1. 物美價廉——作圖顏值高,且完全免費
說它物美,主要是指它卓越的作圖功能。
可以說,點圖線圖柱狀圖直方圖,R語言樣樣精通,而且設計感滿滿,絕對可以在這個看臉的世界裡獨擋一面。比如你可以畫這樣的圖:
如果對R中基本圖形稍作修飾,你還能畫成這樣:
還能這樣(上海地區工商銀行分布核密度圖):
2. 兼收並蓄——算法覆蓋廣,擴展易
作為統計分析工具,它幾乎覆蓋整個統計領域的前沿算法。
從火到根本停不下來的的神經網絡(就是那隻下圍棋的機器狗腦袋裡的東西),到經典了一百多年還熠熠生輝的基礎回歸,數千個R包,上萬種算法,你都能找到可直接調用的函數實現。
3. 軟體擴展易
作為一款軟體系統,它有極方便的擴展性。你的數據原來存在Oracle 裡?沒問題,輕鬆導入;你的數據在MySQL 裡?沒問題, 照樣解決。文本文件、資料庫管理系統,統計軟體,專門的數據倉庫都可兼容。它同樣可以將數據輸出並寫入到這些系統中。
同時它還可以輕鬆於各種語言完成互調,比如大數據系統Hadoop,商業軟體SPSS、SPSSModeler,你曾經愛的python,都可無縫對接。
4. 集千萬力量於一身——強大的社區支持
作為一個開源軟體,R背後有一個強大的社區和大量的開放源碼支持,獲取幫助非常容易。
比如國外比較活躍的社區有GitHub和 Stack Overflow等,通常R包的開發者會先將代碼放到GitHub,接受世界各地的使用者提出問題,修改代碼等操作,等代碼成熟後再放到CRAN上發布;
而Stack Overflow 則是一個優質的IT技術問答網站,當你在Google上搜索R問題時,通常會看到該網站的回答會排在首位,足可見該網站的搜索熱度有多高!
而國內如經管之家論壇-五區 【R語言論壇】等都是優秀的R語言社區。
如何系統學習和進階R語言數據分析?
CDA數據分析集訓班
R語言方向開課
歡迎參加!
數據是資訊時代的「新能源」。從金融到零售,從電商到體育,數據科學都成為成功決策的基礎,廣泛應用在營銷優化、風險控制、客戶關係等商業領域。
【CDA數據分析師周末集訓-R語言】以CDA數據分析師標準大綱要求從資料庫管理(Mysql)—統計理論方法—數據分析軟體應用(R)—數據挖掘和機器學習(R)—數據可視化(ggplot,echartR等)整套數據分析流程技術系統講解,還將結合量化投資、金融、銀行、電信等行業真實需求出發全部用實際案例教學來使所學項目課程更能符合企業要求。
時間:2018年6月09日~9月02日
地點:北京現場& 全國直播
授課安排:現場班9900元遠程班7900元
01章R語言編程基礎和R SQL
01-01商業數據分析與行業介紹
01-02使用R演示數據分析全流程
01-03R語言數據類型與數據結構
01-04R語言程序控制與函數
01-05SQL語言與R SQL實現
01-06使用SQL進行數據匯總
01-07使用ggplot進行基礎繪圖
01-08案例:汽車行業貸款違約預測
02章Mysql資料庫基礎
01-01Mysql資料庫知識介紹
01-02Mysql資料庫的基本操作
01-03Mysql數據表的基本操作
01-04數據類型和約束條件
01-05數據的CRUD操作之增加、刪除、修改數據表
01-06SQL資料庫單表查詢和聯合查詢
01-07SQL操作符和函數
01-08SQL綜合案例:彩票數據核對練習
01-09SQL綜合案例:電商數據查詢練習
03章 數據分析之統計學基礎
01-01數據分析行業與知識簡介
01-02概率論基礎知識
01-03描述性統計分析
01-04統計量與抽樣分布
01-05參數估計:點估計和區間估計
01-06假設檢驗方法
01-07方差分析的基本原理和操作
04章 R語言進行統計分析和數據清洗
01-01使用R語言進行數據整合與數據清洗
01-02使用R語言進行數據分組和抽樣
01-03使用R語言進行描述性統計分析
01-04使用R語言進行參數估計和假設檢驗
01-05使用R語言進行單樣本和兩樣本T檢驗
01-06使用R語言進行方差分析和相關分析
01-07轉化漏鬥與A/B對比測試
05章 R語言進行回歸分析和降維分析
01-01使用線性回歸做客戶價值預測
01-02使用邏輯回歸做客戶流失預警
01-03連續變量關係探索與變量壓縮:主成分、因子分析
01-04聚類分析與客戶分群
01-05市場分析其他工具:對應分析與多維尺度分析
01-06案例:電信公司消費偏好聚類
01-07案例:汽車品牌客戶感知圖
06章 R語言進行時間序列和綜合案例分析
01-01簡單時間序列分析法:平滑算法
01-02平穩時間序列(ARMA)模型設定與識別
01-03非平穩時間序列(ARIMA)模型
01-04時間序列建模步驟
01-05綜合案例:使用R語言進行信用卡產能指標趨勢預測與監控
01-06綜合案例:使用R語言進行電信公司離網用戶預警
07章 R語言數據可視化
01-01繪圖思想的基本原理
01-02R語言數據可視化包-GGplot2包介紹與圖形繪製
01-03R語言數據可視化包-Lattice包與GGvis包介紹與圖形繪製
01-04R語言數據可視化包-EchartsR介紹與圖形繪製
01-05分析結果展示與報告展現
08章 期中項目作業與答辯
01-01課題1:電商客戶價值預測
01-02課題2:網站流量數據分析
01-03課題3:信用卡客戶流失預警
01-04課題4:銀行電話營銷響應分析
01-05以上課題僅供參考
09章 R語言數據挖掘基礎與進階數據處理技術
01-01R語言數據挖掘簡介
01-02數據挖掘方法論CRISP-DM介紹
01-03數據挖掘技術概述
01-04數據前處理技術與方法
01-05關鍵變量發掘技術
10章 R語言進行預測型數據挖掘
01-01樸素貝葉斯與最近領域
01-02決策樹算法
01-03神經網絡
01-04支持向量機
01-05集成學習: Bagging,Boosting,RandomForest
01-06特徵工程
11章R語言進行描述性數據挖掘與進階應用
01-01聚類分析
01-02關聯規則
01-03序列模式
01-04文本挖掘
01-05社會網絡分析
1. 在線填寫報名信息
2. 給予反饋,確認報名信息
3. 網上繳費
4. 開課前一周發送電子版課件和教室路線圖
徐剛
CDA數據分析師講師/數據分析總監
具有深厚的數理統計與應用數據分析專業背景,上海某金融機構數據分析部門高級數據總監,具有八年數據分析、數據挖掘的從業經驗,曾就職零售企業、諮詢公司等,獨立或帶團隊完成零售、電信、金融等多個大型數據挖掘項目。
曾珂
管理科學工程碩士/CDA數據分析研究院講師
從事數據分析與數據挖掘的研究與教學,研究方向為網際網路、電子商務數據分析與挖掘,擅長基於客戶關係管理的數據挖掘、數據可視化、文本挖掘。
李御璽
臺灣銘傳大學教授/中華數據挖掘協會理事
臺灣大學博士,在其相關研究領域已發表超過260篇以上的研究論文,同時也是國科會與教育部多個相關研究計劃的主持人。 其還兼任廈門大學數據挖掘中心顧問,中國人民大學數據挖掘中心顧問,IBM SPSS-China顧問。服務過的客戶包括:中國工商局、中信銀行、臺新銀行等。
課程顧問:陳老師
18010006628(微信)
郵箱:chenwenjing@pinggu.org