CDA Level Ⅱ:建模分析師
兩年以上數據分析崗位工作經驗,或通過CDA Level Ⅰ認證半年以上。在政府、金融、電信、零售、網際網路、電商、醫學等行業專門從事數據分析與數據挖掘的人員。在Level Ⅰ的基礎之上深入掌握高級多元統計方法,並且拓展時間序列分析和主要數據挖掘的理論知識與業界運用;能夠熟練使用SAS、R、Matlab和SPSS中至少一個專業統計軟體實現相關算法;熟悉使用SQL訪問企業級資料庫;具有按照數據挖掘標準流程進行項目需求分析、數據驗證、建模與模型評估的能力。
級別
Level II
(建模分析師)
理論
基礎
統計學、概率論和數理統計、多元統計分析、時間序列、數據挖掘(DM)
軟體
要求
必要:EXCEL、SQL、SAS/SPSS
可選:R、MATLAB;SQL等(/表示「或」)
分析方
法要求
除掌握基本數據處理及分析方法以外,還應掌握高級數據分析及數據挖掘
方法(多元線性回歸法,生存分析法,神經網絡,決策樹,判別分析法,
主成分分析法,因子分析法,典型相關分析,聚類分析法,關聯規則,支
持向量機,bagging,boosting等)和可視化技術。
業務分
析能力
至少在客戶關係管理、管理會計、信用風險管理、人力資源管理等其中一
個數據分析的常用領域內具有深入的業務經驗,可以將業務目標轉化為數
據分析目標;熟悉企業內數據的生成過程,可以熟練的訪問常見資料庫;
根據項目需求,以最快捷的方式獲取業界最新案例和學界最新研究成果,
並且轉化為行動方針;可以熟練的提取所需信息,能夠從海量數據中搜集
並提取信息;根據項目目的,結合業務經驗選取最優建模方法。
結果展
現能力
報告體現數據挖掘的整體流程,層層闡述信息的收集、模型的構建、結果
的驗證和解讀,對行業進行評估,優化和決策。
CDA Level Ⅱ培訓課程安排
背景介紹
CDA Level Ⅰ為基礎薄弱的學員提供了入行的機會,能夠結合業務完成基本的數據分析並作出數據報告。但企業想要在競爭激烈的市場中勝出,決策的速度和反應的效率尤為重要。根據調查顯示,75%的企業在面臨擬定策略時,常常無法獲得實時且有根據的決策信息。什麼樣的數據、要通過什麼樣的方法,才能快速便捷的提供對決策有價值的信息,是現代企業所面臨最迫切性的問題。因此,在CDA Level Ⅰ的基礎上,CDA Level Ⅱ(建模分析師)即為企業決策提供及時有效、易實現、可信賴的數據支持。
在建模分析師中,數據挖掘(Data Mining)技術無疑是他們最強有力的核心競爭力。數據挖掘強調與現有信息系統的整合,以提供決策者做決策時所需的情報,或轉化成經營智慧,以作為調整營運策略方針的輔助工具。以顧客關係管理(CRM)為例,數據挖掘是整個顧客關係管理的核心。其不但可以準確的定位目標市場,進行精準營銷,還可以幫助業務人員了解客戶深層需求,針對大量客戶進行客制化,也就是所謂的一對一營銷。本課程的目的就是要針對數據挖掘整套流程,根據CDA Level Ⅱ大綱標準,以金融、電信、電商和零售業為案例背景深入講授數據挖掘的主要算法。並將SAS Enterprise Miner、SPSS Moderler、SAS編程和SQL進行有效的結合,讓學員勝任全方位的數據挖掘運用場景。
CDA LEVEL Ⅱ第一期課程安排
項目名稱CDA Level Ⅱ建模分析師系統培訓時間上海:2015年8月20-23日,29-30日 六天
深圳:2015年9月3-6日,12-13日 六天
面授班:上海,鐵道賓館
深圳,高新科技園
遠程班:在線同步直播價格(元)1.全日制學生及CDA LEVEL Ⅰ老學員8折優惠(學生證證
明文件)
2.同一單位三人及以上報名9折優惠,五人及以上8折優惠
3.CDA LEVEL Ⅰ等級資格證書持有者立省 1000元
4.同時報名參加LEVELⅠ和LEVEL Ⅱ享受8折優惠。
以上優惠不可疊加!
證書認證1.可申請報考《CDA LEVEL Ⅱ等級認證證書》(薦:含
金量高)認證申請詳情
2.可申請工信部NTC《數據分析師證書》(培訓後即可得到)
以上雙證皆自願申請
現場班福利午餐,咖啡茶歇,論壇幣(1000個)
學員對象:
1)各行業數據分析、數據挖掘從業者
2)金融、電信、零售、醫學等各行業業務數據分析人員
3)政府事業單位大數據及數據挖掘項目人員
4)數據挖掘崗位就業、提拔漲薪、技能優化等從業人員
5)對數據挖掘感興趣的各界人員
學員基礎要求:
1)掌握CDA LEVEL Ⅰ大綱要求,CDA LEVEL Ⅰ詳情:http://www.ppvke.com/class/detailcontent/?hid=320&tid=100074
2)熟悉SAS軟體,自行安裝好SAS軟體(帶有EM模塊),報名贈送《SAS初級視頻》完成
課程基礎預習工作。
詳細大綱
時 程
大綱內容
第1天
主題:顧客關係管理及基礎數據挖掘技術
企業使用之範圍:
說明企業如何利用顧客關係管理來進行營銷活動
理論介紹:
顧客關係管理系統的架構及其組成元素
企業如何利用顧客關係管理系統來進行營銷活動
數據挖掘技術的功能分類
數據挖掘技術的績效增益
數據挖掘技術的產業標準
數據挖掘基本觀念與實際應用解說
SAS EM & SPSS Modeler實務案例操作:
Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler
Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16
Creating a EM Project, Library and Diagram
Creating a SPSS Modeler Project
第1天
第2天
主題:基礎數據挖掘技術
企業使用之範圍:
說明企業如何利用數據前處理技術來進行數據的重整,建置數據倉庫,以做
為數據挖掘之輸入
理論介紹:
數據挖掘技術的流程-SEMMA vs. CRISP DM
數據前處理(Data Preprocessing)技術
Attribute Selection(欄位選擇)
*Data Integration(數據整合)
Data Cleansing(數據清洗):
*Wrong Value(錯誤值),
*Outlier(離群值),
*Missing Value(遺失值)
Attribute Enrichment(欄位擴充):
*內/外部數據的擴充方法
Data Coding(數據編碼):
*Data Transformation(數據轉換),
*Data Reduction(數據精簡),
*Record Reduction(記錄精簡),
*Attribute Value Reduction(域值精簡),
*Attribute Reduction(欄位精簡)
SAS EM & SPSS Modeler實務案例操作:
Defining a Data Source
Exploring a Data Source
* Exploring Source Data
* Changing the Explore Window Sampling Defaults
* Modifying and Correcting Source Data
Managing Wrong Values/Outliers/Missing Values
Transforming Inputs
Recording Categorical Inputs
第2天
第3天
主題:進階數據挖掘技術
企業使用之範圍:
說明企業如何利用關鍵變量發掘技術來發掘對項目目標有效之關鍵變量,以
做為數據挖掘之輸入變量
理論介紹:
訓練數據與測試數據的產生方法
關鍵變量(Key Attributes)發掘技術
*卡方檢定(Chi-square Test)
*t檢定及ANOVA檢定(t Test & ANOVA Test)
*利用決策樹(Decision Tree)選擇關鍵變量
SAS EM & SPSS Modeler實務案例操作:
Creating Training & Validation Dataset
Variable Selection
Using Partial Least Squares for Input Selection
Using the Decision Tree for Input Selection
第3天
主題:進階數據挖掘技術2
企業使用之範圍:
說明如何利用分類技術之決策樹來建立交叉銷售(Cross-Selling)模型,以提
升公司獲利
理論介紹:
分類之決策樹(Decision Tree)
SAS EM & SPSS Modeler實務案例操作:
Constructing a Decision Tree Model
Optimizing the Complexity of Decision Trees
Assessing a Decision Tree
Understanding Additional Plots & Tables
Automatic Tree Growth
第3天
主題:進階數據挖掘技術3
企業使用之範圍:
說明企業如何利用分類技術之神經網絡、支持向量機及分類多模型整合來建
立信用評分(Credit Scoring)模型,以降低公司損失
理論介紹:
分類之神經網絡(Neural Network)
分類之支持向量機(Support Vector Machine)
分類多模型整合(Ensemble)之裝袋(Bagging)、增強(Boosting)學習
SAS EM &SPSS Modeler實務案例操作:
Training a Neural Network
Selecting Neural Network Inputs
Increasing Network Flexibility
Using the AutoNeural Tool
Constructing a Support Vector Machine
Constructing Ensemble Models by Using Bagging and Boosting
Techniques
Model Comparisons
第4天
主題:進階數據挖掘技術4
企業使用之範圍:
說明企業如何利用模型評估技術來評估模型的優劣,以作為採用適當模型的準則
理論介紹:
模型評估(Model Assessment)技術
SAS EM & SPSS Modeler實務案例操作:
Model Fit Statistics:
* Comparing Models with Summary Statistics
Statistical Graph:
* Comparing Models with ROC Charts
* Comparing Models with Score Rankings Plots
* Adjusting for Separate Sampling
Profit Matrix:
* Evaluating Model Profit
* Viewing Additional Assessments
* Optimizing with Profit
Internally Scored Data Sets:
* Creating a Score Data Source
* Scoring with the Score Tool
* Exporting a Scored Table
Score Code Modules:
* Creating a SAS Score Code Module
* Creating Other Score Code Modules
第4天
主題:進階數據挖掘技術5
企業使用之範圍:
說明企業如何利用預測(Prediction)技術之回歸樹及類神經網絡來建立數值預
測模型-如預測客戶之年收入,以利公司設計營銷活動
理論介紹:
回歸樹(Regression Tree)
類神經網絡(Neural Network)-非線性回歸
SAS EM & SPSS Modeler實務案例操作:
Review and Set the Decision Tree Node
Review and Set the Neural Network Node
第4天
主題:進階數據挖掘技術6
企業使用之範圍:
說明企業如何利用關聯及序列分析技術來建立交叉銷售(Cross-Selling)及提升
銷售(Up-Selling)模型,以提升公司獲利
理論介紹:
關聯分析(Association Analysis)
序列分析(Sequence Analysis)
SAS EM & SPSS Modeler案例案例操作:
Consolidating Categorical Inputs
Market Basket Analysis
Sequence Analysis
第5天
SAS編程與SQL編程
主題:SAS編程技術基礎
SAS Data步基礎
SAS Proc步基礎
SAS 宏基礎
主題:SQL編程與Oracle資料庫使用
Oracle資料庫配置、建庫與SAS建立連接
SAS Proc SQL過程步與Oracle SQL編程
SAS Pass Through技術
數據挖據完整流程案例
——SAS編程構造銀行信用風險模型
第6天
主題:信用風險建模簡介
銀行信用風險監管體系與信用風險內部模型
主題:單變量檢驗與數據清洗
缺失值檢驗與處理方法
異常值檢驗與處理方法
解釋變量粗篩
雙變量關係檢驗法
數據分箱
主題:連續變量壓縮技術
變量聚類
分類變量壓縮技術
似完整分類數據問題
WOE方法
主題:邏輯回歸建模技術
模型選擇:逐步法、全子集法
根據經驗Logit曲線進行連續變量轉換
主題:編程模型評估技術
ROC曲線
K-S曲線
課程收益
(1)了解什麼是顧客關係管理;
(2)了解顧客關係管理系統的架構及其組成元素;
(3)了解如何利用顧客關係管理系統來進行營銷活動;
(4)了解什麼是數據挖掘(Data Mining);
(5)掌握數據挖掘技術的功能分類;
(6)掌握數據挖掘技術的績效增益;
(7)了解數據挖掘技術的產業標準;
(8)掌握如何利用數據挖掘技術來篩選關鍵變量(Key Attribute);
(9)掌握如何利用數據挖掘技術來進行交叉銷售(Cross-Selling);
(10)掌握如何利用數據挖掘技術來評估客戶的信用風險(Credit Risk);
(11)了解如何利用數據挖掘技術來分析顧客行為、產生商業智慧並發展營銷策略。
(12)掌握如何使用數據挖掘工具SAS EM/SPSS Modeler/SAS來完成上述的各項工作。
(13)掌握Oracle等主流資料庫的使用。
(14)掌握商業數據挖掘完整流程並作出邏輯嚴密的數據報告。
講師簡介
李御璽,教授,國立臺灣大學資訊工程博士,銘傳大學資訊工程學系教授,銘傳大學大數據研
究中心主任,中華數據挖掘協會理事,雲南財經大學信息學院客座教授,浙江大學城市學院客
座教授,廈門大學數據挖掘中心顧問,中國人民大學數據挖掘中心顧問,IBM SPSS-China顧
問,SAS-Taiwan顧問。在其相關研究領域已發表超過260篇以上的研究論文,同時也是國科會
與教育部多個相關研究計劃的主持人。
服務過的客戶包括:中國工商局、中信銀行、臺新銀行、聯邦銀行、新光銀行、 新竹國際商
業銀行(現已併入渣打銀行)、第一銀行、永豐銀行、遠東銀行、美商大都會人壽、嘉義基督教
醫院、臺灣微軟、零售業如赫蓮娜(Helena Rubinstein)化妝品公司、特立和樂(HOLA)公司、
航空公司如東方航空公司、中華航空公司、汽車行業如福特(Ford)汽車公司;政府行業如國
稅局等。
常國珍,曾為德勤管理諮詢高級數據挖掘諮詢顧問,SAS官方培訓資深講師,2014年SAS軟體
大賽判卷人,曾以數據挖掘工程師身份就職於亞信科技(中國)有限公司市場部。具有八年的
數據挖掘實戰經驗,主攻分類模型,涉及客戶精準營銷、信用評估、價值提升、欺詐偵測和
流失預警等數據挖掘主題,尤其熟悉銀行個人客戶精準營銷的建模工作。
資格認證:SAS全球認證「Certified Statistical Business Analyst Using SAS 9 Regression and Modeling」、「Certified Advanced Programmer for SAS 9」。
參與項目:1、某國有大型銀行企業級模型試驗室建設; 2、某國有大型銀行企業級欺詐系統
建設;3、某股份制大型銀行信用卡部產品精準營銷建模和行為信用評級模型優化工作;
4、某股份制大型銀行零售業務部客戶忠誠度提升項目。
資格認證
CDA數據分析師LEVEL Ⅱ資格證書
(此證書為CDA協會頒發,人大經濟論壇國內主辦,全國統考,一年兩次,此證書為CDA數據分析師唯一認證證書,可以作為企業事業單位選拔和聘用專業人才的任職參考依據。)
CDA考試安排:
1. 考試時間2015年6月28日
2. 考試內容:CDA LEVLE Ⅱ建模分析師大綱。
3. 報名費用:1500元/人。參加CDA系統培訓學員費用為1000/人。
4. 其他:CDA考試一次不過可申請補考,補考費用為原價一半。證書3年審核一次。
國家工信部數據分析師證書
此證書參加CDA培訓後隨堂考試,通過即可獲得,證書申請費用為400元。(可自願申請)
報名流程
微信回復「姓名+地點」,會有專人聯繫您
或點擊底部閱讀原文在線填寫報名信息