在當今,無論哪個行業,每天每時每刻都有大量數據被產生和存儲下來,因此急需一些角色來處理這些龐大、凌亂的數據,數據科學專業人員就成為了十分緊缺的職業角色。
Data Scientist被Harvard Business Review 評為21世紀最性感的職業之一,麥肯錫預測全球將有超過1.5個Million的空缺職位。
在人工智慧和金融科技大肆興起之後,Data Science作為一切的根基,該方面的求職者更是變成了最熾手可熱、千金難求的人才!
那麼:到底什麼是Data Science呢?這個領域又包含哪些工作呢?這些工作又需要什麼技能?重點是,咱們商科留學生如何轉型入門呢?
今天就帶大家快速解讀!
來源:giphy
Data Science,實際上就是對數據提取、分析、理解、描述、預測的一門學科。乍一看來數據科學其實很像統計學,但實際上,數據科學應當是數學、統計與計算機的交叉學科。
圖片來源:Google
數據科學類技能大致可分為三類:
算法(Algorithms): 數學、統計、算法、模型等理論知識是解決任何數據問題的核心。數據科學背後的算法模型以及數據實驗是怎樣被設計和檢測是必不可少的技能。
編程(Engineering): 數據的獲取、處理和儲存是必不可少的知識。同時,熟練掌握程式語言和分布式計算將幫助你處理大規模的數據。
溝通(Communication): 數據在外行人眼中就如同一門外語,如何將數據分析結果轉化為可讀性極強的商業報告是必須掌握的技能。
商科留學生轉Data Science能做哪些工作?
這個職位更經常存在於IT部門,或者乾脆自己組成一個部門。職責是解決一切Data Analyst解決不了的比較複雜的問題。且他們通常是不需要負責定期出報告來分析季度數據的。
核心使命: 為公司決策提供服務;主要工作:從Business部門那裡收集有趣的/亟待解決的問題。採用科學方法、運用數據挖掘工具對複雜多量的數據進行數位化重現與認識,並據此尋找新的想法的專家。與傳統數量分析師相比,他們更多通過關注面向用戶的數據來創造不同特性的產品和流程,為客戶提供有意義的增值服務。
要求掌握的技能包括Python、SQL、SAS、Spark、機器學習算法等。
圖片來源:Google
Data Engineer所做的一切都為了Data Management,具體內容包括數據模型、數據架構、數據標準、元數據、主數據、數據治理、數據管控等等。
Data Enginner的目標是把數據整好,存儲成本低,查詢效率高,至於怎麼使用這些數據不是他們關心的範疇。
主要負責:database architecture,data modeling,data quality check, data cleaning, data enrichment/transformation(aggregation, join...) 等等後端的工作。
種類眾多,其中機器學習工程師、資料庫開發師是兩個典型例子。
機器學習工程師 (Machine Learning Engineer) 的核心技能——機器學習,是最近幾年非常熱門的一項新技術。因此,在未來的幾年裡,機器學習將會是一個非常有前景的職業方向。其職責包括數據清理、數據分析、模型構建、預測評估及可視化呈現。要求熟練掌握Python、Java等程式語言,熟悉Hive、Storm、Spark等開源平臺,熟悉常用的機器學習算法,如隨機森林、神經網絡、聚類,熟悉圖像識別、優化器比較、模型壓縮技術等。
資料庫開發師 (Database Developer) 是從事資料庫管理系統和資料庫應用軟體設計研發的相關工作人員的統稱,他屬於軟體研發工程師,但又有一部分運維工作的內容。其職責主要包括軟體研發以及資料庫生產環境的問題優化和解決,熟練掌握Python、C/C++、Java等,了解主流的框架、庫使用和原理、計算機數據結構和算法設計,熟練掌握Linux、Web server、資料庫、緩存相關技術的使用,掌握資料庫基本原理和知識,熟悉SQL語法規則和特點等。
圖片來源:Google
Data Analyst偏重於將分析和商業運用相結合,分析只是一個手段和途徑,更加重要的是將分析的結果轉化為切實可行且能有所成效的商業方案。其核心使命是為公司決策提供服務,因此數據分析師的基本要求是懂企業的業務和數據,具備寫報告的能力,考驗的一方面是數據分析水平和業務能力,另一方面是溝通能力、理解能力和表達能力。
類似職位的面試有些類似於,基於技術面試題基礎上的諮詢類型的Case Study。從分析中找到可能存在的風險,並提出解決方案比起完美的Code有時候更加重要。更加適合非技術出身的求職者。
但是同樣是做Data Analyst的工作,在不同的公司,要求的技能和工作的內容會很不一樣。
微軟Online Service Division有跟Marketing更接近的Data Scientist,也有很多學統計或者IE出身的Applied Scientist做randomized controlled experiment;
LinkedIn、Facebook的data scientist感覺要求Java編程技術熟練,可能學Computer Science出身的最適合;
Insurance行業招的是Predictive Modeler,他們的總體目標就是要基於數據,預測在不同客戶身上收多少保險費能最大化收益、optimize profits,所有相關專業的它們都考慮。
所以在求職階段,要根據自身的特長和喜好選擇對應公司的Analyst Team;而在求學階段,更要提早準備好自己的職業發展目標,去有針對性的學習Data的相關專業知識。
圖片來源:Google
綜上所述,從某種程度上講,這三類數據科學專業人才有明顯的側重。
Data Scientists:更注重數學、統計的訓練和算法、模型的開發,
Data Engineer:更注重資料庫與程式語言等技能,
Data Analyst:更注重溝通交流和行業領域技能。
但是,任何數據科學專業人才都必須掌握上面說的三大類技能,只有這樣才能更好地理解數據科學並運用到解決實際問題中去。
從學習的角度來講,成為數據科學專業人才所需要的技能不外乎是以下四個:
紮實的理論知識(數學、統計、算法、模型)
熟練的資料庫操作語言(SQL、PL/SQL…)
熟練的程式語言(Python、R…)
豐富的實戰經驗(項目與工作經驗)
對於學習的順序問題,應當是:理論 - 編程 - 實戰的過程,一個循序漸進的安排會讓效率大增。
來源:giphy
就業率基本高達99%
平均高達薪資11萬刀
上升趨勢快,未來空間大,積累性高
最容易給留學生H1B的Offer之一
神秘虛幻的數據讓人感到對未知的恐懼
「不了解」造成的「不敢嘗試」
其實對智慧型的中國留學生來說
求職Data相關工作才是更有優勢和競爭力
專為留學生定製的Data特訓計劃
匯集Big Data/Data Analystics/Digital Analystics等熱門領域導師
從專業知識到面試技能
6周親自帶隊實習
3個月一對一專業特訓
部分Data特訓課件展示
長按下方二維碼添加DBC萬能小編44
微信ID:Dreambigcareer44
向微信小編私信關鍵詞【Data課程】
即可了解DBC能在求職Data路上怎麼幫你
從Excel Database/Excel Data Analysis
到Excel Business Analytics
從基礎教學到高級教程,全方位學習
12G SQL/R/Python/SAS/Java/SPSS高清教程
12G精講教學視頻
任君選擇,更有針對性學習
合計230講,求職Data必備技能都在這了
DBC 獨家整理1000+Data面試真題&面經合集
涵蓋:Google/Amazon/IBM/LinkedIn/Bloomberg/Facebook等名企
Data等相關熱門職位真實面經400+份
囊括:600+Data Science面試真題
SAS/R/SPSS/SQL/Python理論&實踐面試真題合集
附送: 12本Machine Learning教科書
置頂關注DreambigCareer公眾號
後臺回復【自學】
即可免費領取福利
本期福利7天後自動過期
©本文由DreambigCareer原創整理自網絡
本文圖片來源於Pexels、gifhy。如因作品內容、版權等存在問題,請於本文刊發30日內聯繫郵箱:郵箱pr@dreambigcareer.com或微信:dreambigcareerPR1(Yuki@DBC)進行處理,並就版權問題聯繫相關內容來源。DreambigCareer職夢歡迎各類廣告品牌合作,發郵件Partners@DreambigCareer.com獲取更多信息,統一3個工作日內回復。
2018 DreambigCareer職夢 保留所有權利
▼▼▼
DBC Offer榜
斬獲春招offer,你也可以!