如何11步轉行數據科學家 (適用數據員/ MIS / BI分析師)

2021-01-11 和訊科技

  大數據文摘授權轉載自數據派THU

  來源:Analytics Vidhya

  編譯:國相潔、丁楠雅

  數據科學作為一個專業領域迅速崛起,吸引了來自各種職業背景的人。工程師、計算機科學家、市場和金融畢業生、分析師、人力資源人員——每個人都想嘗一塊 「數據科學餡餅」。

  Analytics Vidhya (一個專門針對「分析與數據科學」的社區網站 ) 發布了一篇文章《為初學者邁入數據科學規劃的全面學習路徑》。

  A comprehensive Learning path to become a data scientist in 2019

  https://courses.analyticsvidhya.com/courses/a-comprehensive-learning-path-to-become-a-data-scientist-in-2019?utm_source=11stepsBItoDSarticle&utm_medium=blog

  那麼,為什麼我要特別關注這些職業:數據分析/數據倉庫(MIS)/商業智能(BI)呢?讓我先解釋一下。

  我經常遇到一些優秀的商業智能分析師 (BI),尋求獲得自己人生的第一個數據科學角色。但他們常常因缺乏機會而沮喪。他們中很多人感覺自己的角色是重複的,或者只需要扮演好被要求的角色。

  他們實際上忽略了一個事實:比起任何其他職業的人,他們離數據科學更近。

  商業智能分析師 (BI) 為何能更輕鬆地過渡到數據科學領域

  商業智能專業人士比幾乎所有試圖過渡到數據科學的人都擁有巨大優勢,原因如下:

  商業智能分析師已經在各個項目中接觸到了數據科學家;

  知曉如何管理和處理數據(有時按比例);

  有業務背景,他們密切地從事相關業務;

  他們有基本的數據探索步驟的經驗,因為除了用在報告中,業務部門也會經常要求這些。

  換句話說,這些人工作在數據科學項目的「前半部分」,這已經比大多數有志成為數據科學家的人多了很多行業經驗。

  如果你正是這樣一位希望從數據分析/數據倉庫(MIS)/商業智能(BI)跳轉到數據科學家,這篇文章就是為你量身定製的。你可以將這11步作為你能遵循的學習路徑。實際上,我強烈建議你在當前的角色中執行這些步驟。開始於你正站著的地方,直到破霧而出,進入數據科學!

  在下面的內容中--—商業智能、數據倉庫師、數據員、數據分析員都可以互換使用。這些角色和名稱幾乎沒有區別,而且有很多重疊。

  準備好和我一起踏上徵程了嗎?讓我們一步一步地來。

  第一步:進行探查分析並解讀分析成果

  讓我以三個BI人員日常報告的例子開始。

  示例 1:

  該BI人員已經得到了數據結果,其中包含有關城市和地區級別的業務來源,以及業務質量的詳細信息。

  示例 2:

  在這裡,BI人員為「拒絕分數」列添加了RAG (紅-琥珀色-綠) 分析。拒絕分數越低,業務質量越高。

  示例 3:

  在本例中,BI人員通過對分析結果進行解讀,將報告提升到了另一個層次。你可以看到他從報告中得出的前2個發現。

  這裡我只舉了一個簡單的例子對報告進行解讀分析。你可以根據正在分享的信息類型加入更多視覺效果/圖表。

  以上哪個示例對於業務用戶更有意義?

  看看上面的3個例子,我傾向於「示例3」,因為它為業務增加了更多價值:

  為報告添加了更多可理解性;

  它還強調了可著手的操作領域;

  如果你查看那些「發現」,其中一個是區域級別匯總報告後得出的。

  這些實際上能很大地幫助業務人員。當你與高層管理者合作時,你會發現他們中的大多數需要可著手操作的項目,而不想花時間在解釋報告和深入分析上。

  想要生成一份類似的報告,一位BI人員應該具有好奇心,關注細節,熟練掌握任何一種工具(Excel/SQL/QlikView/Tableau), 以及業務知識。

  這個技能集不僅限於從事BI的人員。它對於成為一名好的數據科學專家也是關鍵。在大多數情況下,一名數據科學家60%—70%的工作是關於業務理解,數據探索和對手頭問題產生見解。

  與其它正在向數據科學過渡的人員相比,一位BI人士擁有巨大的優勢。你可以從今天開始練習這個技能集,它也將幫助你在現在的工作中做得更好。這是雙贏!

  面臨的挑戰和解決方案:

  無法在分析結果與業務之間建立聯繫:生成見解與你對業務的理解直接相關。我建議你與領域專家聯繫,並嘗試解釋它正如何影響著業務指標。

  沒有足夠時間生成見解:我同意--—你正在緊張的最後期限下,忙著做業務報告,沒有時間生成見解。這種情況下,我有2個建議:

  不要開始一個有著非常嚴格時間表的報告(例如日報)。挑選有較少時間限制的報告任務。月報便是一個很好的開始,因為它們包含重要的信息並且為你深入挖掘信息提供了時間。

  自動生成報告。這將為你節省大量時間,你可以利用這些時間來理解報告並生成見解。你應該學習 Excel/SAS 的宏指令或其它類似自動化報告工具。

  第二步:學習統計學以支持你對於報告的見解

  是時候用一些統計指標來支持你的見解了。不要把你自己局限在僅僅靠視覺解釋來生成見解。看看下面的圖--—你的第一反應是什麼?

  這個圖上可以看到競爭前和競爭後的平均業務來源。現在的問題是「競爭是平均業務來源增長的背後推動力,還是只是一種隨機增長?」這裡,我們需要依靠某些統計概念來支持我們的見解,比如做 z-檢測, t-檢測或其它統計檢驗。掌握好統計知識將在這些處境中幫助到你。

  你應該對以下統計主題有紮實的理解,如果你想進入數據科學角色的話:

  描述性統計

  平均數,中位數,眾數

  方差和標準差

  概率

  伯努利試驗與概率質量函數

  中心極限定理

  正態分布

  推論統計學

  置信區間

  假設檢驗

  協方差/相關性

  下面列出了一些有用的資源,可以幫助你開始學習這些主題:

  關於推理統計的博客: Comprehensive & Practical Inferential Statistics Guide for data science

  https://www.analyticsvidhya.com/blog/2017/01/comprehensive-practical-guide-inferential-statistics-data-science/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  假設檢驗的詳細指南: Your Guide to Master Hypothesis Testing in Statistics

  https://www.analyticsvidhya.com/blog/2015/09/hypothesis-testing-explained/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  全面易懂的方差分析教程:  A Simple introduction to ANOVA

  https://www.analyticsvidhya.com/blog/2015/09/hypothesis-testing-explained/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  描述性統計很容易理解,但推理統計的茶不好喝:實踐是關鍵。我建議儘可能地多練習,並對概念有一個直觀的理解。在看數學方程前先做這件事。這種方法將幫助你首先關注於應用方面,而不是陷入理論的泥潭中。

  這些看起來都太統計學了,我無法和股東或客戶分享:查看這些報告的客戶大致有兩類。第一類對直觀的見解更感興趣,而另一類(風險/數據科學團隊)則更關注統計見解。與後一類人聯繫,並就你的發現展開討論。此外,這裡最好的策略是用他們的語言討論業務,而不是統計語言。例如,開始時我不會使用「統計顯著」一詞,聽眾可能會感到不舒服。我只會說,相比於我們從過去中看到的,這個事件是否有足夠大的可能性發生。

  第三步:把你的發現呈現給正確的小組

  如果你沒有和正確的小組分享你的發現,那探查分析和統計分析將不會幫助你進入數據科學的角色。

  「講故事是一名數據科學專家必須掌握的關鍵技能。」

  這裡,我強烈建議在你現有的角色中練習「講故事」的能力。你可以從以下內容開始:

  始終在你的報告或分析中分享詳細的見解;

  分享你的見解並通過演示幻燈片展示你的故事。

  這是一個我個人職業生涯非常受益的基本建議——在你的幻燈片中添加可視化效果。如果是報告或會議演講,則應該對應你的可視化添加背景。困惑嗎?讓我用一個例子來解釋一下。

  看看下面的可視化。它展示了關於Sachin Tendulkar職業生涯中測試賽的細節。你可以在這裡使用圖表和數字討論各種度量。這也展示了為何業務理解如此重要——如果你沒有業務經驗的話,你根本無法討論這些指標。

  你該看看下面這篇優秀的文章:

  The Art of Story Telling in Data Science and how to create data stories

  https://www.analyticsvidhya.com/blog/2017/10/art-story-telling-data-science/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  不能向小組傳達統計見解:不要總使用單一語言(統計語言)進行溝通。我們應當根據聽眾來改變我們溝通的方式。例如,你正和一個統計小組溝通,那話語中有很多統計推斷沒問題。如果你與一個非技術團隊溝通,統計和直觀結合的方式將更有幫助。

  以前從未分享過見解,怎麼開始?你可能有過這樣的想法:

  這些見解對於業務來說有意義嗎?

  我可能誤解了這些數字。這將導致溝通不良並產生負面影響。

  你的擔心是可理解的,但你不得不從某個地方開始積累經驗。我的建議是首先和你的經理、有經驗的同事或你的客戶分享見解。這將給你信心——這是非常重要的推動力。所以開始練習吧!

  第四步:探索一個開源工具來生成報告或執行檢測分析

  到目前為止,我還沒有討論任何生成報告和見解的工具。我特意迴避了這樣的問題,例,你該選擇哪樣工具?哪個是合適的或更好的?這是因為我的目標是讓你的關注點聚焦於檢測分析、統計概念和磨練你的溝通技巧,這樣你可以用你現在工作中的工具來展現你的新發現。

  現在,是時候來學習一種工具了,它具有以下特點:

  處理(大量)數據的能力;

  可視化能力;

  建立預測模型的能力(機器學習模型);

  深度學習支持;

  客戶服務支持和繁榮的社區。

  你可以在 SAS/R/Python中任意選擇,因為這些工具都有以上功能。在這裡,你的初始任務是非常具體的,在學習一個新工具的同時,讓你自己習慣執行數據探索、可視化、檢測分析和統計測試。你不需要在這些工具上擁有完整的專業知識(不管怎樣,開始時不需要)

  如果不確定挑哪樣工具,我建議你讀讀 Kunal Jain 寫的這篇文章,裡面比較了三種工具的各種優缺點。

  Python vs. R (vs. SAS) – which tool should I learn?

  https://www.analyticsvidhya.com/blog/2017/09/sas-vs-vs-python-tool-learn/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  你可以查看以下使用 SAS/R/Python 學習數據探索的教程:

  Data Exploration using Numpy, Pandas, Matplotlib

  https://www.analyticsvidhya.com/blog/2015/04/comprehensive-guide-data-exploration-sas-using-python-numpy-scipy-matplotlib-pandas/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  A comprehensive guide for data Exploration using R

  https://www.analyticsvidhya.com/blog/2015/04/comprehensive-guide-data-exploration-r/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Data Exploration using Data Step and Proc SQL

  https://www.analyticsvidhya.com/blog/2015/04/data-exploration-sas-data-step-proc-sql/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  9 Popular ways to perform visualization using Python

  https://www.analyticsvidhya.com/blog/2015/05/data-visualization-python/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Data Visualization using SAS

  https://www.analyticsvidhya.com/blog/2015/06/data-visualization-guide-sas/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Comprehensive Guide to Data Visualization in R

  https://www.analyticsvidhya.com/blog/2015/07/guide-data-visualization-r/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  沒有編程經驗:記住,你無需成為該工具的專家。重點是你該用一個新工具來執行相同的練習(如探索,可視化或統計檢驗)。你將通過練習掌握這些技能和工具。

  當前的數據科學團隊在SAS上工作,我該轉移到Python/R上嗎?我建議只從SAS開始。始終選擇當前組織中的數據科學團隊正在使用的工具。這將有助於你向數據科學過渡。

  第五步:了解建模/預測建模的步驟

  現在終於到了數據科學最吸引人的部分——建模!在你投身於研究具體模型前,我建議你首先理解存在的問題類型。這裡有一篇文章解釋了預測建模/機器學習的基礎知識。

  Machine Learning basics for a newbie

  https://www.analyticsvidhya.com/blog/2015/06/machine-learning-basics/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  大體上,我們可以將建模過程分為5步:

  定義問題

  生成假設

  探索數據

  模型建立

  模型評估和驗證

  我將前兩步放到後面講(定義問題和生成假設)。這裡我們先討論探索數據。

  探索分析的步驟類似於檢測分析,這裡我們的主要目標是理解每個變量的行為和它們互相的關係。良好的統計知識將對你有很大幫助。這一步的終點是生成見解和數據清洗。你可能需要輸入丟失值,檢測和處理異常值和執行多種類型的轉換。

  我寫了一篇文章《關於數據探索步驟的綜合指南》,你可以練習所有這些方法,從你的行業中選一個數據集,或使用任何開放資料庫。

  Comprehensive Guide on the Steps Involved in Data Exploration

  https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  它是如何區分於檢測分析的:它與檢測分析類似,添加了數據清洗和轉換步驟。這裡,你的重點應該是進行數據探索以實現特定目標,例如判斷「給定變量」是否會對目標變量產生影響。

  在沒有首先陳述問題時,我將如何建立和目標變量的關係?你可以使用定義了問題語句的任何開放數據集,並開始練習你的數據探索技能。

  第六步:評估模型性能的方法

  在模型構建的過程中,我們在一個預先知道了目標的數據集上訓練模型,然後將其應用到測試數據集上,以預測目標變量。我們顯然希望在預測目標變量時足夠準確。

  如何檢查模型是否準確?我們需要一個能根據實際觀察結果去評估模型結果方法。讓我們用一個例子來理解這一點:

  我們有一個客戶群,C1、C2和C3。我們估計只有C3會購買產品A。然而事實證明,C2和C3都買了這件商品。這意味著我們的準確率是 66.6%。這個準確率就被稱為「評估指標」。

  評估指標將根據你正在解決的問題類型而不同。這裡有一個你該知道的,常用評估指標清單:

  Evaluation Metrics

  https://www.analyticsvidhya.com/blog/2016/02/7-important-model-evaluation-error-metrics/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  現在你已經決定了評估指標的方法,但你有「實際結果」來評估你的模型嗎?你不能跳到未來去準備一個測試數據集!在這種情況下,我們保留了數據集的一個特定樣本,該樣本集不用來訓練模型。稍後我們用這個樣本集來評估模型。這種方法稱為模型驗證。你可以參考下面這篇文章,其中包括在R和Python中的實例。

  Various Validation Techniques

  https://www.analyticsvidhya.com/blog/2018/05/improve-model-performance-cross-validation-in-python-r/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  有必要知道所有的評估指標嗎?不一定。目前,只關注兩個評估指標—「RMSE」 和「混淆矩陣」。這兩個對於起步已經足夠了。你可以使用RMSE應對回歸問題,用混淆矩陣來應對分類問題。

  第七步:用線性回歸和邏輯回歸介紹預測建模

  你已經了解了數據集並查看了評估模型性能的指標。下一步是什麼?

  應用建模技術!不要同時學習各種技術。現在只關注兩個:

  線性回歸

  邏輯回歸

  這兩個技術將幫助你預測連續變量和分類變量。

  例如:

  線性回歸將幫助你預測下個季度保險公司銷售代理的預期業績。

  邏輯回歸將幫助你了解交叉銷售產品給特定客戶的可能性。

  以下2篇文章可以幫助你學習線性回歸,邏輯回歸和練習使用你選擇的工具:

  Beginner Guide for Linear, Ridge and Lasso Regression

  https://www.analyticsvidhya.com/blog/2017/06/a-comprehensive-guide-for-linear-ridge-and-lasso-regression/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Introduction to Logistic Regression

  https://www.analyticsvidhya.com/blog/2015/11/beginners-guide-on-logistic-regression-in-r/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  算法太數學化,難以理解:首先你要對這些技術建立一個直觀的理解,然後再深入到數學細節。這裡我建議採用自上而下的方法,更多地關注實際方面。你必須能夠解釋模型結果(例如了解該模型是否運行良好)

  第八步:確定業務問題(與你的角色相關)將其轉換為數據問題並進行預測

  那麼,哪裡可以找到你所在領域的數據集呢?找到一個商業問題可能很困難。

  你應該與領導層或團隊經理交談,並將他們的業務挑戰之一作為你的項目。這裡,第一步是將業務問題轉換成數據問題。然後,開始順著以下步驟前進(我們在前面第5點中討論過)——生成假設,收集數據,探索數據,數據清理,模型構建和驗證。

  作為一名BI專業人員,你具有的優勢之一是你已經熟悉數據集中的變量。你的檢測分析技能將幫助你理解變量間的關係。你可以跳轉到數據清理、轉換、確定正確的評估度量、設置驗證集以及最終構建模型等任務。

  你該花點時間觀看Tavish Srivastava裡的網絡研討會,了解定義問題和假設生成的重要性。

  Tavish Srivastava網絡研討會

  https://youtu.be/zOv0vjlTjro

  我還建議你閱讀下面的文章,關於在R和Python中構建模型:

  A comprehensive guide to build machine learning models from scratch

  https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Build a Machine Learning Model in 10 minutes using R

  https://www.analyticsvidhya.com/blog/2015/09/perfect-build-predictive-model-10-minutes/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Build a Machine Learning Model in 10 minutes using Python

  https://www.analyticsvidhya.com/blog/2015/09/build-predictive-model-10-minutes-python/?utm_source=11stepsBItoDSarticle&utm_medium=blog

  面臨的挑戰和解決方案:

  無法找到業務問題:你可能遭遇這樣的處境,你無法獲得業務問題或不能說服業務/團隊經理了解你的技能集。如果這正是你目前的處境,那麼你可以試試這些方法:

  以你自己的能力開始構建模型,以獲得更為明確的問題陳述:假設你要分析保險代理逐月的業務來源。你可以在製作分析報告時考慮預測代理們下個月的表現。你可以基於過去已有的人口統計或業績表現數據。一個月後你再來驗證你的結果,檢查你的預測有多好。

  參加開放的數據科學競賽,提高自己的形象:參加數據科學競賽是一個極好學習數據科學的方式,這將提高你的知識和形象,以及了解你相對於世界頂級科學家所處的位置。

  第九步:與企業主分享你的模型結果,獲得他們的信任

  在構建模型後,你應該與你的主管或決策者共享結果(如團隊或項目經理)。作為一名數據科學專家,分享你的發現是非常重要的(比如哪些特徵會對目標變量產生影響)。你還應該圍繞模型結果和實際數字之間的比較進行定期更新。

  這個過程將也會幫助你調整和改進你的模型。如果模型運行良好,那麼你很有可能獲得另外一個任務或參與到核心的數據科學團隊中的機會。這也正是我們的目標,不是嗎?

  面臨的挑戰和解決方案:

  我的模型表現不好,那我該怎麼辦呢?沒關係的。你可以進一步研究數據集和尋找問題。可以關注不同的算法,它可能更適合你正在解決的問題。

  第十步:不斷學習新算法,參加數據科學社團,專注構建個人檔案

  在數據科學領域,學習永無止境。這是一個不斷發展的領域,我們需要同它一起不斷進化。至此你已經學習了線性回歸和邏輯回歸,是時候擴展你的知識,超越自己了。學習決策樹,隨機森林,甚至神經網絡等算法。

  就像我之前提到過的,你應該在實踐中學習。擁有算法知識固然很好,但除非你能把它應用於實踐中。撿回我們之前用過的數據集,並應用這些新算法。你很可能將看到你的模型有了巨大的改善。

  現在,讓我們在工具和技術之外更進一步。我想強調在數據科學社區構建你的社交網絡和個人資料的重要性。

  開始參加以數據科學為中心的會議。你將遇到志趣相投的人,還有可以給你指導的經驗豐富的專家。我看到過很多有抱負的數據科學人員通過這些活動獲得了工作機會,所以我可以擔保這確實有用!

  你應該關注個人資料的數位化方面。既然你一直在與數據科學項目合作,那就向社區展示你的工作!將代碼上傳到Gitthub上並開始發布關於你的發現的博客/文章。這將有助於你未來的僱主看到,你對某些項目有著很好的理解。

  面臨的挑戰和解決方案:

  我不能決定我該研究哪種算法:這是一個經典問題。曾讓很多有志的數據科學家感到困惑。我的建議是研究你現在的組織中使用的算法。這使你的目光聚焦在你們的數據科學團隊需要的東西上。之前我們提到過組織內部轉型,還記得嗎?這是一個很好向已有的數據科學團隊展示你的價值的方法。

  我不知道從哪裡找到小組或加入哪裡組織?由於數據科學的蓬勃發展,有很多相關會議。如果你無法在你所在的城市找到,那你可以自己主辦一次。我看到過很多人主動在Linkedin和meetup.com上發布聚會詳細信息,並要求加入他們的社交網絡。你會對出現的人感到驚訝。

  第十一步:在你的組織中專注地向數據科學角色過渡

  雖然並沒有簡單的方法過渡到數據科學,但還是有確定的、常有人走的路徑。其中之一是從你現在的組織中切換到數據科學團隊。讓我解釋一下為什麼你該關注這種方式而不是其他路徑(至少對於初學者來說):

  你已經知道該領域是如何運作的。面對數據集中的某些變量,你非常擅長處理它們,因為你具有所需的業務知識。

  你的領導和團隊經理已經熟悉你的表現和職業道德。他們知道你帶來了什麼——信任是任何一個團隊中的重要因素,尤其是數據科學團隊。這將對你有利。

  無需花時間在組織外尋找工作機會。每個人都恐懼在招聘門戶上看著時間溜走而無法指望能找到一份體面的工作。

  這可能不適用於所有人,但當你切換組織時,你可能無法指望大幅的工資增長。記住,你是要過渡到你經驗有限的部門。

  你只要記住這一點,總是在你現在的公司中尋找機會。與高層或數據科學團隊交談。建立你的社交網絡,相信我,它最終會有回報的。

  面臨的挑戰和解決方案:

  無法在目前的組織中找到機會:如果這種情況發生了,你應該撒一張大網。正如我們前面步驟中討論的,你的Linkedin網絡和數據科學社區將派上用場。不要堅持用在線求職門戶被動求職——通過Lindedin和其它專業網絡聯繫招聘經理。線上展示你的項目。別放棄!這將考驗你的耐心,但第一次的突破值得你所付出的所有努力。

  結束語

  這是一段令人興奮的旅程。我已經在幾年前經歷過了這樣的過渡。我看到這個領域隨著時間推移而發展,本文的目的是幫助你實現轉變。你目前已經完成了很多其它向數據科學過渡的人沒有完成的步驟。記住這一點。

  最後,這裡是一些補充資料,關於學習數據科學,給你自己邁入該領域最好的機會。

  Introduction to Data Science Course

  https://courses.analyticsvidhya.com/courses/introduction-to-data-science-2?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Ace Data Science Interviews Course

  https://courses.analyticsvidhya.com/courses/ace-data-science-interviews?utm_source=11stepsBItoDSarticle&utm_medium=blog

  Certified Program: Data Science for Beginners (with Interviews)

  https://courses.analyticsvidhya.com/bundles/data-science-beginners-with-interview?utm_source=11stepsBItoDSarticle&utm_medium=blog

  

  

本文首發於微信公眾號:大數據文摘。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

(責任編輯:婁在霞 HN151)

相關焦點

  • 轉行數據分析師後悔了?脫穎而出才是關鍵!
    轉行這個詞彙,一直是職場上此起彼伏的一個熱門話題,相信很多朋友都想過或已經經歷過轉行。工作可謂是我們生存乃至生活的主要收入來源,誰都希望擁有一份高薪又穩定的工作,以此來改善自己的生活和實現自己的大大小小的夢想!
  • 零基礎轉行數據分析師是怎樣的體驗?
    這篇文章是根據將之前自己的知乎問答結合自己入職後的體驗進行修改分享給大家,如果有意轉行做數據分析師的進攻參考。這裡的數據分析師定位於偏業務的數據分析師,不談高大上算法和數倉之類的數據分析師。講這個之前還是要潑潑冷水,現在數據分析師的崗位被一些培訓機構炒的太熱,導致很多人被忽悠進這個行業。
  • 做好領導最喜歡的可視化報表,30歲依然能轉行大數據分析師
    我今年30歲了,已經工作了快8年,上有老下有小,但是我看不到自己工作的未來,想辭職又不敢,這種情況下可以轉行嗎?一般情況下,我不告訴當事人晚或者不晚這個非黑即白的答案。因為懂的人都知道,這個得分情況:如果我鼓勵他,想做改變一點都不晚,他聽了我的話,信心十足,一鼓作氣,裸辭,開始在家學習,等待轉行。
  • 怎樣從數據分析師轉型數據科學家?
    數據分析師的首要作業是對數據進行搜集和處理,並通過統計算法分析已處理的結構化數據,從而為數據賦能,改進決策。數據科學家也會進行相似的作業,但對其提出了更高的要求。那麼,怎樣從數據分析師轉型數據科學家呢?
  • 如何成為合格的數據分析師,需要考取哪些證書嗎?
    CDA數據分析師原創作品,轉載需授權數據分析師可謂是近幾年經常被業界提及和行業火熱招聘的一類職位,從15年大數據興起,到現在18年臨近年末,將近4個年頭的時光,大數據發展迅猛,數據分析師也跟著翻湧起來,
  • 想轉行大數據,如何判斷自己究竟適不適合?
    近年來,大數據產業飛速發展,市場規模逐年增長,不少人看到了大數據廣闊的未來前景,由此,也讓越來越多的人產生入行大數據的想法。然而,面對全新的行業,陌生的知識領域,這些想要轉行的轉型者們也在徘徊猶豫,一方面是不敢離開當前的行業,另一方面,也是對自己究竟是否能夠成功轉行感到困惑躊躇。
  • 數據科學家和數據分析師的區別在哪兒?
    數據科學家和數據分析師的區別在哪兒?數據科學家和數據分析師在所用程式語言、平臺/工具,以及所解決的問題方面都有共同之處。這些工具包括但不限於SQL、Tableau,以及相似的分析流程,定義問題、分析數據和輸出結果;一部分差異在分析的自動化上,數據科學家專注於使用Python等語言編寫算法,進行自動化分析和預測;而數據分析師則使用靜態的或者過往的數據,在某些情況下會使用Tableau和SQL等工具去做預測。
  • CDA數據分析師認證3個級別對應的薪資標
    如何成為數據分析師?如何入行數據分析?教育是一個難題!在這個行業中,是否有高質量的證書?拿到證書後能找到多少薪資的工作?今天,我們來分析分析作為這個行業中的老牌,CDA數據分析師的等級標準。   專指政府、金融、電信、零售等行業前端業務人員;從事市場、管理、財務、供應、諮詢等職位業務人員;非統計、計算機專業背景零基礎入行和轉行就業人員。
  • BI數據分析師,一個正在被悄悄淘汰的職業
    如果你正好是一名BI數據分析師或者在準備當BI數據分析師的路上,當你看到這個標題時可能就會開始各種不滿,淡定!先稍安勿躁,咱先聊聊為什麼我會這麼說,如果你有其他異議,歡迎在評論區提出!BI數據分析師這個職業現在怎麼樣?
  • 明知故問 | 2020熱門職業——數據分析師前景如何?
    關於數據分析師職業,從不同的視角切入,業界有各種分類和理解,但總的來說主要可以分為三類:數據分析師、數據科學家以及數據工程師。首先是數據分析師,這是數據分析職業的起點。有些企業則會根據自身所處行業特點,賦予數據分析師一些更具體的崗位名稱,例如業務分析師、運營分析師、資料庫分析師等等。
  • 如何成為一名數據分析師?
    因此,數據分析師也成為一個熱門的職業。那麼,數據分析師這個職業到底怎麼樣呢?首先,我們需要了解數據分析師是做什麼的。數據分析師 指的是不同行業中,專門從事行業數據搜集、整理、分析,並依據數據做出行業研究、評估和預測的專業人員。可以分為兩種:一種類似產品經理、一種偏向數據挖掘。
  • 數據分析師的發展方向有哪幾方面?
    數據分析行業大火,很多小夥伴都想轉行成為數據分析師,入行容易,但重要的需要確定未來的一個發展方向,不能盲目入行。下面小編給大家分享幾種數據分析師的發展方向,大家可以參考一下,首先確定好自己的目標。業務數據分析師:技能上需要會使用Excel、pythonl和SQL,因為業務數據分析師主要工作是把數據和業務結合的,用數據輔助業務增長,對於技術方面的要求一般,業務知識才是重點。
  • 女生適合做數據分析嗎?數據分析師是否是青春飯?
    在當下大數據分析與人工智慧火熱發展的的浪潮下,數據分析師或大數據分析師已然成為當前炙手可熱的熱門就業職位之一,就業待遇和發展前景也是被好多人看好,於是乎想進入數據分析行列的人群也日益增加,很多女生也會蠢蠢欲動,想轉行或立志從事數據分析領域的工作,但顧慮也由此產生——女生適合做數據分析嗎?
  • 第十二屆CDA數據分析師考試火熱報名中
    5月8日,CDA數據分析師認證考試中心正式發文通知:為做好疫情常態化防控,CDA第12屆考試將延期一個月進行。原定於6月底的第十二屆CDA數據分析師考試時間調整為7月25-26日兩天,請相關考生做好安排。此次延期為廣大考生爭取了更多的備考時間,也讓一些原本複習時間不充足的考生趕上了末班車。
  • 工作越來越難找了,如何轉行大數據行業?
    第一點,你要清楚自己為什麼轉行到大數據。只有清楚自己轉行大數據的原因,才能夠一直堅持下去。第二點,你需要選擇一個自己感興趣的大數據工作方向,比如大數據平臺研發、大數據分析、大數據開發等,每個崗位工作的內容都不盡相同。最後,在選擇完具體的大數據方向之後,就要深入地學習你選擇方向的專業知識和準備相關的面試,之後可以開始投遞簡歷。
  • 數據分析師必讀的養成書單!
    《魔鬼數學》作為一名數據分析師一定要對數字很敏感。這本書中世界知名數學家喬丹艾倫伯格告訴我們數學與我們所做的每一件事都息息相關,可以幫助我們洞悉在混沌和嘈雜的表象之下日常生活的隱形結構和秩序。《黑天鵝 - 如何應對不可預知的未來》這是一本較難閱讀的書,它的主要目的是如何從有限的已知推測出無限的未知。有一部分原理闡述一部分有趣的建議,書中有很多統計學範疇的知識。塔裡布舉了很多依靠隨機性而失敗的例子,以及成功的預測可能是多麼微不足道的例子。
  • 第十二屆CDA數據分析師考試即將開始
    「CDA數據分析師」旨在加強全球範圍內科學化、專業化、體系化的大數據及數據分析人才隊伍建設,進一步提升數據分析師的職業素養與能力水平,促進數據科學行業應用的高質量持續快速發展。今年是CDA數據分析師舉辦的第12屆,考試時間安排在7月25日—7月26日。CDA數據分析師認證等級標準如下:CDA Level Ⅰ:業務數據分析師專指網際網路、零售、金融、電信、政府等行業領域前端業務人員;從事市場、諮詢、BI、財務、風控、數據分析等職位人員;非統計、計算機專業背景零基礎入行和轉行就業人員。
  • 十圖看懂「CDA數據分析師」證書的含金量
    市面上有很多種數據分析師的證書,但是到底考哪一種讓人頭疼。今天帶大家一起看看「CDA數據分析師認證」的含金量如何。為想要投身於數據分析領域的人提供一點專業性意見。2016年-CDA匯聚海內外大數據、數據分析專家上千人,培養數據相關人才40000多人; 2019年-CDA認證考試已舉辦11屆,報名考生數萬名。
  • Python數據分析師的就業前景如何
    首先,從工業網際網路和大數據的發展趨勢來看,Python數據分析師的就業前景還是非常廣闊的,一方面數據分析本身的應用場景會越來越多,另一方面Python語言在人工智慧領域也有比較廣泛的應用,所以Python數據分析師的發展空間也比較大。
  • 數據分析師如何避免項目危害?
    數據正在成為現代企業的一個更重要的工具,幾乎可以作為一種貨幣,它可以從衡量營銷活動的有效性到評估員工績效等方面促進一切。但許多企業家認為數據本身就是有價值的。那麼,數據分析師如何避免項目危害呢?今天就跟隨小編一起來了解下吧!1.