學習數據分析一定要會Python和SQL嗎?
其實這是一個比較常見的問題。
從數據分析的角度來分析的話,有人會說應用數據分析就是編程處理數據,當今在應用數據分析中使用的兩種主要語言是SQL和Python。如果你想成為一名優秀的數據分析工程師,或者說正在這條路上「艱難行走」,那你至少需要掌握這兩種核心的語言(SQL和Python)進行編程。
SQL作為一種結構化查詢語言,無論供應商的口味如何,SQL是用於與關係資料庫進行通信的標準語言,是數據分析師離不開的工具。
當前,大多數我們應用的數據分析模型都來自關係資料庫。此外,許多大數據工具和雲數據服務也都是在使用SQL。
某公司在尋找實習生的時候,要求精通Python和SQL,雖然我不太確定實習生如何精通Python和SQL,但這就是另外的問題了。
當前,在應用數據分析中一項工作的首要要求是SQL而,Python是數據分析中的王者,數據分析又是數據分析的一個重要的延伸。
目前,了解Python的數據分析工程師的工作要比該領域中使用的所有其他語言的工作要多得多。Python已然成為構建端到端數據分析模型的黃金標準。
我們來看看哥倫比亞運動服的設計工作。該職位發布是針對數據工程師而非數據分析師的。該公司顯然不了解這兩個角色,對於沒有紮實的編程經驗的人來說,這個角色太技術化了,對於數據分析師而言技術卻不是最重要的一個因素。
但是這個要點可以解決,在快速原型製作和使用複雜算法開發端到端解決方案方面表現出的能力往往能夠顯示出一個數據分析人才的專業素質和綜合素養。構建短語快速原型是一個由構思、』原型和測試組成的設計工作流程。它可不僅以幫助設計師快速發現並驗證他們的最佳創意,還可以幫助分析師們注意「開發端到端解決方案」從而產出最佳方案。
從一開始到現在我一直在強調一個至關重要的要素,即SQL。在同一行上,您將看到R,Python或SAS。有人說要遠離R和SAS,專注於Python。從某些角度來說,還是有一點道理的。儘管在某些工作和項目中會涉及到SAS和R的工作,但是如果不學習Python的話將會大大限制了你的工作機會。
這上面只是兩個例子。但是,我建議大家都需要花一點時間在自己喜歡的工作崗位JD上仔細閱讀相關的技能。問問自己,自己都符合要求了嗎?或者在最短的時間內,如何讓自己滿足這些條件?
不然,就從學習Python和SQL開始吧~