全文共2251字,預計學習時長6分鐘
自從數據科學興起,Python成為必要的數據分析工具,大受歡迎,Python受到如此多讚譽和關注,主要是因為它的數據科學庫和它的用戶友好性。這並不奇怪,因為這種高級程式語言使用了類似英語的語法。
另一個讓Python無處不在的重要因素在於,它是一種開源的程式語言,這意味著它不會產生任何成本。
數據科學和Python相結合是一段充滿希望的冒險。開發者們可用它處理當下的業務問題,從醫療健康到工業等涉及各個領域。從數據中獲得的洞見最終都要用於積極驅動市場,為企業和利益相關者創造雙贏環境。
隨著企業意識到數據科學的極大重要性,對數據科學家的需求便劇增了。由此,企業可應用數據驅動的方式來優化決策過程。
對於數據科學崗位的劇增,求職者的反應可謂獨一無二。招聘人員發現他們收到的簡歷,不僅有來自與計算機科學相關背景的求職者,還有來自完全不相關領域,如人類學、社會科學和無學位的求職者。
數據科學,只有Python就夠了嗎?
數據科學工作崗位需求的確在迅速增長。但與此同時,在這個領域獲得一份體面的工作仍然具有挑戰性,對新手尤甚。這是因為,數據科學在理論與現實生活應用中存在著微妙區別,而後者與企業日常要處理的問題密切相關。
數據科學領域的學術界中,Python很受重視。教授們和講師們教授如何利用Python的庫,如NumPy, Pandas和Scikit-learn來理解數據。然而,雖然在某些情況下,單單Python就足以應用數據科學,但可惜的是,在企業界,它只是企業處理其大量數據的一小塊拼圖。
Python的局限性和其替代品
要追溯Python無法覆蓋從數據提取到模型評估的所有數據科學階段背後的原因,最重要的是要知道企業的數據首先儲存在哪裡。大多數公司的數據儲存在伺服器的資料庫上。這些資料庫需要被並發管理以保證效率和數據的可用性。
不幸的是,這項任務超出了Python的能力範圍,於是這裡就需要SQL(結構化查詢語言)來發揮作用。這就是為什麼,可以理解,幾乎所有數據科學相關的工作崗位都會出現SQL。比如,數據分析師、業務分析師和數據科學家等。
此外,在著手處理數據科學中的機器學習和深度學習等具體細節之前,招聘經理會測試應聘者的SQL能力。問題在於,沒有了SQL,甚至無法獲得所需要的數據去處理。因此,從招聘者角度來看,SQL的使用經驗比Python的更重要。
SQL VS Python
在專業人員中,SQL甚至比Python更受歡迎。2020年StackOverflow對47184位專業開發者進行了關於最重要編碼語言的最新調查,其結論如下:
網絡開發語言佔據榜首,如Javascript和HTML/CSS,分別佔比69.7%和62.4%。SQL以56.9%的佔比緊隨其後。Python以41.6%的佔比排名第四,比SQL約低15%。
SQL vs Python: MOOCs
對網上教授SQL的課程進行調查,得到了以下評論:首先,相比於Python,教授SQL的線上課程數量更少。舉例來說,在Edx搜索欄輸入「SQL」一詞,顯示課程量31,而輸入Python,這一數字是94。
其次,SQL的課程層次有缺口。簡單來說,要麼是課程過於入門,要麼是課程過於高級。前者是在SQL的表面上做文章,比如(SELECT、INSERT和UPDATE查詢)。而後者可能會顯得晦澀難懂,讓人無從下手。
雖然SQL在專業開發者群體中備受認可,但奇怪的是,它在大多數線上學習平臺都被低估了。這對自學的人產生了負面影響,阻礙了他們向數據科學家前進的腳步。
SQL在產業中的應用
「競爭條件」是關係型資料庫管理系統(RDBMS)中經常出現的問題。它發生在對一個資料庫同時進行數百萬或數億次操作的情況下。舉個例子,當社交媒體上的一個帖子被病毒式傳播,數百萬人同時與之互動,導致資料庫上的操作交織在一起,這將導致約束違反和更多不必要的結果。
細節就不多說了,在眾多解決方案中,有一種可能的方案來處理這些情況,那就是使用「鎖」。當然,每種解決方案都有其用例和局限性。知道使用哪種方案及何時使用是一種技能,只有經過專業的經驗才可磨練出來。
啟發
Python仍然是一門值得學習有趣的程式語言,特別是對於有抱負的數據科學家來說。它在數據科學中的重要性不容忽視或低估,但SQL仍然是領先的黑馬,在職位競爭激烈的時候,它讓你比其他候選人更有優勢。
學習SQL不是走馬觀花。查詢語言不僅需要行業設置(如果在本地工作,則需要伺服器),而且使用SQL工作涉及到使用多種資料庫軟體,MySQL、SQL Server和PostgreSQL等等。
SQL軟體的語法有輕微的差異。這可能會很煩人,因為不是所有的企業都使用相同的軟體。因此,至少應該學習最常用的軟體,如MySQL和SQL Server。
留言點讚關注
我們一起分享AI學習與發展的乾貨
如轉載,請後臺留言,遵守轉載規範