一名數據科學家的新年計劃

2021-02-25 大數據文摘

轉自|燈塔大數據

微信|DTbigdata

新的一年不僅僅意味著換一本新檯曆或者揉著眼睛在下一個清晨醒來。新的一年應該擁有一個新開端的喜悅,它賦予我們充分的理由去養成新習慣,也標誌著新「希望」的到來。

如果你看到這篇文章的題目開始閱讀本文,那麼一定是數據科學激起了你的興趣。你肯定希望2016年成為你的轉運年,對不對?如果你從今天起堅持去執行這些新年計劃,轉運的可能性就會更大。要知道,成為一名數據科學家不能一蹴而就,需要的是一個過程。因此,朝目標邁進的過程中一定要充滿耐心。

根據發展階段的不同,我在此給大家分享一些每個數據科學家都應該做的新年計劃。當然這個列表比較籠統,大家可以根據自己的需求去調整。

根據數據科學家一生的三個發展階段,我將這些計劃做了分類。大家可以自己判斷哪些計劃適合自己並按照計劃行動起來。如果你已經成功地完成了現有階段的任務,就可以轉向下一階段。我還列出了現有的有關該主題的最佳課程。為了實現最佳效益,我建議大家逐一學習。

什麼是初學者?——如果解析學和數據科學對你來說是全新的領域,你也不知該行業的發展模式,而你又想在這個行業大展拳腳一番,那麼初學者就是你。以下這些應該在你的計劃之內。

1. R語言也好,Python語言也好,學習一門新的程式語言

我曾見到有同學同時學習R語言和Python語言,最後落得兩手空空。這種做法是很致命的。你一定要沉下心來專攻一門。鑑於這兩種語言都是開放原始碼工具,所以在公司裡都有廣泛運用。Python被公認為最簡單的程式語言,而R語言一直都是最受青睞的統計工具。學習哪一門的決定權在你,因為兩個同等出色。

推薦課程:學習Codecademy上的Python語言課程;學習DataCamp上的R語言課程。

統計學的內容全都是關於假設和數列,然而沒有統計學和數學的知識你很難深入到數據行業裡,這是數據科學家的重中之重。如果你不擅長數學,那現在是時候走出困境了。面對深奧的統計、幾何和概率領域知識時,一定不要驚慌。可汗學院(Khan Academy)、Udacity等站點上都有很多優質的統計學課程。下載APP,現在就能開始學習!

推薦課程:Udacity上的推論統計學和描述統計學課程;可汗學院(Khan Academy)上的幾何課程。

大規模網絡開放課程可以免費獲取和學習,可這對你來說也是最難實現的諾言。很多學生通常一次性註冊選修很多課程,結果一門也沒有圓滿完成。所以,你一定要一次專注一門課,完成之後再選下一門。你也可以在Coursera,edX和 Udacit上查找任何想要的學習課程。

推薦課程:例如學習Coursera上的數據科學專業化(R語言)課程;學習Dataquest上的數據科學Python語言課程。

你要了解業內動態。我們生活在一個變化的世界,一夜之間事物就可能發生重大變化,今日風靡的技術明日就很可能面臨淘汰。你一定要與富有經驗的專業人士、業內專家交流,預見未來的自己。所以趕快參與到討論和聚會中來吧,關注一些微博微信(如燈塔大數據公眾號),加入一些群組,多閱讀一些書籍。

中級水平的數據科學家是什麼樣的?——如果你已經完成了前一階段的內容,有過機器學習基礎知識的實踐經驗,掌握了建立預測模型的知識,那你就達到了中級水平。完成這一階段需要強大的決心和持久的練習。迎接這個挑戰,你做好準備了嗎?

機器學習是數據科學和技術的未來。所有的大型企業都不惜重金僱用掌握這個技能的人才。毫無疑問,近日來這項技術的需求越來越大,現在正是你充分利用這一局面的大好時機。今年,你應該努力在機器學習上精益求精,深入掌握回歸、聚類和分類與回歸樹(CART)技能。Andrew Ng上你可以找到關於機器學習的免費資源。

推薦課程:完成Andrew Ng機器學習課程任務。

一旦你對機器學習充滿自信,那就繼續去學習其他模型。通過Boosting和集成算法,你的模型準確率與其他算法相比會突飛猛進。上述免費資源裡也包含這一主題。不過一定要讓自己做好心理準備,拿下這個主題需要超強的理解力。

推薦課程:閱讀Kaggle Ensembling Guide。學習MIT LectureBoosting相關課程。

今年你的學習之旅始於大數據。考慮到大數據專業人員的需求激增,你一定要學習Spark,這個工具最近非常火爆。大數據的未來就在Spark,它廣泛用於處理和操縱數據。除此之外,你還可以拓展到NoSQL和Hadoop領域來。

還有什麼比分享知識更美妙呢!從今年開始,你可以把自己的知識分享給正在數據科學的路上不斷探索的人們。你可以加入活躍的數據科學論壇,給他們答疑解惑,以你的靈招妙計給他們做培訓。你也可以在附近的行業圈裡發起聚會。

是時候檢驗你的真才實學了。今年你一定要參加一些競賽。這些競賽會引導你去關注自己的弱勢領域。此外,你也會因已有的學識而信心倍增。我希望你可以榮登Kaggle500強數據科學家之列。而現在,你的目標就是堅持到底。

推薦任務:加入Kaggle。加入Data Hack。

附言:有時競賽也會有難度。你也可以通過這些實際的問題來檢驗你的技能和知識。這些問題不難,並且妙趣橫生。對於進入這個階段的人我就不需要來給出標準了,你們所了解的數據科學,很多人甚至連嘗試的勇氣都沒有。身處這一階段,你們的生活愜意而又自如。可有時還想去迎接挑戰,以下是一些計劃。

今年,你們要為有志於成為數據科學家的人們樹立榜樣。你要下決心在今年建立深度學習的模式。全球的人都在用這一模式進行預測,它是機器學習的高級階段,其準確率明顯高於普通的機器學習模型。

我相信知識的意義不是被束之高閣,而是與人分享。分享越多,收穫越大。據說,如果你了解一個新概念並解釋給你的兩個朋友,你對這個概念的記憶很可能會更久。所以今年,你必須制定計劃,運用自己的知識和經驗幫助數據分析學領域的人。這也會為更多的在這個領域的人指明方向。

強化學習是機器學習中最有效而又鮮有發現的領域。今年,你可以下定決心研究下這個領域。雖然很有挑戰性,但是一定值得你去嘗試。無人汽車、無人偵察機就是強化學習的碩果。一旦開始學習這些,你就自然而言地進入到了人工智慧領域。

推薦課程:學習 Andrew Moore的輔導課程。

今年,你要下定決心保持Kaggle上的領先地位。具體來說,就是在Kaggle50強中佔有一席之地。參加一些與自己的知識相符的競賽。與其他的選手團結協作。在這個競爭階段,你一定會有意想不到的收穫。

我相信,這些計劃也許對你來說很富有挑戰,但是很值得一試。你可以根據自己的現狀開始一項計劃。我只是簡單地列出了有事業心的數據科學家必須採取的一些計劃。

上周,我意識到有的人在決定一個新年計劃時會信心不足。我也曾為此而憂心忡忡。因此,我才打算寫這篇文章。我希望2016年結束之前,大家可以達到初學者水平(假定你剛剛入行)。

本文也許能消除你制定新年計劃時的一些疑慮。作為一位有事業心的數據科學家,我已經為大家提供了很多參考課程,大家一定要逐一消化後再不斷前進。如果你有難以圓滿完成計劃的感想,歡迎與我互動。

往期精彩文章推薦,點擊圖片可閱讀


【限時乾貨下載】

點擊下圖,閱讀「2016大數據發展7大趨勢」

2016/1/31前

2015年12月乾貨文件打包下載,請點擊大數據文摘底部菜單:下載等--12月下載


大數據文摘精彩文章:

回復【金融】 看【金融與商業】專欄歷史期刊文章

回復【可視化】感受技術與藝術的完美結合

回復【安全】 關於洩密、黑客、攻防的新鮮案例

回復【算法】 既漲知識又有趣的人和事

回復【谷歌】 看其在大數據領域的舉措

回復【院士】 看眾多院士如何講大數據

回復【隱私】 看看在大數據時代還有多少隱私

回復【醫療】 查看醫療領域文章6篇

回復【徵信】 大數據徵信專題四篇

回復【大國】 「大數據國家檔案」之美國等12國

回復【體育】 大數據在網球、NBA等應用案例

回復【志願者】了解如何加入大數據文摘

長按指紋,即可關注「大數據文摘」

專注大數據,每日有分享

相關焦點

  • 成為一名數據科學家的學習三部曲
    如果你看到這篇文章的題目開始閱讀本文,那麼一定是數據科學激起了你的興趣。你肯定希望2016年成為你的轉運年,對不對?如果你從今天起堅持去執行這些新年計劃,轉運的可能性就會更大。要知道,成為一名數據科學家不能一蹴而就,需要的是一個過程。因此,朝目標邁進的過程中一定要充滿耐心。根據發展階段的不同,我在此給大家分享一些每個數據科學家都應該做的新年計劃。
  • 如何成為一名數據科學家?
    處理大數據時,Numpy和pandas這些庫有些捉襟見肘,Continuum正在致力於解決這個問題,目前來看還沒有完成。對於數據控制,缺少像LINQ那樣的內置的聲明式的語言。Pandas對數據控制的能力還是比較低級,而且當你深入研究Pandas的時候很可能會被它的語法整崩潰。缺少面向數據科學家的專門的IDE,R的R Studio就不錯。
  • 「我克服了抑鬱症成為了一名數據科學家:這是我的故事」
    拉維·斯裡達(Ravi Sreedhar)是一位在NeenOpal Intelligent Solutions工作的略有成就的數據科學家。然而誰又能想到,他是一名抑鬱症患者,在抑鬱症的泥潭中反覆掙扎過。但他最終成功地克服了抑鬱症,並且成為了一名數據科學家。下面我們來看看他本人是怎麼講述這個故事的。
  • 作為一名數據科學家,必須要會使用SQL嗎?
    作為一名數據科學家,你使用什麼方法?你還有其它方法嗎?數據科學家必須要會使用SQL嗎?本文將討論SQL在數據科學中的作用,以及結構化查詢語言(SQL)的替代方法。SQL是否需要了解SQL具體取決於個人所屬公司和數據科學團隊。
  • 蹩腳數據科學家的10種現象
    如果你的數據科學家堅持要求配一名助手,因為他用不來電腦,那麼你應該繼續尋找,去僱用其他人。3. 沒有全能型人才一個人集統計學家、開發員、數學家和其他身份於一身,並不意味著他能成為一名數據科學家。幾乎可以肯定的是,他擁有跨領域知識,能夠根據不同的職位需求來推銷自己。他也許什麼都會,但可能什麼都不精。
  • IBM推出新認證計劃,解決數據科學家人才緊缺問題
    數據科學家的重要性也由此日益凸顯。《哈佛商業評論》(Harvard Business Review)曾在2012年將數據科學家評為21世紀最性感的職業。隨著關注度和需求量的增加,特別是面對不斷激增的數據量,市場對數據科學家的角色與職能的需求,在過去幾年中變得供不應求。
  • 25位大數據科學家
    他2014年5月16日加盟百度,成為百度首席科學家,帶領百度大腦計劃項目,負責百度研究院,開展深度學習和大數據與人工智慧可伸縮性方法。他又是史丹福大學(Stanford University)的計算機科學系與電子工程系的副教授,人工智慧實驗室主任。
  • 數據科學家vs數據分析師,到底有啥區別?
    有人會說,要成為一名數據科學家,要先從數據分析的工作做起。作者在兩個領域都待過,本文旨在闡明成為數據科學家和數據分析師到底意味著什麼。一起來看看~ 之前我是數據分析師的時候,我想繼續深造成為一名數據科學家,我意識到兩者有很大不同。
  • 身為一名數據科學家「過來人」,我為什麼更建議你去做軟體工程師
    ,數據科學家被稱為21世紀最性感的工作,一時進入了全民數據科學的時代。數據科學的價值雖然有目共睹,但不是每個公司都有條件來實現數據驅動的商業願景,每個公司的數據基礎設施水平層次不齊,有些遠達不到數據科學家可以大展拳腳的水平。  作為前數據科學家和現軟體工程師,作者給出了過來人的建議。讓我們聽聽他為什麼勸想做數據科學家的勇士不如去做軟體工程師。  當有人問我如何進入數據科學領域時,我建議他們去做程式設計師。  這只是我的個人觀點。
  • 烏克蘭軍方新年慶祝,一名軍官酒後沖天放炮,炸傷一名陸戰隊士兵
    新年伊始 雙方也沒消停根據俄羅斯方面匯總的消息稱,在新年之後,「敵人兩次違反了《監視停戰協定遵守情況的附加措施協議》。」在馬裡烏波爾方向上,隨著新年的到來,烏克蘭武裝部隊第36旅海軍陸戰隊營的武裝人員在定居點附近地區的用輕武器進行了混亂的射擊。根據親俄民兵公布的數據,其中一名處於酒精中毒狀態的烏克蘭海軍陸戰隊員向空中發射了幾發炮彈,引發了在前線的爆炸聲,無意中打傷了他的戰友。該信息在馬裡烏波爾的一家醫院得到證實,烏克蘭海軍的奧洛夫中尉被送來,炸彈擊傷了他的頭部。
  • 如何制定一個成功的數據科學培訓計劃
    數據科學家目前仍很短缺。一些公司通過設立培訓計劃以重新培訓員工去擔任數據科學職位,從而填補這一空缺。那些知道如何幫助組織機構充分利用其信息資源的技術專業人員(尤其是數據科學家)目前需求量很大而供應短缺。
  • 數據科學家含金量最高的5個數據科學認證,先馬後看!
    只要你覺得100美元的考試費不貴,或者可以通過助學金計劃免除學費時,那麼就去考吧。據說學習了該系列課程的人:完成課程的人中有40%開啟了新的職業生涯 12%的人獲得升職加薪如此看來,這個認證及相應的證書可以很好地展示你的技能,同時在TensorFlow這個廣闊的平臺上證明了你的競爭力。SASSAS可能是數據科學家最不常用的平臺。
  • 拒絕疫情數據造假 美科學家住宅遭警察持槍搜查
    麗貝卡·瓊斯原本是美國佛羅裡達州衛生部門的一名數據科學家。今年5月,她被解僱,原因是她拒絕按照佛羅裡達州政府的意思篡改疫情數據來支持州政府的經濟重啟計劃。被解僱後,瓊斯創設了一個跟蹤佛羅裡達州新冠肺炎疫情的網站。但沒想到的是,瓊斯的家當地時間7日遭到警方突襲,她被警察用槍指頭,並被沒收了用來發布疫情數據的手機和電腦。
  • 我,一位數據科學家,用親身經歷告訴你:為啥數據科學家都在離職
    大數據文摘出品來源:medium編譯:Fisher本文的作者就是一位數據科學家,做了這麼久,他覺得有必要將這個行業的苦惱公之於眾,為那些想進入這個行業的人們做個參考。話不多說,來和文摘菌一起看看吧~是的,我是一名數據科學家,你也沒看錯標題,總得有人來說這件事。
  • 2021新年計劃
    上一年,我是失敗的,沒有復盤,隨遇而安,人無遠慮必有近憂,所以沒有計劃的2020年盲目且悲催。2021,嶄新的開始,沉思良久,決定做一下新年計劃,我想要目標堅定的生活。從幾方面說呢,我想應該從職業規劃、個人提升、教育方針等幾方面開始。
  • 數據科學家成長指南:從入門到被逼瘋
    可是你確定想好要成為一名數據科學家了嗎?你知道成為一名DS,需要具備什麼技能嗎?那就請準備好,下面我們要開車了! 你可能已經從媒體鋪天蓋地的報導中,了解到數據科學家這個抬頭非常火。根據UiPath數據顯示,2018年12113個崗位爭奪AI人才,數據科學家需求量排名第二。
  • 【新年作文】新年計劃
    當旅遊成為了人們日常生活的一部分,要享受旅遊就要提前制定要一份出色的旅遊計劃,這樣可以讓你在出行的過程中省心省力,更好地享受假期。  就說去年我們家去南嶽衡山看雪吧,在網上報了湖南當地的旅行社出團,下了高鐵就有導遊接,住宿自己在網上選好,吃、住都很滿意,價格比在廣州報每人省了幾百塊。嘗到甜頭的我們。決定今年新年再出行,還要是自助遊哦。
  • 「千人計劃」專家黃大年——戰略科學家
    「千人計劃」專家黃大年——戰略科學家 2017年12月26日 12:16作者:網絡編輯:網絡 「千人計劃」專家黃大年——戰略科學家 在英國的18年,讓黃大年在研究中逐漸成長,成為當時從事該行業高科技敏感技術研究的少數華人之一, 由他主持研發的許多成果都處於世界領先地位,更成為航空地球物理研究領域享譽世界的科學家。
  • 100天學習計劃 | 一份詳實的數據科學指南
    我遇到過許多對學習數據科學充滿熱情的人,但僅僅幾周後,他們就放棄了學習。我想知道為什麼一個人對一個領域如此熱情卻不去追求它?通過與他們中的一些人交談,我了解到人們放棄學習的主要原因是:這些甚至會嚇到一個有經驗的數據科學家,難怪他們會讓試圖學習數據科學的人放棄。上面的每一個話題就像一片海洋,當有人試圖快速掌握它們時,他們會感到沮喪並放棄學習。
  • 數據科學家和超級英雄有哪些共同之處?
    你的好鄰居——蜘蛛俠但是,在成為了一名高級數據科學家後,我對蜘蛛俠的忠心動搖了。因為我驚訝地發現自己開始熱衷於一些更強大的角色,比如雷神索爾。為什麼呢?驚奇隊長對戰滅霸同理,數據科學家們和領導他們的管理者也是如此。作為一名數據科學家(個人貢獻者),我致力於具體的項目,改善具體的決策。