轉自|燈塔大數據
微信|DTbigdata
新的一年不僅僅意味著換一本新檯曆或者揉著眼睛在下一個清晨醒來。新的一年應該擁有一個新開端的喜悅,它賦予我們充分的理由去養成新習慣,也標誌著新「希望」的到來。
如果你看到這篇文章的題目開始閱讀本文,那麼一定是數據科學激起了你的興趣。你肯定希望2016年成為你的轉運年,對不對?如果你從今天起堅持去執行這些新年計劃,轉運的可能性就會更大。要知道,成為一名數據科學家不能一蹴而就,需要的是一個過程。因此,朝目標邁進的過程中一定要充滿耐心。
根據發展階段的不同,我在此給大家分享一些每個數據科學家都應該做的新年計劃。當然這個列表比較籠統,大家可以根據自己的需求去調整。
根據數據科學家一生的三個發展階段,我將這些計劃做了分類。大家可以自己判斷哪些計劃適合自己並按照計劃行動起來。如果你已經成功地完成了現有階段的任務,就可以轉向下一階段。我還列出了現有的有關該主題的最佳課程。為了實現最佳效益,我建議大家逐一學習。
什麼是初學者?——如果解析學和數據科學對你來說是全新的領域,你也不知該行業的發展模式,而你又想在這個行業大展拳腳一番,那麼初學者就是你。以下這些應該在你的計劃之內。
我曾見到有同學同時學習R語言和Python語言,最後落得兩手空空。這種做法是很致命的。你一定要沉下心來專攻一門。鑑於這兩種語言都是開放原始碼工具,所以在公司裡都有廣泛運用。Python被公認為最簡單的程式語言,而R語言一直都是最受青睞的統計工具。學習哪一門的決定權在你,因為兩個同等出色。
統計學的內容全都是關於假設和數列,然而沒有統計學和數學的知識你很難深入到數據行業裡,這是數據科學家的重中之重。如果你不擅長數學,那現在是時候走出困境了。面對深奧的統計、幾何和概率領域知識時,一定不要驚慌。可汗學院(Khan Academy)、Udacity等站點上都有很多優質的統計學課程。下載APP,現在就能開始學習!
大規模網絡開放課程可以免費獲取和學習,可這對你來說也是最難實現的諾言。很多學生通常一次性註冊選修很多課程,結果一門也沒有圓滿完成。所以,你一定要一次專注一門課,完成之後再選下一門。你也可以在Coursera,edX和 Udacit上查找任何想要的學習課程。
你要了解業內動態。我們生活在一個變化的世界,一夜之間事物就可能發生重大變化,今日風靡的技術明日就很可能面臨淘汰。你一定要與富有經驗的專業人士、業內專家交流,預見未來的自己。所以趕快參與到討論和聚會中來吧,關注一些微博微信(如燈塔大數據公眾號),加入一些群組,多閱讀一些書籍。
機器學習是數據科學和技術的未來。所有的大型企業都不惜重金僱用掌握這個技能的人才。毫無疑問,近日來這項技術的需求越來越大,現在正是你充分利用這一局面的大好時機。今年,你應該努力在機器學習上精益求精,深入掌握回歸、聚類和分類與回歸樹(CART)技能。Andrew Ng上你可以找到關於機器學習的免費資源。
推薦課程:完成Andrew Ng機器學習課程任務。一旦你對機器學習充滿自信,那就繼續去學習其他模型。通過Boosting和集成算法,你的模型準確率與其他算法相比會突飛猛進。上述免費資源裡也包含這一主題。不過一定要讓自己做好心理準備,拿下這個主題需要超強的理解力。
推薦課程:閱讀Kaggle Ensembling Guide。學習MIT LectureBoosting相關課程。今年你的學習之旅始於大數據。考慮到大數據專業人員的需求激增,你一定要學習Spark,這個工具最近非常火爆。大數據的未來就在Spark,它廣泛用於處理和操縱數據。除此之外,你還可以拓展到NoSQL和Hadoop領域來。
還有什麼比分享知識更美妙呢!從今年開始,你可以把自己的知識分享給正在數據科學的路上不斷探索的人們。你可以加入活躍的數據科學論壇,給他們答疑解惑,以你的靈招妙計給他們做培訓。你也可以在附近的行業圈裡發起聚會。
是時候檢驗你的真才實學了。今年你一定要參加一些競賽。這些競賽會引導你去關注自己的弱勢領域。此外,你也會因已有的學識而信心倍增。我希望你可以榮登Kaggle500強數據科學家之列。而現在,你的目標就是堅持到底。
推薦任務:加入Kaggle。加入Data Hack。
附言:有時競賽也會有難度。你也可以通過這些實際的問題來檢驗你的技能和知識。這些問題不難,並且妙趣橫生。對於進入這個階段的人我就不需要來給出標準了,你們所了解的數據科學,很多人甚至連嘗試的勇氣都沒有。身處這一階段,你們的生活愜意而又自如。可有時還想去迎接挑戰,以下是一些計劃。今年,你們要為有志於成為數據科學家的人們樹立榜樣。你要下決心在今年建立深度學習的模式。全球的人都在用這一模式進行預測,它是機器學習的高級階段,其準確率明顯高於普通的機器學習模型。
我相信知識的意義不是被束之高閣,而是與人分享。分享越多,收穫越大。據說,如果你了解一個新概念並解釋給你的兩個朋友,你對這個概念的記憶很可能會更久。所以今年,你必須制定計劃,運用自己的知識和經驗幫助數據分析學領域的人。這也會為更多的在這個領域的人指明方向。
強化學習是機器學習中最有效而又鮮有發現的領域。今年,你可以下定決心研究下這個領域。雖然很有挑戰性,但是一定值得你去嘗試。無人汽車、無人偵察機就是強化學習的碩果。一旦開始學習這些,你就自然而言地進入到了人工智慧領域。
推薦課程:學習 Andrew Moore的輔導課程。今年,你要下定決心保持Kaggle上的領先地位。具體來說,就是在Kaggle50強中佔有一席之地。參加一些與自己的知識相符的競賽。與其他的選手團結協作。在這個競爭階段,你一定會有意想不到的收穫。
我相信,這些計劃也許對你來說很富有挑戰,但是很值得一試。你可以根據自己的現狀開始一項計劃。我只是簡單地列出了有事業心的數據科學家必須採取的一些計劃。
上周,我意識到有的人在決定一個新年計劃時會信心不足。我也曾為此而憂心忡忡。因此,我才打算寫這篇文章。我希望2016年結束之前,大家可以達到初學者水平(假定你剛剛入行)。
本文也許能消除你制定新年計劃時的一些疑慮。作為一位有事業心的數據科學家,我已經為大家提供了很多參考課程,大家一定要逐一消化後再不斷前進。如果你有難以圓滿完成計劃的感想,歡迎與我互動。
往期精彩文章推薦,點擊圖片可閱讀
【限時乾貨下載】
點擊下圖,閱讀「2016大數據發展7大趨勢」
2016/1/31前
2015年12月乾貨文件打包下載,請點擊大數據文摘底部菜單:下載等--12月下載
大數據文摘精彩文章:
回復【金融】 看【金融與商業】專欄歷史期刊文章
回復【可視化】感受技術與藝術的完美結合
回復【安全】 關於洩密、黑客、攻防的新鮮案例
回復【算法】 既漲知識又有趣的人和事
回復【谷歌】 看其在大數據領域的舉措
回復【院士】 看眾多院士如何講大數據
回復【隱私】 看看在大數據時代還有多少隱私
回復【醫療】 查看醫療領域文章6篇
回復【徵信】 大數據徵信專題四篇
回復【大國】 「大數據國家檔案」之美國等12國
回復【體育】 大數據在網球、NBA等應用案例
回復【志願者】了解如何加入大數據文摘
長按指紋,即可關注「大數據文摘」
專注大數據,每日有分享