古有曹子建七步成詩,今有DataCamp 8步成為數據科學家

2020-12-22 學謙數據

20200523古有曹子建七步成詩,今有DataCamp 8步成為數據科學家

這是國外一個非常厲害的數據科學學習平臺DataCamp數據科學大牛Karlijn Willems寫的一篇圖文《8步成為數據科學家》。

我看到之後感覺,哇,大牛就是大牛。

8步,就8步,而且是8 easy 步。

當然,這裡說的8步,不是說你用8天或者8周就可以完成,而是告訴你一個學習路徑。只要你按照這個學習路徑去學習,堅持學習,一定可以攀登到數據科學家的高峰的。

首先,什麼是大數據科學家?

這個問題讓我想起了,大學的系主任在給我們上的第一堂課時說的:

什麼是地球物理學系?

地球物理學系就是半個地質系、半個物理系、半個計算機系、半個數學系畢業的。說白了就是一個跨學科的專業。

同樣,數據科學家也是一個跨學科人才,是比軟體工程師更擅長統計學,比統計學家更擅長軟體工程的人。需要掌握的知識有數學統計,編程能力,機器學習,研究能力等。

最主要的是什麼呢?是將以上這些技能全部綜合運用起來,以解決實際的問題,促進業務的發展,提升生產力,為社會創造價值的。

從上圖來看,數據科學家大部分是本科或者碩士學歷(本科37%,碩士31%),當然,這個數據是幾年之前的。從調查數據來看,有5%高中畢業的人也成為了數據科學家。這足以說明,只要你肯努力,即便是文憑很一般,也是可能成為頂級大牛的。更何況,對於很多人來說,無需成為數據科學家,只要會一些常規的數據分析方法與技能,就能找到一個合適的工作。

第1步:學好統計、數學和機器學習

數學和統計學是數據分析的最基礎的內容,也是後續影響你發展路徑的決定因素,一定要打好基礎。但是機器學習這裡只要了解個大概就可以了。

以下給出了一些學習的書目與資料,如果覺得很難的話,可以參考這篇文章的幾本書:

【薦書】數據分析推薦書籍1——統計學

第2步:編程

編程能力早就已經作為大學生的基本能力之一,甚至現在的少兒編程也火速蔓延。

選擇一種數據分析的程式語言,例如開源軟體的R , Python語言等,或者商業軟體的SAS, SPSS等。

很多同學在學習程式語言的時候,經常是按照如下的路徑:從安裝到放棄……所以:

入門者的正確打開方式:使用Anaconda安裝Python

第3步:資料庫

少量的數據可以使用Excel文件來存放,但是數據量大時就不行了。大部分公司的大部分數據都存放在資料庫中,因此呢,資料庫的操作你需要熟悉的,如關係資料庫MySQL,非關係型資料庫MongoDB等。

想要玩轉Power BI,為什麼一定要學會資料庫?

7天學會SQL,樸實無華但並不枯燥

同樣,也不要從安裝到放棄啊:

手把手教你MySQL資料庫安裝-Windows版

第4步:學會數據清洗、可視化和報表製作

據統計,在大部分數據分析的工作中,有多達60%的時間都花在了數據清洗上了。所以數據清洗一定要選擇高效的工具,如Python的pandas包、R語言的data.table和dply包、PowerQuery等工具。

而可視化可以用Python的matplotlib包、R的各種包、PowerBI等。

報表製作上,PPT技能是最基礎的內容,PowerBI和Tableau等規模化報表工具,你值得擁有。

學習PowerBI內容,請關注本號,查看歷史文章,乾貨滿滿。

第5步:提升到大數據級別

當你開始處理海量規模的數據時,絕大多數的數據科學家要解決的問題,都無法在單機上完成,需要用分布式處理大數據集,使用的工具有Hadoop和Spark等。

第6步:多操作、多實踐,與數據科學家大牛多交流

實踐是檢驗真理的唯一標準。你學習了那麼多,一定要真正用在實踐中區創造價值,哪怕是學習了別人的知識,自己再輸出給其他人也行。

再就是遇到問題時,一定要請教大牛,其實他們都很樂於回答你的問題的。

第7步:實習、項目實戰、或者找一份工作

即便是學習了之後操練一下,你可能也就是有個大概的認識。但是一旦有項目或者工作需求,那麼你學習過程中的疏漏與不足全都會暴露出來,這時候別怕,一定要再查漏補缺,提升自己,你會發現自己進步非常快。

第8步:專業社區學習交流

數據分析的網站有:DataTau, Kdnuggets, fivethirtyeight, datascience101, r-bloggers。

可以看這些數據科學大牛的博客:Hilary Mason, David Smith, Nate Silver, dj patil。

在這些專業社區,看看別人都是遇到什麼樣的問題,如何解決的,甚至你可以思考如何解決這些問題,去幫助別人,在社區內積攢口碑,你也會成為大牛的。

相關焦點

  • 曹植究竟有多高的才氣,竟能七步成詩!
    然而有這麼一位他沒有身負戎裝開疆拓土也沒有飽讀詩書治國安邦卻另闢蹊徑吟詩作賦,在中華民族偉大的文學史上留下了濃墨重彩的一筆。他就是我們所熟知的可以七步成詩的曹植曹子建。關於曹植,有一個廣為人知的故事。說的是他的哥哥曹丕剛登帝位不久,就把他召來對他說:「你不是很有才華嗎?現在你必須在七步之內作一首詩,否則就要蹲監獄。」
  • 七步之才,曹子建才高八鬥
    七步之才的主人公-曹植 曹植(192-232),字子建,沛國譙(今安徽省亳州市)人。三國時期曹魏詩人、文學家,建安文學的代表人物。他是魏武帝曹操之子,魏文帝曹丕之弟,生前曾為陳王,去世後諡號「思」,因此又稱陳思王。
  • 肥東縣挖掘地名文化遺產 力促千年古鎮(古村落)名花有主
    近年來,肥東縣民政局緊緊圍繞民政部關於發布地名文化遺產鑑定行業標準,結合省民政廳、住房城鄉建設廳、旅遊局、文物局以及地方志辦公室下發的文件要求,全面推進千年古鎮、千年古村落地名文化遺產認定工作,店埠、梁園、撮鎮、古城、長臨河、元疃千年古鎮和龍城千年古村落先後成為一批代表肥東縣地名文化遺產的標誌性所在。
  • IBM Data Science Experience - 數據科學家實驗室
    不論是1997年IBM深藍在西洋棋戰勝卡斯帕羅夫,還是2016年阿法狗在圍棋比賽戰勝李世石;亦或無人駕駛與沃森醫生治療癌症,人工智慧成為熱門討論的話題。這背後的技術離不開一個重要的角色-數據科學家。對於數據科學家需要的海量計算能力、計算工具等基礎設施,IBM通過搭建數據科學家實驗室Data Science Experience來實現。(我們在以前的文章中詳細介紹過其它三種角色:業務分析師、數據工程師和應用開發員使用的工具,這裡不再贅述)
  • 世態炎涼亦無悔,只道兄弟有長情——純淨的詩人曹子建
    曹丕剛一接班,親兄弟曹彰又來作亂,曹植不幸被裹挾其中,讓本就猜忌自己的兄長更為狐疑,這才有了曹丕逼親兄弟七步成詩的故事。然而,和後來很多君主為了自己的地位穩固而殺害親兄弟不一樣,曹丕只是圈禁了兩位兄弟,並未殺他。這當然有他們共同母親卞夫人努力的原因,但是曹丕能如此行事也是頗為不易,說句顧念兄弟之情也不為過。
  • 曹植七步成詩?NO!只需要3步!
    – Coco Chanel, Fashion Designer曹植七步成詩的故事盡人皆知,史上還有更加才思敏捷的五步成詩(史青)和三步成詩(柳公權、寇準)。咱就說說這北宋名臣寇準三步成詩吧。寇準自幼聰穎過人,一日其父宴客,席間客人提議:「聞令郎善詩,何不即席吟哦一首以助酒興?」寇父也不推辭,客人便以《華山》為題讓小寇準做詩。
  • 三曹:曹子建歌唱遊俠縱橫,白馬篇嘆服才高八鬥!
    這一風格,在魏晉時期被「文人詩人」們繼承並發展,成為後世中國詩壇的主流,這才有了「杜甫」「陸遊」「龔自珍」等的成就,他們都是「建安風骨」的傾慕者和效法者。 這七個人被並稱,就出自「三曹」中的魏文帝曹丕,他的文學理論著作《典論·論文》中,第一次提到這七人:「今之文人,魯國孔融文舉,廣陵陳琳孔璋,山陽王粲仲宣,北海徐幹偉長,陳留阮瑀元瑜,汝南應瑒德璉,東平劉楨公幹。斯七子者,於學無所遺,於辭無所假,鹹以自騁驥騄於千裡,仰齊足而並馳」。
  • 七步成詩
    【成語】:七步成詩【拼音】:qī bù chéng shī【解釋】:走七步就能作出一首詩。比喻人才思敏捷。魏文帝聽了深有慚愧之色。【近義詞】:七步之才 七步奇才 五步成詩 七步成章【反義詞】:江郎才盡【例句】:他被這美麗的景色驚呆了,不由得詩興大發,不一會就成詩一首,頗有幾分曹植七步成詩的意思。【成語故事】:    三國時期,北方的的曹操有數個兒子,其中數曹植最為聰明,滿腹才華。在曹操去世後,他的兒子曹丕稱帝,建立魏國,史稱魏文帝。
  • 古有和氏璧 今有寸家玉
    古有和氏璧,今有寸家玉。   在中國,「古有和氏璧,今有寸家玉」的說法流傳已久。   「古有和氏璧,今有寸家玉」的說法是怎麼來的呢?   自明朝開始,雲南騰衝人尋玉、識玉、琢玉、售玉,前赴後繼,逐步形成了一套獨特、完整的翡翠文化。騰衝翡翠因深厚的文化積澱有了靈魂,湧現出寸尊福等多位「翡翠大王」,寸家玉也作為美玉名玉名傳四海,「福盛隆」等主要經營翡翠的外貿商號記載著騰衝翡翠歷來的輝煌。   著名翡翠大王寸尊福對翡翠有過人眼力。
  • 《三國演義》作者羅貫中「七步成詩」的典故是在罵世人都是傻子
    所以小編始終想不通一個問題,那就是作為哥哥的曹丕,有什麼理由,有什麼動機,非要除掉自己的親弟弟曹植呢?圖片來自網絡《三國演義》作者羅貫中說曹丕要殺曹植,就找個藉口,令曹植走7步後,必須作一首詩出來。要是曹植做不出詩來的話,曹丕就要殺掉曹植了!
  • 什麼是full stack data scientist?兼談Online VS offline data analysis
    在這個文章裡,我結合著兩類數據分析,深入談一下數據科學家工作內容。數據分析可以分為兩類:離線(Offline)分析和在線(online)分析。什麼叫離線分析?就是數據取下來以後,你分析的結果作為報告之類的形式,給人看,人來做出決定,然後去改產品。
  • 數據科學入門前需要知道的10件事
    大數據文摘出品來源:towardsdatascience編譯:zeroInfinity、白浩然、笪潔瓊剛剛加入數據科學的你,是否也有這樣的疑問?如何成為數據科學家?
  • Spark新年福音:一個用於大規模數據科學的API——DataFrame
    這個新的DataFrame API在R和Python data frame的設計靈感之上,專門為了數據科學應用設計,具有以下功能特性:從KB到PB級的數據量支持;多種數據格式和多種存儲系統支持;通過Spark SQL的Catalyst優化器進行先進的優化,生成代碼;通過Spark無縫集成所有大數據工具與基礎設施;為Python、Java、Scala和R語言(SparkR)API
  • 柳公權和曹植誰更有文才?柳公權是個怎樣的人?
    都說柳公權很有才,甚至不輸給奇才曹植,他真的有這麼厲害嗎? 唐武宗時期,柳公權就是靠著一首詩救了一個人的命。當時,皇宮內有一名女官惹得武宗不喜,武宗想殺掉她,但是又覺得有點小題大做,就對柳公權說:「朕很不喜歡這個人,如果學士你能寫一首詩送給朕,那朕就放過她。」
  • 數據科學家:21世紀最性感的職業
    比恩用他的「賽伯計量學」(Sabernetrics)對抗著整個棒球界的質疑,就如同伽利略用「太陽中心論」來挑戰天主教的權威一樣。最終,比恩帶著這支備受爭議的球隊拿到了美國聯盟西部賽的冠軍,還取得了20連勝的戰績。從那以後,統計分析家取代球探成為了棒球專家,並且很多其他球隊也開始用「賽伯計量學」來指導球隊運作。
  • 中國象棋馬擒單士(七步成詩)定式詳解
    既然是必勝,也就說明有定式,在這裡和大家一起分享一下:1. 馬擒單士要領一是已方帥佔中路(中路一定佔得到,臥槽馬,等一手棋,對方就得把中路讓開)我們就可以帥佔中路。2. 二路肋馬。通過控將位,等一手棋等手段,環環相扣,把士吃掉。最早我學棋時看到的定式是將、士、馬都在二路線上,所謂的「七步成詩」。
  • 比曹植還厲害的人,7歲便可三步成詩,太牛!
    曹植七步成詩,成為人們最熟悉的速成詩,其實歷史上還有更絕的「五步詩」和「三步詩」。如此速度、如此文採,不得不令人稱絕。
  • 古有哮天犬,今有哮天豬
    古有哮天犬,今有哮天豬 有沒有萌到你 1、一農夫明天準備殺雞,晚上餵雞時,對雞說:「快吃吧,這是你最後一頓!」第二日,農夫發現雞已倒地身亡。
  • 古有王羲之,今有王蘧常
    其章草書法藝術「博取古澤,冶之於章草之中,所作恢弘丕變,蔚為大觀」。日本書法界則更稱頌為「古有王羲之,今有王蘧常」,推崇備至。他於80歲後為泰山、禹廟、黃鶴樓所書的匾額,獲得千萬人讚賞。特別是為杭州嶽廟撰寫的抱柱長聯,人譽為「神州之冠」。
  • Science |你玩的遊戲數據對科學家大有用途
    為了收集更多關於我們的大腦是如何工作的,以及常見的心理健康狀況是如何產生的數據,倫敦大學學院的託比亞斯·豪瑟(Tobias Hauser)和他的同事發起了 "大腦探索者 "公民科學項目。這款遊戲讓你有機會調查每個星球上什麼類型的寶藏最多,通過觀察你收集信息的方式,間接測試你的果斷程度。