準備好進入數據科學領域了嗎?先問問自己這14個問題

2021-01-08 讀芯術

全文共3387字,預計學習時長9分鐘

圖源:unsplash

數據行業被認為是增長最快、價值數十億美元的行業之一。許多公司和組織正嘗試充分利用已有數據,確定仍需捕獲和存儲哪些數據。與此同時,數據科學家仍然迫切需要了解數字,挖掘針對棘手業務問題的可能解決方案。最近一項研究表明,2020年大多數高科技工作需要數據科學技能。

數據科學領域確實有很多令人興奮的機會。但在進入數據科學領域前,有必要看看以下問題,以評估數據科學是否真的適合你。

1.什麼是數據科學?

數據科學是一個廣闊的領域,包括幾個細分領域,如數據準備和探索、數據表示和轉換、數據可視化、預測分析、機器學習、深度學習、人工智慧等。數據科學能力可分為三個等級:1級(初級);2級(中級);和3級(高級)。

2.數據科學家的職責

數據科學家利用數據得出有意義、有見地的結論,從而推動機構或組織的決策過程。他們的工作職責包括數據收集、數據轉換、數據可視化和分析構建預測模型,提供行動建議,基於數據實施建議。數據科學家在不同的部門工作,如醫療保健、政府、工業、能源、學術界、技術、娛樂等。

一些僱傭數據科學家的頂級公司有亞馬遜、谷歌、微軟、Facebook(臉書)、LinkedIn(領英)、Twitter(推特)、Netflix(網飛)、IBM(國際商業機器股份有限公司)等。

3.數據科學家的職業前景

數據科學家的職業前景非常樂觀。IBM預測,到2020年,數據科學家的需求量將激增28%。最近使用LinkedIn求職工具進行的一項研究表明,2020年大部分的高科技工作需要具備數據科學技能,包括商業分析、機器學習和雲計算。

4.數據科學家的收入

數據科學家的收入取決於所在組織或公司、教育背景、經驗年限以及所擔任的特定職務。數據科學家的年薪在5萬美元至25萬美元之間,平均約為12萬美元。

5.如何為數據科學職業做準備

大多數數據科學或商業分析項目需要以下條件:

· 高水平的定量能力

· 解決問題的心態

· 編程能力

· 有效溝通的能力

· 團隊合作能力

6.應該重點關注哪些程式語言?

如果你對學習數據科學基礎感興趣,需要從某個地方開始。不要被數據科學家招聘廣告中提到的荒謬程式語言清單所嚇住。雖然學習儘可能多的數據科學工具很重要,但筆者建議從一種或兩種程式語言入手。

當你打下紮實基礎之後,就可以挑戰自己,學習能夠增強技能的不同程式語言、平臺或高效工具。筆者認為,Python和R兩種程式語言在數據科學運用中仍位居前列。我建議從Python開始,因為越來越多的學術訓練項目和行業將Python用作數據科學的默認語言。

7.成為數據科學家要多長時間

如果你有紮實的分析學科背景知識,如物理、數學、工程、計算機科學、經濟學或統計學,基本上可以自學數據科學的基礎知識。你可以從edX、Coursera或DataCamp等平臺上學習免費的在線課程。

6到12個月內可達到初級水平,7 -18個月內可達到中級水平,18- 48個月內可達到高級水平。達到一定水平所需的時間取決於教育背景以及願意在數據科學研究上投入的時間。通常,具有分析學科背景的人,如物理、數學、科學、工程、會計或計算機科學,需要的時間比不具有數據科學背景的人要少。

8.當項目遇到瓶頸,我是否有耐心可以堅持下去

圖源:unsplash

數據科學項目周期可能會很漫長,且要求很高。從問題框架到模型構建和應用,整個過程可能需要數周甚至數月,具體時間取決於問題的規模。作為一名實踐數據科學家,不可避免地會碰到項目瓶頸。耐心、堅韌和毅力是成功開展數據科學事業必不可少的關鍵素質。

9.我是否具有一定的商業頭腦,可以從一個模型中得出有意義的結論,為組織帶來重要的數據驅動型決策?

數據科學是非常實用的領域,謹記,你可能非常擅長處理數據以及構建良好的機器學習算法,但作為數據科學家,實際應用至關重要。每個預測模型都必須產生在現實情況下有意義且可解釋的結果。必須針對現實對預測模型進行驗證,才意義重大。

數據科學家的角色是從數據中提取有意義的見解,這些見解可用於以數據為依據的決策,從而提高公司效率,或改進業務開展方式,或幫助增加利潤。

10.我有良好的溝通能力嗎?

數據科學家需要能夠跟團隊的其他成員或組織中的業務主管交流想法。良好的溝通能力將起到關鍵作用,以便能夠向很少或根本不了解數據科學技術概念的人們傳達和展示技術性強的信息。良好的溝通能力將有助於與其他團隊成員,例如數據分析師、數據工程師、現場工程師等營造團結協作的氛圍。

圖源:unsplash

11.我是一名終身學習者嗎?

數據科學是一個不斷發展的領域,因此請準備好接受和學習新技術。與該領域的發展齊頭並進的一種方法是與其他數據科學家建立網絡。某些可以建立這種網絡的平臺包括LinkedIn、GitHub和medium(TowardsData Science和Towards AI出版物)。這些平臺對於獲取有關該領域最新動態的信息大有裨益。

12.我能成為團隊的一員嗎?

數據科學家將在數據分析師、工程師、主管的團隊中工作,因此你需要良好的溝通技巧,此外也需要成為一名好的傾聽者,尤其是在項目開發的早期階段,你需要依靠工程師或其他人員來設計和構築一個好的數據科學項目。

成為一名好的團隊合作者有助於你在商業環境中得心應手,並與團隊中的其他成員以及組織的主管或董事保持良好的關係。

13.我遵守道德規範嗎?

數據科學必須考慮道德和隱私。你需要了解項目的含義,對自己誠實,避免操縱數據或使用有意產生偏差的方法。從數據收集、分析到模型構建、測試和應用的所有階段,都要遵守道德規範。避免出於誤導或操縱觀眾的目的捏造結果。解釋數據科學項目的發現時要遵守道德規範。

14.有哪些資源可供學習數據科學?

如果情況允許,可以攻讀數據科學或商業分析碩士學位。如果負擔不起碩士學位課程,則可以自學數據科學。通常,如果具有諸如物理學、數學、經濟學、工程學或計算機科學等分析學科的紮實背景,並且對探索數據科學領域感興趣,那麼最好的方法是從大規模開放式在線課程開始。

在建立堅實的基礎後,你可能會尋求其他方法來增加知識和專業技能,如可以從教科書中學習,從事項目以及與其他數據科學領域的有志者建立聯繫。

以下推薦的MOOC和教科書可助你掌握數據科學的基礎知識。

· 推薦的MOOC:

數據科學專業證書(哈佛edX):https://www.edx.org/professional-certificate/harvardx-data-science

分析:基本工具和方法(喬治亞理工學院edX):https://www.edx.org/micromasters/analytics-essential-tools-methods

使用Python應用數據科學(密西根大學 Coursera):https://www.coursera.org/specializations/data-science-python

· 推薦書籍:

本書作者以一種易於理解的方式解釋了機器學習中的基本概念,另外還介紹了代碼,你可以使用提供的代碼來練習和構建自己的模型。這本書對我作為數據科學家的旅程幫助很大。

還有許多其他出色的數據科學教科書,例如Wes McKinney的《利用Python進行數據分析》、Kuhn&Johnson的《應用預測建模》、Ian H. Witten、Eibe Frank和Mark A. Hall的《數據挖掘:實用機器學習工具和技術》等等。

每個人背景不同,數據科學的旅程也因人而異。但開始旅程之前,先問問自己這14個問題,會讓你的職業生涯更加清晰。

留言點讚關注

我們一起分享AI學習與發展的乾貨

如轉載,請後臺留言,遵守轉載規範

相關焦點

  • 14個超有趣的數據科學項目,數據集都準備好了!
    對於對數據,數據分析或數據科學感興趣的人,我們提供了一份可以利用業餘時間完成的數據科學項目清單,一共14個! 這是一個有趣的項目,可以利用Plotly或Matplotlib數據可視化工具來可視化野火的規模和對地理的影響。
  • 想成為數據科學家?你得先讀讀這篇文章
    ,我還想在這裡加上我本人的「Priestly推論」:「(數據科學家是)擅長對數據分析結果進行商業解釋的科學家與擅長數據分析的MBA的混合體」。Q:統計學家和數據科學家之間的區別是什麼?A:這是個好問題。我也經常被問到計算機科學家和數據科學家之間的區別是什麼。事實上這兩個學科也都在探索隱藏在數據中的新內涵。
  • 「工場故事NO.056」先問問上一個產品經理是怎麼走的!
    小六倒是很自覺,一來就開始準備自己的東西搬去研發一部。臨行前,我們都為他送行,總覺得小六大概是「壯士一去兮……」因為我們聽說,小六之前的那個產品經理是被研發一部的程式設計師群毆之後,被人橫著抬出來的。「這是項目資料,你看看就好,發言前先問問上一個產品經理是怎麼走的!」跟小六說話的這位就是研發一部的部長斌哥。小六低頭看了看遞過來的項目資料:《企業ERP管理平臺開發項目計劃書》。
  • 把自己變成機器人,你準備好了?
    但Lipson在一次研究中發現被設計跟蹤貓狗圖像的深度學習程序在經過一些訓練後,突然開始自發的追蹤人臉。這個發現讓他毛骨悚然,他意識到經過特別設計的機器系統會自己學習,不斷進步,所以它們非常有可能突破人類預先為它們設定的規則,產生自我意識,人類將無法掌控它具體能學到什麼。
  • 加拿大留學|數據科學碩士畢業馬上就業?心動了嗎?
    若問當前全球最火熱的科技類行業工作有哪些,「數據分析」和「人工智慧」一定會是大家公認的最火熱。在加拿大,數據類和人工智慧專業的學生基本都是畢業即就業,而且薪資非常具有競爭力。話不多說,今天我們就趕緊來see see加拿大的數據專業是什麼樣子。本文是一篇超乾貨的信息文,準備好收藏哦~為什麼數據如此火爆?
  • 視覺難題:你能找到這張圖片中的所有科學錯誤嗎?
    1928年9月,美國科學與發明雜誌(科學與發明)的寫作為讀者提供了雜誌封面上的所有科學錯誤。為糾正這48個錯誤,他們甚至提供了500美元的獎金。不過,我們不能為解決今天我們準備的這個視覺難題提供獎勵,但我們確實給了你一個感覺像一個真正的科學家的機會。這道謎題已有90年了。
  • 這個生物醫藥AI應用靠譜嗎?先回答矽谷頂尖風投六個問題
    無論是生物醫藥領域從業者、領導者,還是相關投資人與運營商,大家都面臨一個共同問題——如何評估一項AI新技術,是否值得大家投入時間、精力與金錢?這是一個非常重要的問題。這篇文章中,我們會分享自己如何評估一項AI生物技術、需要遵循的原則以及常見陷阱。一你真的需要AI來解決問題嗎?
  • 不要再盲目申請英國留學,先弄明白這20個問題!
    原標題:不要再盲目申請英國留學,先弄明白這20個問題! 隨著出國留學意識的逐漸普遍化,越來越多的家庭都希望自己的孩子能到英國名校,進行留學深造。但在不斷高漲的留學費用、頻頻爆發的留學安全事故,一些家長們開始焦慮起來,「送孩子出國留學,真的好嗎?」
  • MPAcc複試除了準備專業課,還要注意這幾個方面!
    14.複試有必要帶四六級證書嗎?有必要,因為四六級等相關證書可以在複試中加分,但每個學校比例不一樣,有的學校比較少,而有的院校這部分的比例比較大。15.初試準考證丟了怎麼辦?最好不要帶,提前準備好交流的內容以及周全的禮儀更顯的有誠意。29.有工作經驗的往屆考生,對於問題理解能力強,導師面試時會有偏向嗎?往屆生相對來說專業基礎不夠深厚,但是擁有豐富的社會經驗,能夠更好地理解社會中存在的一些問題。
  • 基因科學:數據共享和跨領域合作是趨勢
    通過這些學習和數據分析,以及生物醫學的集成,這樣的話我們會形成一個非常好的閉環的研究,能夠給我們帶來非常好的一個模型。但是現在,我們還不能說我們已經了解到了生物學的邊界,任重而道遠。也就是說現在這個生物學家。主持人:還有更多的要做,是嗎?
  • 數據科學入門前需要知道的10件事
    如何在項目中應用數據科學?確定在你的項目中如何應用數據科學很重要。您要回答的一些問題包括:您將進行深度數據分析嗎?您是否將開發回歸/分類/聚類模型?您會要開發聊天機器人嗎您是否要開發推薦系統。你可以先休息一下,然後再重新嘗試解決問題。有時候,你的思維會因為一時的阻塞而變得遲鈍,因此,稍作休息可能有助於讓思維煥發活力。如果你有一個精通代碼的朋友,那麼當你卡在某個代碼中的bug上的時候,就去問問他。如果沒有,請直接搜索「Stack Overflow」(如果上面有類似問題的答案)。如果沒有,那就自己在上面提問!
  • 考研複試了解這100道問題,現在準備還來的及
    所謂差額複試,舉個例子:一個專業需要招收10名研究生,差額比例如果是1:1.2,那麼將會有12個考生進入複試。所以如果一位考生過了國家線或者院校線,但排名沒有進入前12名,還是沒有參加複試的資格。因此不是過線就能參加複試,考生還需要結合複試比例、排名等情況進行綜合分析,不要一味只關注是否過線。 3.
  • 數據科學入門前需要知道的10件事
    Patil撰寫的哈弗商業評論文章《數據科學:21世紀最迷人的工作》而流行起來。什麼是數據科學簡而言之,數據科學是一門實質上用數據來解決問題,並且能夠給公司和團體帶來影響力,價值和洞察力的科學,應用在廣泛的學術領域和行業中,包括但不限於教育,經濟,健康,地質,零售,旅遊和電子競技。
  • 您最關心的20個留學問題都在這
    如果英文基礎好,在取得雅思6分的基礎上,可以進入碩士課程;如果需要先進行英文的強化學習,那麼也可以參加大學準備的英語強化課程班(EEP課程),進而轉入後期的碩士課程。另外,大學的留學生服務中心,也會提供輔助的英文強化課程,可以更好的幫助留學生和家長提高英文書寫和口語表達的能力,進而更從容的進修碩士專業課程。通常EEP課程需要3-9個月的時間不等,具體要評估測試後方可知曉。
  • 每次讀書前,先問自己這三個問題,就不會擔心讀完沒收穫
    每次讀書的時候可以問自己三個問題:讀什麼書?為什麼要讀這本書?該怎麼讀?第一問:讀什麼書?第一,讀自己喜歡的書,這本書如果你是真的發自內心喜歡,你不用管他有什麼用,能讓你喜歡開心,你就去讀,你會發現你自然而然能記住。比如各類名著、小說、網文、詩歌、心靈雞湯,只要你喜歡就可以。
  • 【中國科學報】輻射防護領域的科學大家
    中國輻射防護科研領域主要開拓者和奠基人之一,中國輻射探測技術的主要開拓者之一。國際原子能機構、聯合國原子輻射效應科學委員會委員,曾連續三屆擔任國際放射防護委員會主委會委員。  作為中國核工業先行者之一,李德平的科研工作有著時代的召喚,又有著國家需要有所擔當的情懷,最終成為輻射防護領域的科學大家。
  • 您應該不惜一切代價避免的11個數據科學神話
    fast.ai聯合創始人傑裡米·霍華德(Jeremy Howard)最受歡迎的「應用人工智慧」書的作者Mariya YaoCrowdAI聯合創始人Devaki Raj那麼您認為自己扮演什麼角色?在您進入數據科學之前,這是一個至關重要的問題。
  • 追本溯源:數據科學真的有那麼重要嗎?
    這個定義看起來很寬泛,因為數據科學確實是一個包含很多內容的領域。通常提到數據科學,人們就會想到「大數據」,甚至有些人認為兩者是等同的。然而,「大數據」只是數據科學的一方面,該領域還包括很多其他部分。確切地說,數據科學是一個跨學科領域——結合了計算機科學、數學、統計學和許多其他領域的內容。
  • 解決這22個問題,讓你快速拿下四大offer!
    然後準備兩分鐘的自我介紹,準備一份中文版,一份英文版。中文版就是突出自己的特點,突出你的實習經歷,好的成績。開始的時候謝謝上一位同學,結束的時候有請下一位同學。面試的時候題目差不多,都是解決商業問題。跟內容沒有關係,主要是想考察你的商業邏輯,和團隊協作能力,更重要的是團隊協作能力。不用太認真準備,要提前看看一些模型。
  • 大數據項目的成功展開少不了這六個要素
    任何事情提前做好準備永遠錯不了,比如在企業項目之前提前準備好有用的企業數據,以便於更好地為客戶提供服務。但是,企業項目失敗的原因就一定是因為少了「未雨綢繆」的智慧嗎?也不盡然,對企業來說,擁有大數據準備策略和方法並如實執行是至關重要的。