IBM 招聘數據科學家,看重的是哪些技能和特質?

2020-12-13 36氪

編者按:求職者有時會問 IBM 如何定義「數據科學家」這一職位。這是一個重要的問題,因為市場需要越來越多的數據科學家,IBM 分析師Seth Dobrin 在本文中詳細定義了 IBM 眼中的數據科學家。

第一步是區分真正的數據科學家和從事相關工作的其他專業人員(例如數據工程師,業務分析師和 A I應用開發人員)。為了做這個區分,我們首先定義數據科學的含義。

數據科學的核心是運用科學的方法來解決商業問題。

你可以進一步擴展定義,使用人工智慧來解決這些業務問題,進行預測,並優化流程。

根據定義,要實現數據科學的真正潛力,我們需要具有非常特殊的經驗和技能的數據科學家,具體來說,我們需要具備運行和完成數據科學項目所需經驗和技能的人員:

1、接受過科學訓練,有相關學位

2、具備機器學習和統計方面的專業知識,重點在於決策優化

3、擁有 R,Python 或 Scala 的專業知識

4、能夠轉換和管理大型數據集

5、有能力將上述技能應用於現實世界的商業問題

6、能夠評估模型的性能並進行相應地調整

1、接受科學訓練,有相關學位

這不是關於學位本身,而是關於你在獲得高等學位時學到的東西。 簡而言之,學習科學的方法,能夠從複雜而抽象的問題開始,將其分解成一系列可驗證的假設,你設計實驗來測試你的假設,以及你如何分析結果以確定假設是否被證實或證偽。你也可以在學術界之外學習這些技能,甚至通過在線培訓,所以學位這一點具有一定的靈活性,但應用科學方法的直接經驗是必須的。

擁有高等學位的另一個優點是同行評審過程和發表論文要求的嚴格性。為了獲得發表,候選人必須以允許其他人審閱和作品。還必須提供證據表明結果是有效的,方法是正確的。 這樣做需要深刻理解概率和確定性因素之間的差異以及相關性的價值。

2、機器學習和統計方面的專業知識,重點在於決策優化

將科學方法應用於商業問題,可以讓我們預測未來會發生什麼,從而做出更好的決策。這種預測是人工智慧的產物,更具體地說是機器學習。 對於一個真正的數據科學家來說,機器學習和統計的核心技術技能必須的。

3、R,Python 或 Scala 的專業知識

作為一名數據科學家,並不要求你像專業開發人員一樣精通編程,但是創建和運行支持數據科學過程的代碼的能力是必須的,包括能夠統一使用統計和機器學習中流行的數據科學語言。

4、能夠轉換和管理大型數據集

第四種技能也就是大數據能力。使用 Apache Spark 等分布式數據處理框架的能力是關鍵。 真正的數據科學家知道如何在數據科學團隊的幫助下,從多個來源和多種數據類型中提取數據集。數據本身可能是存在於多個雲中的結構化、半結構化和非結構化數據的組合。

5、有能力將上述技能應用於現實世界的商業問題

第五種技能是一種軟技能。 這是與非數據科學家進行交流的能力,以確保數據科學團隊獲得所需的數據資源,並將數據科學應用於正確的業務問題。 掌握這一技能還意味著確保數據科學項目的結果,例如關於業務可能發展的預測得到商業人士的充分理解和操作。這需要良好的講故事技巧,尤其是將數學概念映射到常識的能力。

6、能夠評估模型的性能並進行相應地調整

對於一些人來說,第六個技能是第二個技能的一個方面:機器學習的專長。 我想要分開描述,因為這一點經常是一個好的數據科學家和壞的數據科學家的區別。 缺乏這種技能的數據科學家經常輕易相信已經創建並部署了有效的模型,而事實上他們的模型與訓練數據並不匹配。

做一個真正的數據科學家

如果你想成為一個真正的數據科學家,而不是一個沒有有抱負的數據科學家或只個數據科學家頭銜,我鼓勵你掌握全部這六個能力。 數據科學家與業務分析師或數據分析師從根本上不同,業務分析師或數據分析師經常擔任數據科學團隊的產品所有者,擔任向數據科學家提供專業知識的重要角色。

這並不是說業務分析師、數據分析師和其他人不能轉型為真正的數據科學家,但要明白,這需要時間,堅持,指導,並一次又一次地將自己應用於真實的困難問題。

原文連結:https://venturebeat.com/2017/11/30/what-ibm-looks-for-in-a-data-scientist/

編譯組出品。編輯:郝鵬程

相關焦點

  • 精英數據科學家應該具備這些能力和特質
    那麼,成為數據科學家需要具備哪些條件呢?下面就是我們根據IT領導者、行業分析師、數據科學家的看法,總結出的一些重要屬性和技能。這項技能比其他任何因素都更多地決定著數據科學家能否取得成功。」  數據科學家需要有經驗,但也要能夠摒棄先見,Zeta Global公司首席信息官Jeffry Nimeroff補充說。  Nimeroff說:「這種特質是要知道在任何領域工作都能有所期待,但也知道經驗和直覺是不完美的。有經驗是件好事,如果我們過於自滿,那風險也是存在的。這就是摒棄先見的重要性所在。」
  • 求職|一份理想的數據科學家簡歷中要包括哪些技能?
    在本文中,我們對Indeed中一千份數據科學相關的招聘信息進行了分析,主要針對數據工程師、數據科學家和機器學習工程師這三個職位,希望能解答你的疑問。首先,讓我們來看看不同職位的技能要求。六、可視化工具Tableau是可視化方面的必備技能在招聘中,數據科學家大多都要求需要掌握可視化工具,而很少要求數據工程師和機器學習工程師掌握。
  • 業界| 數據科學家最需要什麼技能?
    數據科學家需要涉獵很多——機器學習、計算機科學、統計學、數學、數據可視化、通信和深度學習。這些領域中有幾十種語言、框架和技術可供數據科學家學習。那麼要想成為僱主需要的數據科學家,他們應該如何安排學習內容呢?
  • 分析了1000多個崗位,2020年公司最希望數據科學家掌握的技能是?
    然而在印度最大的招聘網站上很少有我想找的工作——點開其中一個招聘崗位,他們的招聘要求我聞所未聞,這讓我感到非常驚訝。除了必須掌握數據分析、機器學習和深度學習這些技能之外,一些ETL工具和大數據技術也成了必備技能。這未嘗不可,現在每個公司都有自己對數據科學家的獨特定義,並會根據這一定義招聘人員。
  • 數據科學家超級明星必備的12個技能
    令人驚訝的是,我收到了來自不同行業的許多頂級數據科學家的回應,都分享了他們非常有趣且實用的想法和建議。 為了進一步了解優秀數據科學家和頂級數據科學家之間的主要區別,我一直在網際網路上搜索……直到在KDnuggets上看到本文。 因此,我總結了所有信息並列出了成為頂級數據科學家的必備技能。
  • 報告稱,職場中僱主最看重三項加分技能
    報告揭示了職場人應對失業焦慮的核心技能,指出僱主最看重的加分技能為溝通協作、心理抗壓及數據處理。報告中表示,受新冠肺炎疫情影響,眾多企業進行了人員精簡與組織重構。調查數據顯示:疫情期間,57.7%的企業提高了人才招聘標準,企業招聘更加精準務實,僱主更加看重應聘者的「性價比」,力求以同等薪酬尋找到更具價值的人才。
  • IBM推出新認證計劃,解決數據科學家人才緊缺問題
    首先,IBM與The Open Group今日宣布推出一項史無前例的數據科學家認證計劃,旨在為不同規模的組織和個人提供能力實踐評估和數據科學技能驗證。The Open Group是一家制定開放的、廠商中立的技術標準並提供認證的國際機構。
  • 2018年僱主最青睞哪些數據科學技能
    編者按:Jeff Hale搜集了各大招聘網站的信息,分析了最搶手的數據科學家該具備哪些技能。
  • 銳眼洞察|2018年,成為數據科學家需要哪些技能?(翻譯)
    數據科學家最必要的技能是什麼?以下是數據科學家簡歷中最常見的技能:R和Python是數據科學領域的主流程式語言。53%的數據科學家聲稱掌握R以及/或Python。注意,在某些數據科學家在工作中同時掌握這兩種語言。
  • 數據科學家VS數據工程師,真的是一山不容二虎?
    而數據科學家需要利用統計,數學和機器學習從而構建預測模型。 數據科學家需掌握分布式計算,因為他需要獲取被數據工程師處理過的數據,同時數據科學家還需向企業溝通,這就意味著語言表達和數據可視化的技能也是必不可少的。
  • 數據科學家的八大關鍵技能
    那麼,成為真正的數據學家(DS)需要具備怎樣的技能呢?1. 統計學知識:這不僅僅是了解統計數據而已,還要了解模型和方法論,以及如何最好地運用它們。一個統計學家,需要具有出色的分析能力,掌握豐富的數據分析工具,比如R,Python等。2.
  • 數據科學家含金量最高的5個數據科學認證,先馬後看!
    作者擁有南方衛理公會大學數據科學教育理學碩士學位,儘管這是通過線上獲得的,但沒有哪個僱主認為它會比普通的碩士要低級。同樣,當他在面試時拿出數據科學證書和其他通過非傳統教育形式(如網課)獲得的證書時,幾位招聘經理也十分喜歡,並且給他們留下了深刻的印象。除了具有不同形式的學習經驗,他還具備數據科學家的專業經驗,而這正是僱主們所期待的。
  • 數據科學技能中,哪些是核心技能,哪些是熱門/新興技能?
    最新的 KDnuggets 投票調查問了如下兩個問題: 你目前擁有哪些技能 / 知識領域(在工作或研究中可以使用的水平)?你想增加或提高哪些技能?我們根據 KDnuggets 之前的一些文章和投票調查,選出了 30 項技能。
  • 2020數據分析崗位報告:數據分析師需要哪些能力?
    字幕組雙語原文:2020數據分析崗位報告:數據分析師需要哪些能力?這是有道理的,因為數據科學家的工作涉及關鍵的決策技能,而這些技能是隨著經驗而來的。2年以上工作經驗的候選人將有相當好的機會。這並不意味著新生不能進入,只是有經驗的候選人比新生有更多的空缺。公司通常不會從這些招聘網站上招聘新人,而是直接從校園招聘中招聘。
  • 分析1400家公司後發現:數據工程師比數據科學家更受歡迎
    在交流的過程中我逐漸產生了一個巨大的疑惑,就是到底什麼技能才能給我們的從業者"鍍金"?哪些技能會讓我們的學員在愈來愈多的相關從業者中脫穎而出,從而為自己步入職場做好重要的準備。那到底需要哪些職業數據科學相關的技能呢?我覺得只要和以下關鍵詞沾邊即可:機器學習建模,可視化,數據清洗和處理(即SQL爭用),工程和生產部署。那作為一個初次接觸數據科學的小白同學來說,有什麼入門的學習課程和學習路徑推薦嗎?
  • IBM 上海 Intern 職位來襲~
    ~~~~~~~~~~~~~~~~~~~~~~~薪酬數據分析錄入員【投遞郵箱】jiaydai@cn.ibm.com【實習具體時間】2015年1月到7月【實習期長度】3-6個月【每周實習時間】至少三天【實習地點】上海張江【招聘人數】
  • 數據科學業界課程之IBM大數據大學和微軟MPD數據科學認證(均為在線教育方式提供)
    不過,為了方便學習者,「課程資料獲取、免費註冊」,「學習者自定步調學習」模式,是IBM及其公開課事業解決接受教育者資金和時間阻礙的兩個策略。IBM另一個創新是關注被教授技能的應用——學生們都可以下載開源大數據工作檯工具套裝——數據科學家集成工作檯(DataScientistWorkbench.cn)平臺練習其所學大數據課程,並獲得很多現實中有待解決的實際問題用以研究訓練。
  • 圖解:數據科學家、數據工程師和軟體工程師之間的區別
    對於新手,也可以通過這張圖來看典型的「數據科學家」、「數據工程師」和「軟體工程師」都要掌握哪些工具。Jake Stein:隨著數據的爆炸式增長,對數據處理的專家技能需求也隨之井噴。這帶來的結果之一,是更精細的分工。對於數據管理工作的核心角色:數據科學家、數據工程師和軟體工程師,過去幾年見證了他們越來越清晰的定位。
  • 數據科學家讀書會——從零開始學習大數據資料庫之MySQL
    LIVE #1:  5/16 學員乾貨分享:數據科學行業offer求職經歷在求職中經常會有這樣的疑問,學歷,技術,經驗和項目,到底哪一樣才是應該重點準備的,HR到底會看重哪一塊?我的背景投遞什麼樣的崗位成功機率比較大?
  • 數據科學家的爭奪及美分析學專業研究生院的建立
    對數字羅列所組成的數據中所包含的意義進行分析,開發Web原型,使用外部API將圖表、地圖、Dashboard等其他服務統一起來,從而使分析結果可視化,這是對於數據科學家來說十分重要的技能之一。作為參考,下面節選了Facebook和Twitter的數據科學家招聘啟事。對於現實中的企業需要怎樣的技能,應該可以為大家提供一些更實際的體會。