不及美國同行1/3,中國數據科學家平均年薪約3萬美元

2020-12-16 DeepTech深科技

(《麻省理工科技評論》中英文版APP現已上線,年度訂閱用戶每周直播科技英語講堂,還有科技英語學習社區哦~)

網際網路創業方興未艾,人工智慧的浪潮又接踵而來,而貫穿其中的數據科學則在這更迭交替中顯得愈發重要。近日,全球最大的數據平臺 Kaggle 向約 16000 名數據科學領域的從業者發放了調查問卷,就薪資水平、人員構成和使用工具等行業問題進行了詳細的歸納和總結,最後以報告的形式分享給大家。對數據科學感興趣或有志於進入這一行業的朋友可以從中一探究竟。

數據科學從業者畫像

年齡:平均年齡為 30 歲,但國家間略有不同,例如印度的平均年齡就比澳大利亞年輕了9歲,而中國受訪者的平均年齡為 25 歲。

工作狀態:受訪者中有全職工作的佔 65.7%,正在找工作的佔 12.7%。而在中國,這兩個數字分別為 53.5% 和 17%。

職位:數據科學領域的工作劃分非常繁雜,比如在伊朗和馬來西亞,最普遍的頭銜是「科學家」或「研究員」,而在中國,最流行的頭銜則是「機器學習工程師」。

年薪:全球數據科學從業者的平均年薪是 55441 美元,美國的數據科學從業者平均薪資最高,達 11 萬美元,而這一數字在中國只有 29835 美元(或許和樣本數量較少有關)。

學歷:數據科學從業者中比例最高的是碩士,但博士的薪水顯然更高。

數據科學從業者工作內容

數據科學方法使用:邏輯回歸是數據科學從業者在工作之中最常用的數據科學方法,但在軍事和國家安全領域,使用更多的則是神經網絡。

語言使用:Python 依舊是數據科學家最常用的語言,而 R 語言也很流行。

數據類型:關係型數據是開發者在工作中最常用的數據類型,而在學術研究和國防安全領域,文本型數據使用的更多。

代碼分享:58.4% 的受訪者在工作中使用 Git 分享他們的代碼。但大公司中的開發者更傾向於使用電子郵件來分享他們的代碼,而創業公司則對雲的方式情有獨鍾。

工作障礙:髒數據(dirty data)顯然又名列榜首。通俗的講,當一個事務正在訪問數據,並且對數據進行了修改,而這種修改還沒有提交到資料庫中,這時,另外一個事務也訪問這個數據,然後使用了這個數據。因為這個數據是還沒有提交的數據,那麼另外一個事務讀到的這個數據是髒數據,依據髒數據所做的操作可能是不正確的。

數據科學新手入行

語言選擇:數據顯示 Python 和 R 語言依舊是推薦程度最高的兩種語言,而 Python 的受追捧程度又是 R 語言的兩倍之高。

學習資源:數據科學是一個快速變化的領域,不斷的學習已經成為了一種必需的技能,而目前行業內的人會更多通過 Stack Overflow Q&A,Conferences 和 Podcasts 來進行學習。除此以外,官方的文檔和觀看 Youtube 視頻也不失為有效地學習途徑。

開源數據獲取:dataset aggregators、https://www.kaggle.com/datasets

找工作:首選方法是直接聯繫招聘者或建立自己的人脈網絡

報告下載:https://www.kaggle.com/surveys/2017

調查數據下載:https://www.kaggle.com/kaggle/kaggle-survey-2017

作為一個集合社群、競賽、用數據解決問題三個核心於一身的平臺,不論是企業、某個領域的研究組織、甚至是政府機構,都可以把數據集(dataset)跟想要解決的問題丟到 Kaggle 上去,請數據專家來幫忙解答。

從另一個角度來看,Kaggle 上聚集了眾多對機器學習、人工智慧有興趣的人,包括數據科學家、統計高手、工程師或者是學生,他們利用數據採礦、深度學習、統計等方式搭建出解答問題的模型或算法,勝出者就有機會獲得禮品、獎金或是工作機會,當然也有不少參加比賽的人是純粹出自興趣。

例如,全球最大衛星影像公司 Planet,主要是透過衛星影像監控亞馬遜雨林的變化,但他們發現還是有些問題無解,例如無法分辨雨林的減少是人為造成還是自然因素,所以在 Kaggle 上舉辦比賽,希望可以有更好的算法來保護亞馬遜雨林,吸引了不少關注生態議題的人參與。

正因為 Kaggle 上高手雲集,吸引不少大型企業、機構都到此舉辦比賽,比如Google、Facebook、Airbnb、沃爾瑪、Benz、Bosch、英特爾、西班牙國際銀行(Santander)、歐洲量子物理研究所(CERN)等,而且獎金額度更已有突破百萬美元等級的案例。

圖丨Kaggle上獎金排名前五的競賽

Kaggle 創始人 Anthony Goldbloom 在澳洲墨爾本大學畢業後,曾經在《經濟學人》雜誌當過實習記者,之後進入澳洲聯邦政府財政部(Australian Treasury)、澳洲儲備銀行(RBA)擔任經濟計量學家。當時他就預見數據科學將在未來扮演重要的角色,就在澳洲曾建立了一個數據科學家的線上社群。但他心想,為何不把數據開放,讓大家通過比賽的方式找到最好的算法?

圖丨Kaggle 創始人 Anthony Goldbloom

所以,他把公司搬到矽谷從而創立了 Kaggle,依靠社群成功累積了龐大的用戶, Goldbloom 在接受澳洲媒體採訪時表示,「Kaggle 今日已經擁有一百萬用戶,未來幾年還會成長十倍甚至百倍,因為這個領域的人才需求缺口還很大。」他曾被評為 2013 年《麻省理工科技評論》全球 35 歲以下青年科技創新人士,而 Kaggle 在今年加入 Google,更是近年創業領域的成功範例。

然而,想要參與到 Kaggle 的比賽中卻並非易事,因為一道道挑戰題目都難度極高。而 DT 君通過對競賽命題人、Kaggle 數據科學家甘志雯(Wendy Kan)的專訪,也了解到整個比賽的流程。

圖丨甘志雯

舉例來說,當企業或機構單位想要在 Kaggle 舉辦比賽,會先接觸到 Kaggle 類似產品經理角色的人員展開初步溝通,合作共識達成後,就會開始由數據科學家接手。他們與企業溝通,理解對方想要解決什麼樣的問題、擁有什麼樣的數據、怎麼衡量模型的效益、評價指標有哪些等等。

所以客戶會將龐大的數據交給甘志雯,她必須在很短的時間內熟悉這些數據,並且設計出適合這份數據的比賽規則和目標。

但她經常會遇到客戶說:「這些數據很機密,但我又很想辦這比賽,怎麼辦?」所以就要得幫他們想出適當的方法。直到雙方都認同後,就會把數據整合為比較乾淨的模式,也就是數據清理(Data Cleansing),去除錯誤或不一致的數據。最後再把這些數據放到 Kaggle 平臺上讓使用者取用。一般 Kaggle 上的比賽賽程最多是 2~3 個月,參賽者必須在期間內遞交自己設計的算法。

圖丨甘志雯在演講

對於身為一個出考題的人,在採訪時 DT 君問她:有沒有什麼可以在 Kaggle 贏高分的秘技?甘志雯說,「多學, 就算你很有經驗也不一定會贏。」多參加比賽、多在 Kaggla 或社群平臺與其他人交流,另外網絡上有不少課程可以利用,多上且多聽。

她認為,數據科學一直都存在於日常生活中,過去,可能是統計學家或IT人員才會使用,不過近年隨著科技的進步,電腦的計算能力進步很多,再加之網絡的普及,大家可以比以前更容易地獲取數據並進行分析。

相關焦點

  • 大數據工程師平均年薪11.9萬美元 就業排名第1
    大數據工程師平均年薪11.9萬美元 就業排名第1「大數據」時代,數據成為決策最為重要的參考之一,與此同時自然也催生出了一些與大數據處理相關的職業,他們通過對數據的挖掘分析來影響企業的商業決策。在中國,大數據的應用才剛剛萌芽,很少有全才來完成所有環節。於是每家公司根據自己已有的資源對大數據工作提出了不同的要求:有的強調資料庫編程、有的突出應用數學和統計學知識、有的則要求有諮詢公司或投行相關的經驗、有些是希望能找到懂得產品和市場的應用型人才。因此這群與大數據打交道的人有了多樣的頭銜:數據科學家、數據工程師、大數據專家、數據研究員、統計分析師等,我們將其統稱為「大數據工程師」。
  • 2019年美國遊戲從業者超14.3萬,平均年薪12.1萬美元
    2019年美國遊戲從業者超14.3萬,平均年薪12.1萬美元 原標題:2019年美國遊戲從業者超
  • 醫學網站Medscape發布最新報告:美國醫生平均年薪31.3萬美元
    ○文 | 吳施楠 編 | 袁月近日,知名醫學網站Medscape根據對30多個專業近2萬名醫生調查的結果,發布了2019年美國醫生薪酬報告,全方位展示了美國醫生的薪酬信息、工作時間、接診時間、性別差異、工作價值和職業挑戰等。美國醫生平均工資31.3萬美元
  • 美國教授年薪有多高?哈佛教授平均20萬美元起
    【環球網留學綜合報導】據臺灣「聯合新聞網」3月29日報導,《美國高等教育紀事報》近日公布了美國4700多所高等院校2015-2016的教職員薪資,頂尖大學全職教授的平均年薪大致從20萬美元(約合人民幣138萬元)起。
  • 亞馬遜3.3萬崗位空缺,新人平均年薪 15 萬美元
    美國疫情導致亞馬遜業務激增,人員短缺。 策劃&撰寫:韓平 昨日,亞馬遜宣布將於當地時間9月16日舉辦職業發展日(Career Day)活動,本次將開放33000個平均年薪15萬美元的工作崗位,當天將有1000名招聘人員參加,還會提供20000次免費職業諮詢課程。
  • 亞馬遜將再招約3.3萬名新員工 平均年薪15萬美元
    &nbsp&nbsp&nbsp&nbsp亞馬遜宣布將於當地時間9月16日舉辦職業發展日(Career Day)活動,向所有求職者開放大約33000個工作崗位,平均年薪為15萬美元。
  • 美國3.75%的職業年薪收入中位數超過10萬美元 律師收入最高
    據美國《僑報》8月31日消息,美國勞工統計局(BLS)的職業就業統計資料庫顯示,該局調查的大約800種職業中,只有3.75%的職業(30種職業)的估計收入中位數超過10萬美元(約合人民幣61.2萬元)年薪,其中律師在就業人數最多的職業中收入最高。
  • 2019年數據分析入門級薪資達8萬美元|附常用工具
    自北卡羅來納州立大學 2006 年率先開設了分析科學碩士課程,至今有 280 所美國大學和學院提供了類似的研究生項目,2019 年將有 1 萬名分析科學碩士畢業。儘管數據科學的畢業生人數在快速增長,但其入門級薪水仍然達到了 8 萬美元。(預告:察言觀數團隊從各種渠道匯集了全球600餘所數據科學專業的本碩博招生信息,待9月份陸續發布...)
  • 美國9個大學專業失業率最低 且年薪超8萬美元
    根據美國勞工統計局(Bureau of Labor Statistics)2020年1月的數據,擁有學士學位的美國人失業風險,比僅有高中文憑的人減少一半。圖為一個年輕人在求職面試。新冠病毒大流行對全球經濟和就業市場造成衝擊。美國7月就業市場雖然在繼續收復失地,非農新增就業人數、失業率優於市場預期。但失業率仍有10.2%,失業人數達1,630萬。
  • 美國九個大學專業,失業率最低,且年薪超8萬美元
    美國7月就業市場雖然在繼續收復失地,非農新增就業人數、失業率優於市場預期。但失業率仍有10.2%,失業人數達1,630萬。 根據美國勞工統計局(Bureau of Labor Statistics)2020年1月的數據,擁有學士學位的美國人失業風險,比僅有高中文憑的人減少一半。
  • 在美國掌握9種計算機程式語言,年薪最低6萬美元
    (Fotolia)因新冠疫情衝擊,美國失業人數仍居高不下。根據美國勞工統計局的數據,自3月份美國發生COVID-19大流行以來,曾造成2200萬人失業,雖然10月失業率降至6.9%,但仍有大批人沒有工作。如果你最近失業,或者想學習新技能增加就業機會,學習編程技能不失為一個好選擇。
  • 矽谷技術人員年薪很高,但仍比不上在美國當醫生?
    隨著數位化風潮的廣受矚目,這些圍繞在以0和1組成的數碼世界裡的技術人員們風頭正盛,幾乎要蓋過傳統意義上的高薪行業職員,這指的主要是醫生和律師。但彭博社近日一篇文章給出了反向意見,在援引美國勞工統計局關於行業薪酬排行的數據後,文章以輕鬆的口吻勸誡,「忘了矽谷吧,在美國當醫生的報酬仍然更高」。
  • Kaggle首次定義數據科學家:30歲,年薪5萬刀,愛Python,最恨髒數據
    這份調查問卷的受訪者囊括了來自50多個國家的16,000+位從業者,根據他們的問卷結果,Kaggle給出了一些有趣的結論:1、Python可能是機器學習最常用的程式語言,而統計學家更多地使用R語言;2、數據科學家的年齡中位數是30歲,而各國差異巨大,比如,印度的受訪人比澳大利亞平均年齡年輕9歲;3、受訪者中碩士學位所佔比重最大,但薪水最高的從業者($150k
  • 華爾街員工年薪知多少? 高盛平均超過50萬美元
    【中國經營網綜合報導】行高盛恐怕是地球上最「精英」的機構之一了。光環之下,自然是不菲的薪酬待遇。高盛平均每個僱員每年工資超過50萬美元。但各個不同職位的薪酬究竟有多少?這裡有你要的答案。根據商業周刊報導,高盛平均每個僱員每年工資超過50萬美元。  那麼,如果你不是高盛高管,工資有多高呢?中層或底層員工呢?美國僱主評價網站Glassdoor統計了高盛3萬2千名員工的薪酬,得出了高盛以下15類職位的平均年薪(從低到高,不完全統計):  1. 運營分析師(Operations Analyst): $50,450  2.
  • 澳洲薪資數據已出爐:平均年薪已達到61.8萬人民幣
    據官方統計,澳大利亞約有100萬人正處於失業狀態,與此同時,該國媒體表示,年收入只有超過89000美元(約合61.8萬人民幣),才能被視為是高於平均水平。報導稱,這是澳大利亞有史以來第一次有超過100萬人被正式列為失業者,領取失業救濟金的隊伍甚至比30年前經濟大衰退時還要長。
  • 在美國,拿5萬美元年薪能過怎樣的生活?
    根據獵頭公司光輝國際(Korn Ferry)的數據,從事入門級崗位的美國應屆畢業生,在2019年的平均年薪為51,347美元。《華爾街日報》(The Wall Street Journal)採訪了生活在五個美國城市的幾位「千禧世代」上班族,看看他們靠著約5萬美元的年收入,日子都過得如何。
  • 2019年十大熱門AI崗位及薪資報告:算法工程師平均年薪超10萬美元!
    其他在 2019 年前 10 位榜單上的新崗位包括: 高級數據科學家初級數據科學家開發顧問數據科學總監首席數據科學家相較而言,分析總監、統計學家、首席科學家、計算機科學家、研究工程師和數據工程師並沒有出現在今年的榜單上。
  • 美國人均年收入3.6萬美元,家庭平均年收入為9萬美元
    依據美國人口普查局公開的信息,2018年美國人的收入再次上漲。據報導,美國居民人均收入達到了3.6萬美元(36080美元),同比名義增長2.9%,扣除價格因素後,實際增長0.5%。按照一年12個月計算,那美國居民的人均月收入就正好約為3000美元。請注意,這是美國所有居民的。實際上,按照美國人口普查局公開的「非農就業人口」的周薪——約為950美元,可以推測:美國非農就業人口的月薪約為4000美元。
  • 美國博士後的平均工資有多少?
    撰文 | Chris Woolston   來源 | Nature自然科研(ID:Nature-Research)   年薪範圍從最低的 23660 美元(美國《公平勞動標準法》制定的最低工資標準)到遠超 10 萬美元以上。
  • 曝數據分析師真實薪資!人均百萬年薪是真的嗎?
    美國大數據及商業智能軟體公司SiSense公布的調查數據研究指出:資訊分析相關人才起薪約為年薪5.5萬美元,北美地區大學畢業生的平均年薪為4.76萬美元相比較而言平均高出7400美元。而最高薪的數據科學家,平均年薪為13.2萬美元,打敗一大票科技公司的高階工程師,而且這個差距還在繼續拉大中。以下根據Payscale所提供的職位基本年薪做參考,為大家整理了四個最常見的大數據人才工作內容以及薪資範圍。