R、SQL、Python,看數據科學家最喜歡的程式語言

2021-01-21 阿里云云棲號

數據的爆炸增長以及公司將數據轉化為商業價值的巨大可能性,不斷增加著市場對數據科學家的需求。


但是,一個合格的數據科學家必須具備哪些技能,擁有什麼樣的教育背景呢?數據科學家在團隊中的角色是什麼?數據科學家大多使用什麼工具和程式語言呢?這些就是米蘭理工大學的大數據分析觀測臺通過一項針對數據科學家的國際調查正在研究的部分問題。如果你的工作與數據有關,也可以支持一下這個完全匿名的調查( survey)。


除了基礎的數據科學相關的技能,編程是數據科學家務必要具備的五種主要能力之一,即使就專業知識而言這不是最相關的。


迄今為止世界範圍內已經有超過200位數據科學家參與了調查,然而結果顯示並沒有一種在數據科學領域佔絕對優勢的程式語言,但是也似乎主要集中在有限幾個選項裡:幾乎96%的參與者斷言至少要用R,SQL或者Phython中的一種。




值得一提的是,當前的調查中排名第一的是53%的數據科學家選擇的的由R Foundation for Statistical Computing提供支持的R語言。一開始R主要是在統計學家或學術圈內流行,但近幾年被相當多的應用於數據科學。如今R是最受歡迎的開源語言之一很多大型的網絡社區都支持它。


即使早在20世紀70年代初就得以發展,SQL在當今仍然發揮著重要作用(約49%的數據科學家選擇SQL,排名第二)。儘管SQL不太適合處理非結構化的數據組(典型的比如大數據),但是分析組織中結構化的數據仍然很有必要,而SQL就非常適合用來處理這類數據。


排名第三的Python(43%)因為靈活而且相當容易上手,近幾年大受歡迎。和R語言一樣,也有很多大型社區致力於促進Python的提高並且建立一些特定的packages。


前五名中最後兩個分別是Unix Shell/AWK/Gawk(15%)和Java(8%)。


如果你是一個數據科學家並且想要得到更詳盡的調查結果包括研究的主要發現和最終結果,完成調查問卷並留下email,我們可以發送給您資料。


原文連結:Top programming languages for Data Science: first partial survey findings 


-END-


雲棲社區

ID:yunqiinsight

雲計算丨網際網路架構丨大數據丨機器學習丨運維


更多精彩內容點擊下方↓↓↓閱讀原文↓↓↓,進入雲棲社區「大數據頻道」。

相關焦點

  • 業界| 四大機器學習程式語言對比:R、Python、MATLAB、Octave
    優點: 端到端開發到執行(一些 brokers package 允許執行,IB) 開源包(Pandas、Numpy、scipy) 交易包(zipline、pybacktest、pyalgotrade) 最適合一般編程和應用程式開發
  • Python成程式語言首選,人工智慧是其最大推力
    2018年,python程式語言榮獲「年度程式語言」稱號!在2018年獲得了最多的排行積分,贏得了3.62%佔比,其次是VisualBasic .NET和Java。Python如今確實已經成為大型程式語言的一部分。
  • PySpark源碼解析,用Python調用高效Scala接口,搞定大規模數據分析
    機器之心專欄作者:匯量科技-陳緒相較於Scala語言而言,Python具有其獨有的優勢及廣泛應用性,因此Spark也推出了PySpark,在框架上提供了利用Python語言的接口,為數據科學家使用該框架提供了便利。
  • 放棄PK,擁抱合作——R和 Python 能做出什麼新花樣?
    兩大陣營的成員都堅信他們對語言的選擇優於對方。所以,在某種程度上,分歧不在於工具,而在於使用這些工具的人。在數據科學領域中有一些人同時使用Python和R,但是他們的比例很小。另一方面,有很多人只致力於一種程式語言,但他們希望能夠使用對手的一些功能。例如,R用戶有時渴望Python固有的面向對象能力,同樣地,一些Python用戶渴望R中可用的統計分布的廣泛範圍。
  • 慢步學習,python語言編程,來扯扯語言的學習理解
    那麼慢步來說說自己對程式語言的學習理解吧。關於語言的共性——累積學習程式語言,跟一個人學習一門自然語言(英語、日語)是差不多的。學習在某種情景下使用語言的詞彙/語句來表達。比如表達善意的問候:「你好」、「hello」、「こんにちは(抗你知哇)」。
  • R+SQL Server的大數據管理
    在學習和使用R語言的過程中,在數據文件的選擇方面,由於csv文件在各大資料庫軟體以及統計分析軟體都有很好的兼容性,所以一直被廣泛地用作數據儲存傳輸
  • Python語言基本語法元素之語句,表達式、賦值語句
    編程和學習數學在很多地方是相通的,都需要從基礎知識一步一步往上學習。例如要真正理解 指數增長 的意思,先要知道什麼是指數函數、什麼是函數曲線。在看到指數函數的曲線的時候,你才能理解 指數增長 增長的迅猛程度。今天筆者想寫Python語言基本語法元素中的語句語句如圖,程序代碼就是一行行語句。
  • Python為什麼這麼火?小孩子適合學習python編程嗎?
    Python出現的時間也就短短幾年,但就是在這短短幾年內,它打破了長久以來程式語言被三巨頭(C/JAVA/C++)統治的局面,蟬聯各大編程熱門語言排行榜榜首,成為當下最熱門的明星級程式語言之一。IEEE Spectrum 2017程式語言排行榜為何Python能迅速火起來?今天咱們就來好好聊聊最直接的幾個原因。
  • 電腦入門程式語言
    今天和大家介紹一下電腦入門編程學什麼語言更合適。首選python語言,python 是一門開源免費、通用型的腳本程式語言,現在社會上會python語言的人很吃香的。它上手簡單,功能強大,堅持「極簡主義」。
  • 數據分析中的Excel、R、Python、SPSS、SAS和SQL
    作為一直想入門數據分析的童鞋們來說,如何選定一門面向數據分析的程式語言或工具呢?注意是數據分析,而不是大數據哦,數據分析是基礎了。數據分析的工具千萬種,綜合起來萬變不離其宗。無非是數據獲取、數據存儲、數據管理、數據計算、數據分析、數據展示等幾個方面。而被提到頻率最高的如Excel、R、Python、SPSS、SAS、SQL等。那麼,這些工具本身到底有什麼特點呢?應該如何合理的使用來解決數據分析的各種問題呢?最簡單的是EXCEL,它不僅是簡單的而且是必備的。
  • Python和R之間轉換的基本指南:有效學習另一種語言的簡單方法
    但是不一定有一種簡單的方法可以把新的思維方式和你所說的語言聯繫起來,這意味著你不僅要記住一個單詞,而是要對每一個編程概念有一個新的理解。甚至你寫的第一行代碼,print(「你好,世界!「)要求您了解print函數的工作原理、編輯器如何返回print語句以及何時使用引號。當你學習第二種程式語言時,你可以將你所知道的語言中的概念翻譯成新的語言,從而更有效、更快地學習。
  • 如何用python在工作中「偷懶」?
    作者 | A字頭 來源 | 數據札記倌 有些朋友在工作中會有這樣的困惑:明明我從早忙到晚,為什麼得到的評價還不高?要知道,企業對一個員工的評價是出於「產出」而非「付出」。所以,如果把大量時間花在機械重複的工作上,不但工作效率不高,對個人發展來說也無甚幫助。而這些工作,如果對於會點編程的人來說,往往通過幾行代碼就可以快速搞定了。
  • 數據科學的Python軟體包
    Python是使用最廣泛的程式語言之一。儘管標準Python並沒有提供太多功能,但其數量眾多的開放原始碼和第三方庫在開發人員中頗受歡迎。您只需命名域,Python就會為您提供最佳的軟體包和庫。數據科學和機器學習是這個時代的兩項苛刻技術,而Python在這兩個領域的表現要好於優。除Python之外,R是數據科學項目中經常使用的另一種程式語言。
  • Python數據分析:pandas讀取和寫入數據
    平時工作中,我們會接觸到不同的數據文件,比如很常見的excel文件(後綴名為xls和xlsx),csv、txt等文本文件,json文件以及sql文件等等。使用read_csv將這三列數據讀入到DataFrame。使用cat命令顯示文件內容:import pandas as pddf = pd.read_csv('01.csv')df當使用read_table()時,運行代碼後出現一個Warning,使用的是最新的版本python3.7。
  • python編程中探索性數據分析詳解,看完就會
    python作為一門高級程式語言,它的定位是優雅、明確和簡單。閱讀Python編寫的代碼感覺像在閱讀英語一樣,這讓使用者可以專注於解決問題而不是去搞明白語言本身。Python雖然是基於C語言編寫,但是摒棄了C中複雜的指針,使其變得簡明易學。並且作為開源軟體,Python允許對代碼進行閱讀,拷貝甚至改進。
  • 最適合兒童的程式語言 - Python
    所以在需要找到Scratch圖形編程到高級語言圖形編程的過渡,Python就是最適合的程式語言。首先讓我們一起聊聊為什麼開始學習Python?學過或者了解Scratch或者Scratch JR圖形編程的同學們,Scratch圖形編程是通過簡單的拖放塊來實現特定的運行邏輯讓目標(小動物)活動起來。對於開展STEAM教育,Scratch圖形編程是最適合的方式之一。低齡的小朋友在接受和掌握一門語言上難度過大,對數理邏輯也是處於認知階段。
  • 小白學數據小抄放送 Python,R,大數據,機器學習
    在Python中做探索性數據分析 在Python中進行探索性數據分析的最佳包是NumPy, Pandas和Matplotlib。通過它們,你將學會如何在python中加載文件,轉換變量,分類數據,繪圖,創建樣本數據集,處理缺損數據等等。這張表總結了三個庫中常用的語句,這是用於探索性數據分析的最簡單的小抄本之一。
  • Python 程式語言的發展簡史
    許多C語言下上百行的程序,在shell下只用幾行就可以完成。然而,shell的本質是調用命令。它並不是一個真正的語言。比如說,shell沒有數值型的數據類型,加法運算都很複雜。總之,shell不能全面的調動計算機的功能。Guido希望有一種語言,這種語言能夠像C語言那樣,能夠全面調用計算機的功能接口,又可以像shell那樣,可以輕鬆的編程。ABC語言讓Guido看到希望。
  • 數據科學家常用的10種程式語言和工具
    【IT168 翻譯】SAP大中華區副總裁劉偉曾經在DTCC大會上說過:「數據科學家是21世紀最性感的職業」。那麼要進入數據科學領域應該掌握哪些技能?如何從一個數據分析師轉變角色成為一個數據科學家?首先你要對數據科學家這份工作做一個研究,例如數據科學家需要掌握哪些數據科學工具和程式語言?一般來說,R和Python是需要重點掌握的。
  • 《小灰教你零基礎學python》-Python入門語言
    二、什麼是程式語言程序(軟體)是使用程式語言編寫的,比如咱們日常使用的微信、qq、瀏覽器、播放器都是使用程式語言編寫的,程式語言有哪些:javapython>c語言php(有人稱php是最好的程式語言)這裡包括咱本套課程需要學習的python,其實理解咱這麼理解就行:咱們和外國人交流需要說英語,那麼咱們必須要學會英語才能和對方溝通;咱們需要讓電腦進行「溝通」就必須要使用程式語言。