【數據可視化】數據可視化,我應從何開啟?

2022-01-03 R語言

我喜歡數據,並將它廣為人知。

如果您最近和我參加聚會,我在您耳邊說的都是有關數據可視化工具或者最近使用的酷R包,對此我在這向您表示歉意。

如果您和我玩範特西遊戲,歡迎您來到圖表世界,這裡有很多的圖表。

不要為越來越頻繁地聽到下面的問題感到驚訝:「Nick,我想走向數據分析和數據可視化,我應該從哪裡開始?」

不幸的是,沒有一個完美的答案適合所有的人–每一個人的需求不同且人們已經知道的東西相差很大。但令我高興的是一件關於最近科技/教育/商業環境事情:

來自不同職業道路和背景的聰明人都對自己說:「我需要從數據中得到更多」。

但是,在很多初學者溝通後,發現了的共性。很明顯,這些共性不是適合每一個人的:

一個老練的工程師會嘲笑共性上說的第一時間學習Java腳本或者Python。

早已知道D3.js 的人會疑惑選擇哪一個可視化工具?或者疑惑怎麼樣將數據驅動轉換應用頂級的3D中?

這些適合想進一步了解接近數據可視化的學術科學家、學校老師、研究諮詢師、項目經理、失業快樂族或者MBA畢業生……。

如果符合你,我認為你應該開始於從「無編碼」有計劃地學習到「愛編碼」。

無編碼

首先,如果你對excel一無所知,這是值得去做的。嚴肅地告訴你至少得學會透視表,聽起來有些差勁,但是Excel能做很多超乎人們想像的事情。如果你善於嘗試,Excel甚至能做出很多漂亮的圖表。

如果你已經有一些數據,僅僅想用一個好的工具來探索可視化或者輸出更多引人注目的圖表。Tableau 就很流行、功能驚人,它有免費的公共版和一個十分昂貴費用的付費版,

不過如果你是學生就可以享受到免費版。它一般會在網上,或者論文上以靜態圖表形式發布,也可以傳送到Instagram上或者以牆圖輸出。在它的官網上可以找到很多模板,激發你的靈感。

遺憾地是,將要探討的另一個工具–Infoactive,可惜已經下架了,但沒關係,Tableau吸收了Infoative所有優點。這個意味著Tableau很有可能是未來公認的好工具。我將牽頭一本免費的書,它是Infoactive團隊帶領下涉及數據可視化設計工具的背景資料,下面談論的任何工具:

數據+設計

一個簡單有關準備和可視化信息的說明介紹

簡單編碼

如果要選擇一款獨立的程序語言來操作單機數據,我會選擇R語言。因為R語言是免費的,且支持大量的在線開發加載有用的頂級基礎語言程序包,並且有大量的免費資源學習如何運用它。在這些資源中–我極力推薦Coursera課程:

數據科學家證書|課程

約翰霍普金斯大學驗證通過的數據科學專業化專家成為數據科學家自由談論……

它們可能會抹殺一個真正的初學者,但是課程能帶你走出一條重要數據科學項目和想法的路線,通過所有的方式探索數據分析(它涵蓋了有用的R包,例如ggplot,一個十分受歡迎的可視化工具)的交互性,通過Shiny和數據故事發布在網頁上。

R是我最常用來處理小型快速的分析和數據可視化工具–如果有一個數據(數據量大、不易於可視化)Excel處理不了,R最適合快速探索。

「是的,你可能要學些一些SQL」,另外一個快速入門的語言–SQL,與R相比(實際上,這已經超出了蘋果和蘋果的比較),SQL是一門比較有針對性的語言:

如果你希望在資料庫中用任何工具或者語言集成數據,這將是一個很好的機會讓你有學習SQL的興趣。

愛編碼

通常,在網頁上看到一個美好的交互式可視化界面,都會浮現一個問題「我們要從何學起?」。我著迷於這個創新的領域(點擊這可以看更多深入的調查)。

不幸地是,如果你喜歡這些作品:

一個機器學習的可視化介紹

讓我們重新審視73英尺高的邊界,提出了我們的建議,看看我們是怎樣地提高直覺。明顯地……

……它可以令你沮喪的發現還有多少東西需要自己學習。反覆的實踐以求得「《紐約時報》一樣好」是一個艱難的目標,值得但是困難。

幸運的是,這裡有很多幫助資源。

交互式的作品後面的邏輯庫,和很多在網頁上運行的數據可視化作品都是Mike Bostock創作的D3.js。D3.js是一個很好的工具去學習作品網頁發布和交互式。

博斯託克(Bostock)的網站是一個有關金礦的例子和教程網站(你不需要筋疲力竭地從邏輯庫的創建者學起……)。

我也推薦Murry創建的網頁版交互式數據可視化,你可以從 O』Reilly 那購買或者網上在線免費使用:

網頁交互式數據可視化

這是一個關於非程式設計師的編程數據可視化的書。如果你是一個擁有視覺技能的藝術家或圖形設計師,但沒有從事數據或代碼工作的先驗經驗,這本書適合你。如果你是一個擁有大量數據的記者或研究人員,但沒有數據可視化或代碼的先驗工作,這本書也適合你。

在線版本很好–你可以跟著書本本身編寫代碼腳本,運行它並拿你的輸出結果和模板比較。Murray 還特別為初學者量身定製,這個網站能很好的引導初學者從HTML/CSS和Javascript基礎到深入學習相對難的D3。

D3的地理空間可視化是一個值得一提的長處。D3擅長創造很多不同效果的地圖,如果這是你的專業領域,這裡可以獲得不錯的專用教程:

讓我們畫一個泡泡地圖

我以前讓地圖教程介紹了如何用D3和topojson做一個基本的地圖;現在是時候讓它覆蓋……

D3很難操作,但也有工具能降低難度,我建議使用最基礎的D3而不是複雜的繪圖程序,如果你人覺得棘手,那使用Plot.ly會更實際。

如果你要學萬能的程序語言,那Python是最適合。它功能強大目的性強,很受歡迎。

我發現Python是一種極易上手且多用途的程式語言。但實際上,如果你要做的是探索和可視化數據,它會讓你覺得吃力:例如Youtube就是用Python開發的……代碼有一百萬行。如果你想了解Python,Code Academy 課程是一個短且有趣的語言介紹。

最後,和前面介紹的D3.js , Javascript or ggplot ,R一樣, Python也有很多資料庫。最值得推薦的是,Seaborn(建立在一個年長受歡迎的庫,matplotlib)和Bokeh很有可能是一流的,但是這是一個快速發展和提升的領域。Seaborn and Bokeh 的網站包括畫廊展示你用這些工具創建的各種各樣的可視化作品。

啊!太多太多!祝您愉快–如果你創造了一些有趣的東西,請聯繫我:在Twitter上@uptownnickbrown或者發我的郵箱nick@quanticle.co

原文連接:Getting into data visualization — where should I start?

作者:Nick Brown 本文由Teradata挖掘顧問肖小花翻譯,轉載自36大數據

相關焦點

  • 數據可視化設計系列(1): 數據可視化的定義
    這樣理解來,」可視化「也在描述一種「讓大家看見的」發展方向,或者能力。數據可視化的領域是廣博且在不斷擴展的,那用五個字去完整地整個領域終究稍顯單薄。本文旨在給數據可視化(Data Visualization)下一個定義,盡力為大家引入數據可視化的無窮趣味和無儘可能性。那麼,什麼是數據可視化呢?
  • 數據可視化,我的數據分析成長之旅
    所以數據可視化也就應運而生,可以將數據信息變得更加直觀有意義,幫助數據更易被人們理解和接受。那麼什麼是數據可視化?百度百科上搬出數據可視化的概念:「數據可視化,是關於數據視覺表現形式的科學技術研究。其中,這種數據的視覺表現形式被定義為,一種以某種概要形式抽提出來的信息,包括相應信息單位的各種屬性和變量。」
  • 我的數據可視化之旅:從天文學家到數據可視化專家養成記
    從天文學家到數據科學家(我學習R的時候)再到自學而成的數據可視化設計師,這一過程中最大部分時間我都在做大量的數據可視化工作,我還花了很多業餘時間學習網絡語言和D3,閱讀了最佳實踐的相關書籍,參與線上數據可視化社區,並在各種學術會議或見面會中闡釋自己對於這一課題的熱愛。現在,我在為Adyen工作的同時,也是一個數據可視化的兼職自由工作者。
  • 數據可視化與信息可視化怎麼搞?
    我們常常迷失在數據中,紛繁複雜的數據讓我們無所適從。可視化作為解決這問題的有效手段,通過視覺的方式讓數字易於理解。本文梳理了可視化相關內容,並且根據數據平臺組同仁們在可視化項目過程中使用經驗,總結一些可視化使用注意事項,與大家分享。
  • 從數據可視化到交互式數據分析
    高可視性的可視化項目主要關注兩個目的:帶來靈感和幫助解釋。然而,可視化可以通過數據分析來增加對複雜問題的理解,這樣的項目雖然不多見,但不代表不重要。數據可視化的三個主要用途我知道我這樣總結可能存在嚴重簡化的風險。但是,我發現根據主要目的(有意或無意)確定數據可視化的三類主要用途是很有用的,這也有助於我在本文後面闡明一些觀點。
  • 【數據可視化】新冠疫情數據可視化
    首先進行導包以及數據讀取:import numpy as npimport pandas as pdimport pyechartsfrom datetime import datetimefrom pyecharts import options as optsfrom pyecharts.charts
  • 數據可視化,請回答2018之可視化乾貨推薦
    :數據可視化指南》作者)為大家準備好了應對方案。國家地理通過交互式網頁嵌入了實景拍攝與地圖圖表的數據分析,展示了一塊垃圾從陸地前往南太平洋中部無人居住的偏遠島嶼亨德森島的旅程。可視化工具精煉——用了這些工具後,我司設計師都說好01 FlourishFlourish是一個在線圖表工具,無需編碼,圖表多樣,包含地圖。
  • 大數據可視化前景廣闊——設計創意學院智能大數據可視化實驗室...
    近日,記者就這一問題找到我校設計創意學院智能大數據可視化實驗室的曹楠教授,他表示,智能大數據可視化實驗室兩年多來的工作表明,其應用前景十分廣闊。智能大數據可視化實驗室做什麼?如何理解大規模數據中的潛在模式、可視化是一個有效的方法。
  • 數據可視化基本流程
    作為統計專業出身,學習數據可視化是必不可少的。第一次接觸可視化是在大三上學期,學校特意在我們有了一定的統計基礎和編程能力的情況下,開設了一門數據可視化的課程。這門課程的主要學習內容是利用SPSS、R語言編寫程序,繪製出一些簡單的統計圖形,比如箱線圖,散點圖,熱力圖等等,並根據得出的結果,整理成一份可視化報告。上圖是一張利用DataFocus製作的可視化大屏。今天呢,主要是想通過自己的理解,結合所學的內容,簡單整理出一些關於數據可視化的流程。
  • 數據可視化的十大優點
    這是數據可視化的步驟,允許組織領導者實時訪問和解釋數據,以便他們能夠快速做出明智的決策。   數據可視化工具為技術、管理人員和其他知識工作者提供了新方法,可以顯著的提高他們掌握隱藏在數據中的信息的能力。
  • Python數據可視化—Seaborn
    小俠客們好呀,我是oubahe。今天為大家分享的小技巧是python的可視化畫圖庫Seaborn。
  • 「 Python數據可視化系列」3. 使用Leather進行數據可視化
    在本章中,我們將使用Jupyter Notebook、Python、數據可視化庫leather進行基本的數據可視化。pip3 install--upgrade pip運行以下語句安裝用於數據可視化演示的庫:!pip3 install leather這將在計算機上安裝leather數據可視化庫。在下一節中,我們將使用筆記本開始學習Python利用leather庫的可視化。
  • 大公司都是怎麼做數據可視化規範的
    ↑ 倫敦城市智能(London City Intelligence)設計指南2014年,我(Amy Cesal)為陽光基金會(Sunlight Foundation)設計了第一份數據可視化設計指南,2017
  • 大數據產品分析:淺析數據可視化
    數據可視化是什麼?數據可視化——藉助於圖形化手段,清晰有效地傳達與溝通信息同時對數據進行交互分析。為什麼需要?:在數據採集過程中進行數據分類,根據數據屬性和方法去可視化解決問題;可視化映射:將數據的數值、空間坐標、不同位置數據間的聯繫等映射為可視化視覺通道的不同元素如標記、位置、形狀、大小和顏色;數據變換和處理:通過去噪,清洗數據、提取數據;用戶驗證:
  • Excel地圖數據可視化
    Hello,大家好,今天跟大家分享下我們如何在地圖上實現數據的可視化,今天我們要用到的功能是三維地圖,三維地圖其實就是powermap,只不過在2016版之後的版本中被稱為三維地圖,powermap是powerbi的組件之一,它主要是對帶有地理位置的數據進行可視化的操作,使用powermap進行地圖數據可視化的操作也非常的簡單
  • 數據可視化的10大優點
    DataFocus君為大伙兒找到一篇大讚數據可視化的10大優點的文章,翻譯如下,希望能給你從事可視化工作的你帶來信心。數據可視化不僅僅是一個詞。讓我來告訴你為什麼。數據可視化允許決策者查看多維數據集之間的連接,並通過使用熱圖,地理圖和其他豐富的圖形表示提供解釋數據的新方法。2.快速訪問相關業務見解通過數據可視化,業務組織可以提高他們在需要時查找所需信息的能力,並且比其他公司更高效地完成這些工作。
  • Matplotlib數據可視化!
    數據可視化,就是指將結構或非結構數據轉換成適當的可視化圖表,然後將隱藏在數據中的信息直接展現於人們面前。相比傳統的用表格或文檔展現數據的方式,可視化能將數據以更加直觀的方式展現出來,使數據更加客觀、更具說服力。數據可視化已經被用於工作科研的方方面面,如工作報表、科研論文等,成為了不可或缺的基礎技能。現在,就讓我們一起來學習下數據可視化的基礎知識。
  • 高級的數據可視化怎麼做?
    其實,數據可視化並沒有同學們想的那麼複雜,它是一個完全可以量化的技術。由於人類的大腦對視覺信息的處理優於對文本的處理,所以使用圖表、圖形和設計元素,數據可視化可以幫助我們更容易的解釋趨勢和統計數據。 在資訊時代和大數據時代的背景下,隨著人類技術的高,通過圖形,圖像處理,計算機視覺等技術,在設計領域中,通過藝術的表達與動態演示,可以將數據加以視覺化闡述。文本形式的表達數據是混亂無章的,如果利用可視化的數據可以幫助人們快速的理解數據中的含義,趨勢及相關性。
  • 數據可視化基本套路總結
    文章總結了多種數據可視化圖形,並簡要介紹了各種圖形的作用,能為科研工作者在數據可視化階段提供新的思路,在此分享給大家。可是這是個看臉的世界,大部分人對於數據也都是外行的,只有把數據可視化做得漂亮才能吸引他們的注意;只有把數據可視化做得簡單易懂,他們才能理解數據分析的內涵。對於數據可視化,最重要的東西從來不是圖形、工具、配色這些套路性的東西,而在於創意和靈感。可你又不是參加比賽,並不需要那麼多的創意靈感。
  • 數據可視化工具匯總(重磅!)
    情況一,你在使用python緊進行數據分析,如果數據可視化僅僅是作為你分析過程中的一部分,而不是作為最終展示的一部分。這時就可以用python的任意數據可視化包,而不必使用BI。通俗地說,這時的可視化是給你自己看的,便利順手即可,無需過於追求精緻美觀。