可視化的定義

2021-03-01 我是蘇有熊

前不久認識一位剛從美國留學回來的朋友,他在美國學的是工科,平時對數據可視化挺感興趣,下文是他對數據可視化這一概念的介紹,寫得很好,特分享給大家。

 

哦,差點忘記告訴大家,他有一個個人網站,tuyukun.com,主頁有他本人照片:

引言

數據可視化因當代信息量的劇增,開始更加深入人類社會的生活,逐漸成為了我們消費信息的主流方式。有趣的是,託了中文強大構詞能力的福,「數據可視化」(Data Visualization)作為一個譯詞,隱隱顯得莫名地高端難解了。

其實」化「字跟在某個字、名詞或者形容詞後通常構成一個動詞,常用於翻譯「ization」後綴:如工業化(industrialization)、現代化(modernization)、全球化(globalization)。

這樣理解來,」可視化「也在描述一種「讓大家看見的」發展方向,或者能力。數據可視化的領域是廣博且在不斷擴展的,那用五個字去完整地整個領域終究稍顯單薄。本文旨在給數據可視化(Data Visualization)下一個定義,盡力為大家引入數據可視化的無窮趣味和無儘可能性

那麼,什麼是數據可視化呢?

為了回答這個問題,我們可以從出色的數據可視化作品印證一番。

圖一:作者Pinterest 個人收藏面板(6)

出色的可視化作品往往都有奪目而入的標題,搭配得當的顏色,文如其義的字體,真知灼見的分析。我們其實在欣賞一幅好的可視化作品的同時,也在欣賞」交流的藝術「,」顏色的藝術「,」字體的藝術「,」分析的藝術「等等等等。

當此類藝術致力於將數據呈現給大眾時候,就成了「數據可視化的藝術」。其實早有學者先賢在數據可視化領域做出許多探索和成就。

當今國際數據可視化界的翹楚Nadieh Bremer(作者認她為數據可視化第一人)曾對數據可視化下過定語:「Encode data into visual elements」。即,把數據編入視覺元素。這句話是一個好的開始,我們再縮減一番:「Make Data Visual」。

圖二:看見數據

白話就是:「看見」數據。但是,光是看得見數據,就夠了嗎?我們又想「」出什麼呢?色彩斑斕的美感?發人深省的見解?還是可以自由探索的頭腦風暴平臺?管中窺豹,只可見一斑。

或許我們在討論」數據可視化藝術「的時候,太過於將其作為一個整體概念而忽略了這個領域更為宏大的重要組成部分:」數據「(Data)、「可視化」(Visualization)。

什麼是數據?

來自Microsoft等研究機構的學者在2018年的數據下過一次定義:

數據:通過收集、整理和模型計算而輸出的詳細信息、計算成果及測量結果。並且這些信息可成為為未來推理和理解分析奠定基石的重要事實。(4)

一言以蔽之:數據即信息。從你我今晚飯量到全球糧食總產,從周董新歌歌詞到世界rapper說唱風格,從中國2020年洪水到全球變暖。如此皆是信息。

而數據根本上是信息的進一步精煉,或者轉述。這種精煉Nathan Yau多次在《Data Points》做出過一個比喻:好似攝影,數據根本就是在特定的時間和地點對現實世界信息的不完全捕捉(8)。

照片中每個像素對真實世界色彩的記錄,只是最接近我們對自然世界觀察視角。陽光照之於萬物,萬物顯現各異,光憑一張照片,總歸有缺失有誤差。

數據也是一樣。數據集中每行每列,其實都是在對現實世界的各個元素的量化,可現實世界的複雜程度又不是通過單純的測量可以精確概括的。

我們不妨測試一番對自己對信息提取概括的反應。https://nypost.com/2015/07/18/obama-gives-standing-ovation-during-broadways-hamilton/

圖三:Hamilton信息提取之路

縱觀上圖:從漢密爾頓(Halmton)音樂劇現場,到圖一該劇賓朋滿座,再到圖二的落座率記錄。信息究竟是變得更抽象,還是更具體了呢?我們可以用生活中的情景來回答:

圖四:孩童進行轉述遊戲

我們或許在綜藝節目上看過,甚至都玩過這麼個遊戲:轉述遊戲--Telephone Game(英文:電話遊戲)。由第一人講一個故事,然後耳語給第二人,第二人再轉述給第三人,如此傳遞,至第六,第七甚至更往下,最後一人複述該故事。有趣的是,最後一人和第一人說的往往不是同一件事。

這種有趣的差別被印第安納大學在2018年做過一次深入研究:他們給2389名志願者開展了多次Telephone Game,並就結果差異進行分析。平均而言,轉述進行到第三人時,只有25%的故事細節和23%的原文得以保留。當轉述鏈繼續延申,就開始生出很多啼笑皆非的故事。

所以我們來回到之前的問題:從音樂劇現場到照片到數據,信息到底還是在流失。所以生活真的是個很複雜的東西,我們的大腦可以存儲很多記憶,但是把記憶場景轉換成可傳承,可分享的信息,無論記錄方式如何,總是有言辭,用圖不盡意之處。(但是,高質量且精細度高的數據仍然可以為我們提供良好的分析基石。)

既然信息在傳播過程中一直在流失,為什麼我們還要錄視頻,拍照,寫影評,用數據記錄呢?

就我們討論的百老匯而言,不是人人都會去看歷史上最受歡迎的音樂劇,不是大家都會去時代廣場摩肩接踵,不是每個人都會有這閒心和閒錢去到一萬五千公裡以外的地方享受音樂文化。記憶、體驗無法分享,但是文字、圖片、表格可以。

數字媒體這種東西,究其本質,都不過是人類恐懼孤獨而創造的分享感受,促進理解,探索世界的工具。

數據作為未來的主流媒體信息,在信息爆炸的現代,總歸需要一些革新的呈現方式,以便於大眾消化。既然談到革新的方式,此刻該是邀請可視化這個老朋友入座了。

什麼是可視化?

可視化就是我們轉述遊戲中最佳的下一環。「看」是我們人類利用自己視覺系統對於圖像信息的特殊處理方式,來消化大量信息的重要方法。

將自然世界的信息可視化,是人類自古用來增強自身認知能力的主要工具。而我們的祖先已經熟練使用可視化長達千餘年之久。

圖五:甲骨文例圖(1)

甲骨文的發明就是將自然世界的信息編入更加視覺性的元素——文字。日,雨,水等的形狀特徵被完全的用視覺元素記錄了下來,並傳承發展。

可視化的進程自然也不止步於此,更是在後世不斷突破,這副作於12世紀初宋朝的禹跡圖,記錄了500多個地名和80多條河流。是世界上最古老也是最早用網格符號表現比例的地圖。

圖六:宋代禹跡圖(7)

從三千五百年前的甲骨文到一千年前禹跡圖到現世的種種可視化作品。可視化的傳承歷史和文字一般悠久。我們為什麼這麼持之以恆地訴諸於將信息轉化成視覺元素的技巧呢?

因為人類對視覺信息的處理方式是我們所有感官中最為特殊的。當面對圖像信息時,我們的感知系統會平行(同時)處理視覺信息,這個處理過程是發生在「前知覺」(preconscious level)的。我們看到下圖,再進一步閱讀之前反應大多是,

圖七:南華早報:「伊拉剋死亡人數"(5)

但是這實際上是倒放的紅色條形圖。在我們面對大量視覺信息並意識到自己正在吸收什麼樣的信息之前,視覺信息早已悄悄地佔領了我們意識高地。

這種利用圖像進行潛意識影響我們思考的視覺技巧,叫視覺隱喻(visual metaphor),也正是可視化的魅力所在。

通常而言,圖像信息通過外在記憶(external memory)的形式,可以為我們的內在記憶(internal memory)減負。偉大的地圖學和圖像理論家Jacques Bertin總結得很好:可視化就是我們使用人造記憶(artifical memory)迎合人類天生對自然世界的觀察方式。

這樣的具象化信息的方式可以啟迪我們,利用從視覺方面的記憶,更加便捷地思考一些空想想不出來的問題,看不出的規律,和講不清的故事。

至於其他感官呢。我們對於聲音的處理方式是線性的,有次序的,因此聲音記憶不會像圖像記憶那樣在意識層面上多層影響我們(3)。舉個例子就是,我們做錯了事兒,爸爸小時候怎麼吼我們名字,長大還是怎麼吼我們名字。我們被叫的那一瞬間的「一激靈」,換別人真就吼不出咱爸的精神壓迫。味覺,觸覺的信息處理更是不如聽覺信息的靈敏了。

因此,正是這種對於不同感官信息的吸收程度,才造成了我們如今尖端的圖像處理技術,作為我們探索和理解世界的主要工具。

數據可視化是理解與探索的工具

到此為止,我們終於可以回答最初的問題了。當數據與可視化結合之時,我們創造出了最符合我們信息消化系統的視覺工具,來幫助我們探索和理解自然世界。換句話說,探索與理解,是數據可視化的決定性特質

當一個所謂的數據可視化作品無法達成基礎目標(探索或理解)的時候,我們可以斷定,這不是一個好的可視化作品。

我們目前的回答,也非常符合著名諮詢師和數據可視化專家Andy Kirk又在其書《Data Visualization》的對數據可視化的看法。「The Visual Representation and Presentation of Data to Facilitate Understanding」。即:以方便理解為目的,而在視覺上對數據的塑造和呈現。(2)

(作者註:該定義對設計風格,可視化所涉及領域,以及可視化作品質量未作要求。)

Andy Kirk也同意所有的數據可視化作品都至少服務於一個終極目的:便於理解。而達成這個理解的,需要給數據選擇一個適當視覺塑造(Visual Representation),(比如好的圖表類型),以及合適的呈現方式,即設計。Andy Kirk為這裡面的學問寫了一本書,我們以後系列裡也會提到相關內容。

數據可視化是消費品

但綜上所述,一個好的數據可視化是像眼鏡一般的存在,幫助我們在數據流中聚焦視線。帶上了,我們就能從數據中更加地理解和探索現實世界。

可在21世紀,數據可視化又被默默地賦予了新的屬性:商品屬性。我們不妨設想一下:消費商品,需要金錢;消耗脂肪,需要運動;消化信息,需要什麼?注意力。大量的信息必會大量地消耗著我們注意力。諷刺地是,隨著人類所創造信息量的增加,人類自己對信息的注意長度(attention span)卻在劇減。我們也許早已是信息的富翁,可我們註定成為注意力的貧民。

數據可視化這時候正在發揮它最本質的作用:增強人類的感知能力,幫助人類探索和理解複雜且龐大的信息。

尾言:

按照開頭Bremer:「將數據編入視覺元素」的說法。可以看作數據是攝世界之象,而數據可視化是攝數據之象,數據可視化設計師在不斷具象化數據而製成的作品,讀者在理解之時,卻需要重新倒著經歷一邊數據可視化設計師對抽象事物不斷具象提取的歷程:視覺元素-數據-現實世界。正應了國際設計界的一句俗語:Designers encode; users decode。

我們下期從數據可視化設計流程講起,來日一步一步講解、印證如何設計出讓讀者可以舒適消化一個可視化作品。

參考文獻

甲骨文. Accessed Octover 12, 2020. http://zidiantong.com/jgw/. 查字典通

Kirk, Andy. Data Visualization: A Handbook for Data Driven Design. SAGE Publications Ltd. 2019

Munzner, Tamara. Visualization Analysis & Design. CRC Press. 2015

Riche, Nathalie Henry, Hurter, Christophe. Data-Driven Storytelling. CRC Press. 2018

Scarr, Simon. Iraq’s bloody toll. Last modified December 17, 2011. https://www.scmp.com/infographics/article/1284683/iraqs-bloody-toll. South China Morning Post

Tu, Yukun. Data visualization design. https://www.pinterest.com/tugordon0744/data-visualization-design/. Pinterest

Unknown. 禹跡圖. 1136. https://www.wdl.org/zh/item/3048/. 世界數字圖書館

Yau, Nathan. Data Points: Visualization That Means Something. John Wiley&Sons, Inc. 2013

下面是文末福利,本次送出原價300元的「蘇有熊的商務圖表知識星球」會員一份,關注後留言,留言點讚數最多者獲得本期獎品。

知識星球包含1000+精彩主題,部分預覽如下,如需購買可前往自定義菜單——「產品」——「知識星球」,到達購買頁面。

前往知識星球也可以識別下方二維碼:

相關焦點

  • 數據可視化設計系列(1): 數據可視化的定義
    這樣理解來,」可視化「也在描述一種「讓大家看見的」發展方向,或者能力。數據可視化的領域是廣博且在不斷擴展的,那用五個字去完整地整個領域終究稍顯單薄。本文旨在給數據可視化(Data Visualization)下一個定義,盡力為大家引入數據可視化的無窮趣味和無儘可能性。那麼,什麼是數據可視化呢?
  • 亮瞎雙眼的 Power BI 自定義可視化圖表(2017最新版)
    去年我們已經寫過一次自定義可視化圖表的全系列介紹,《亮瞎雙眼的Power BI自定義可視化圖表》,當時自定義可視化圖表有60多個。隨著自定義圖表庫的更新,現在的圖表數量已多達110多種。 本文將帶您欣賞Power BI官網中可以下載到的全部112個自定義可視化圖表。此外,我們還會在文末提供截至目前全部自定義可視化圖表的打包文件下載連結。
  • 學習筆記TF003:數據流圖定義、執行、可視化
    級聯運算組可視化更容易,無需關心部件內部具體細節。造成循環依賴(circular dependency)的節點連接不被允許。節點輸出是後繼節點計算必須輸入,節點是後繼節點的依賴節點。輸出不需要其他節點任何輸入,互相獨立。依賴關係具有傳遞性。依賴分為直接依賴和間接依賴。節點輸出作為直接或間接依賴節點的輸入,因都需要等待對方計算完成,形成循環依賴。
  • 「 Python數據可視化系列」3. 使用Leather進行數據可視化
    讓我們編寫一些簡單的代碼來可視化幾個點。我們可以在X-Y坐標系中定義點。我們可以使用元組(tuple)列表(list)來定義點,如下所示:data1 = [(1.5, 2), (2, 3), (4.5, 6), (7.5, 4)]我們也可以將它們定義為一列列表(a list of lists):data1 = [[1.5, 2], [2, 3], [4.5, 6], [7.5, 4]]我們也可以將它們定義為元組的元組
  • ​數據可視化 | 6個基本可視化Python庫
    數據可視化是使用可視元素(例如圖表,圖形等)表示數據的過程,有助於從數據中獲取有意義的見解。它旨在揭示數據背後的信息,並進一步幫助查看者查看數據中的結構。數據可視化將使任何人只要對數據科學的了解最少,即可獲得科學發現,並幫助人們輕鬆地交流信息。畢竟,一張圖片勝過千言萬語。在本文中我們將介紹一些Python支持的最出色的可視化庫。
  • python可視化 | 單站空氣品質日曆圖可視化
    類似的方法也可以用到空氣品質的可視化方式中來,只要有每天的空氣品質指數就可以。數據我這裡使用的是2020年北京市各個監測站點的空氣品質觀測數據,原始數據包含PM2.5,PM10,AQI指數,這裡選擇AQI作為示例。
  • Python數據可視化—Seaborn
    今天為大家分享的小技巧是python的可視化畫圖庫Seaborn。相信很多小俠客用過matplotlib、pyecharts等可視化庫,可是為什麼還要介紹Seaborn呢?因為它修復了上述兩個庫的一些缺點,比如Seaborn提供了大量的高級接口和自定義主題,而matplotlib沒有這些接口使得很難確定哪些設置來自定義圖表。
  • 39個大數據可視化工具
    Crossfilter使用語義版本控制並且易於使用值、目標和其他元素和命令來自定義的創建數據可視化。實際上,它使Square Register的商家有權利操縱銷售和購買數據。Envision.js用Envision.js庫創建快且交互式HTML5可視化,能夠展示實時數據、時間序列、財務可視化、AJAX驅動財務圖表和自定義可視化,包括分形。
  • 高級的數據可視化怎麼做?
    其實,數據可視化並沒有同學們想的那麼複雜,它是一個完全可以量化的技術。由於人類的大腦對視覺信息的處理優於對文本的處理,所以使用圖表、圖形和設計元素,數據可視化可以幫助我們更容易的解釋趨勢和統計數據。文本形式的表達數據是混亂無章的,如果利用可視化的數據可以幫助人們快速的理解數據中的含義,趨勢及相關性。 下面我們從歷史的角度開始了解數據可視化的發展趨勢,可以幫助我們真正的了解數據可視化的本質。So,我們首先去了解數據可視化的定義。數據可視化是關於數據視覺表現形式的科學技術研究。
  • B端互動設計——數據可視化圖表
    因此掌握數據可視化能力是設計師必不可少的一個技能,然而目前國內網際網路對於數據的教學不夠全面,這讓很多B端的設計師很苦惱;所以今天我結合自己的工作經驗和大家分享一下——「數據可視化之圖表設計」,為大家梳理一套完整的數據可視化的框架,以及關於可視化設計的基本準則和規範。  幫助大家理解什麼樣的數據對應什麼樣的圖標,了解顏色的意義,知道數據排版的要點。
  • 用 Python 實現詞雲可視化
    2、 基於背景圖像數據的詞雲可視化具體實現如下:先貼一下背景圖像:3、 自定義詞雲字體顏色的具體實現如下:#自定義顏色列表color_list=['#CD853F','#DC143C','#00FF7F','#FF6347','#8B008B','#00FFFF'
  • 國外常用的十個數據可視化工具
    優點非常強大且可自定義可能有大量圖表類型專注於網絡標準可讓非程式設計師創建可視化工具免費和開源缺點這些圖表可以通過簡單的CSS編輯完全自定義。底線對於需要簡單,可自定義,交互式可視化選項的設計人員來說,Chart.js是一個不錯的選擇。它最大的賣點是它是免費和開源的。
  • 圖形可視化教學法讓數學學習生動有趣
    圖形可視化教學法讓數學學習生動有趣     本報訊(記者 陽帆)通過一個軟體,學生在電腦上能直觀感受到函數的變化,把書本上抽象的公式變成了電腦屏幕上直觀的圖形。
  • 數據可視化必修課 - 圖表篇
    ,而圖表是數據可視化中最常用的一種表現形式。(如果圖片看不清,可以點開放大看~)正文約:3800 字,預計閱讀時間:10 分鐘一  什麼是圖表圖表的定義:可直觀展示統計信息的屬性,對知識挖掘和信息直觀生動感受起關鍵作用的圖形結構,是一種很好的將對象屬性數據直觀、形象地可視化的手段。英文叫法:Chart。
  • OPhone可視化軟體開發工具
    OPhone可視化軟體開發工具(OPhone Development Tools,ODT)是專為OPhone平臺開發者設計的一整套可視化軟體開發工具。在兼容ADT(Android Development Tools)的基礎上,ODT提供了所見即所得、控制項可拖放、屬性可編輯、代碼可自動生成、支持OPhone UI樣式的界面編輯器。
  • 想要搞懂數據可視化,看這一篇就夠了
    最近很多朋友跟我抱怨:為了公司數據好看,老闆一個勁地想要數據可視化,以為可視化就是畫畫圖表這麼簡單,可苦了自己天天加班做數據,但其實老闆根本不懂可視化!確實,數據可視化無疑是當今最火熱的詞,不管是做什麼數據,似乎都要拿來做一下可視化才行,但很多人都對數據可視化沒有一個具體的概念,也不知道該如何實現可視化。
  • 廣告位(banner)的可視化管理後臺邏輯說明
    本文簡單的將可視化banner後臺的邏輯做以說明。百度百科上我們可以看到對banner的定義即「橫幅廣告(Banner Ad.)是網絡廣告最早採用的形式,也是目前最常見的形式。橫幅廣告又稱旗幟廣告,它是橫跨於網頁上的矩形公告牌,當用戶點擊這些橫幅的時候,通常可以連結到廣告主的網頁。」
  • 一個工具幫你實現酷炫可視化
    大部分人眼裡,數據可視化可以是這樣的:但其實,它也可以做成這樣:看著酷炫的可視化,有人會疑惑,是否有實實在在的用處。它可以快速製作報表,搭建統一的數據分析和可視化平臺。就因為其強大的數據整合性能,再結合其10多年來成熟的可視化組件,finereport可以製作各類數據可視化大屏。
  • 智慧氣象大屏可視化決策系統
    核心提示:數字冰雹智慧氣象大屏可視化決策系統,面向氣象監管部門大屏可視化環境,具備優秀的大數據顯示性能以及多機協同管理機制,支持大屏、多屏、超大解析度等顯示情景。1. 超高清小間距顯示大屏為指揮中心量身打造超高清小間距LED大屏顯示解決方案,支持無縫、無邊框、無限拼接,可自定義整屏尺寸,任意解析度下,畫面顯示效果精準完整;具備低亮高灰技術內核,畫質細膩流暢,觀看舒適;亮度智能調節,滿足多種室內環境應用場合;超寬視角(水平/垂直均160度),任意角度良好顯示;超高刷新率,納米級響應速度;安全低噪、穩定耐用,為用戶提供超凡的大屏使用體驗。
  • R語言天氣可視化應用
    可視化程序,讀入天氣數據及地圖數據,生成靜態的圖片作為可視化輸出。最終用戶通過新浪微博,加載Web應用,看到了可視化生成的靜態圖片。最終用戶通過新浪微博分享了這個應用,讓更多的人看到這個應用。下面按照語言的優勢,把應用架構以語言的特性來劃分,讓R語言實現爬蟲、處理數據和可視化,讓PHP完成Web開發、新浪API接入和用戶交互。