前不久認識一位剛從美國留學回來的朋友,他在美國學的是工科,平時對數據可視化挺感興趣,下文是他對數據可視化這一概念的介紹,寫得很好,特分享給大家。
哦,差點忘記告訴大家,他有一個個人網站,tuyukun.com,主頁有他本人照片:
引言數據可視化因當代信息量的劇增,開始更加深入人類社會的生活,逐漸成為了我們消費信息的主流方式。有趣的是,託了中文強大構詞能力的福,「數據可視化」(Data Visualization)作為一個譯詞,隱隱顯得莫名地高端難解了。
其實」化「字跟在某個字、名詞或者形容詞後通常構成一個動詞,常用於翻譯「ization」後綴:如工業化(industrialization)、現代化(modernization)、全球化(globalization)。
這樣理解來,」可視化「也在描述一種「讓大家看見的」發展方向,或者能力。數據可視化的領域是廣博且在不斷擴展的,那用五個字去完整地整個領域終究稍顯單薄。本文旨在給數據可視化(Data Visualization)下一個定義,盡力為大家引入數據可視化的無窮趣味和無儘可能性。
那麼,什麼是數據可視化呢?為了回答這個問題,我們可以從出色的數據可視化作品印證一番。
圖一:作者Pinterest 個人收藏面板(6)
出色的可視化作品往往都有奪目而入的標題,搭配得當的顏色,文如其義的字體,真知灼見的分析。我們其實在欣賞一幅好的可視化作品的同時,也在欣賞」交流的藝術「,」顏色的藝術「,」字體的藝術「,」分析的藝術「等等等等。
當此類藝術致力於將數據呈現給大眾時候,就成了「數據可視化的藝術」。其實早有學者先賢在數據可視化領域做出許多探索和成就。
當今國際數據可視化界的翹楚Nadieh Bremer(作者認她為數據可視化第一人)曾對數據可視化下過定語:「Encode data into visual elements」。即,把數據編入視覺元素。這句話是一個好的開始,我們再縮減一番:「Make Data Visual」。
圖二:看見數據
白話就是:「看見」數據。但是,光是看得見數據,就夠了嗎?我們又想「看」出什麼呢?色彩斑斕的美感?發人深省的見解?還是可以自由探索的頭腦風暴平臺?管中窺豹,只可見一斑。
或許我們在討論」數據可視化藝術「的時候,太過於將其作為一個整體概念而忽略了這個領域更為宏大的重要組成部分:」數據「(Data)、「可視化」(Visualization)。
來自Microsoft等研究機構的學者在2018年的數據下過一次定義:
數據:通過收集、整理和模型計算而輸出的詳細信息、計算成果及測量結果。並且這些信息可成為為未來推理和理解分析奠定基石的重要事實。(4)
一言以蔽之:數據即信息。從你我今晚飯量到全球糧食總產,從周董新歌歌詞到世界rapper說唱風格,從中國2020年洪水到全球變暖。如此皆是信息。
而數據根本上是信息的進一步精煉,或者轉述。這種精煉Nathan Yau多次在《Data Points》做出過一個比喻:好似攝影,數據根本就是在特定的時間和地點對現實世界信息的不完全捕捉(8)。
照片中每個像素對真實世界色彩的記錄,只是最接近我們對自然世界觀察視角。陽光照之於萬物,萬物顯現各異,光憑一張照片,總歸有缺失有誤差。
數據也是一樣。數據集中每行每列,其實都是在對現實世界的各個元素的量化,可現實世界的複雜程度又不是通過單純的測量可以精確概括的。
我們不妨測試一番對自己對信息提取概括的反應。https://nypost.com/2015/07/18/obama-gives-standing-ovation-during-broadways-hamilton/
圖三:Hamilton信息提取之路
縱觀上圖:從漢密爾頓(Halmton)音樂劇現場,到圖一該劇賓朋滿座,再到圖二的落座率記錄。信息究竟是變得更抽象,還是更具體了呢?我們可以用生活中的情景來回答:
圖四:孩童進行轉述遊戲
我們或許在綜藝節目上看過,甚至都玩過這麼個遊戲:轉述遊戲--Telephone Game(英文:電話遊戲)。由第一人講一個故事,然後耳語給第二人,第二人再轉述給第三人,如此傳遞,至第六,第七甚至更往下,最後一人複述該故事。有趣的是,最後一人和第一人說的往往不是同一件事。
這種有趣的差別被印第安納大學在2018年做過一次深入研究:他們給2389名志願者開展了多次Telephone Game,並就結果差異進行分析。平均而言,轉述進行到第三人時,只有25%的故事細節和23%的原文得以保留。當轉述鏈繼續延申,就開始生出很多啼笑皆非的故事。
所以我們來回到之前的問題:從音樂劇現場到照片到數據,信息到底還是在流失。所以生活真的是個很複雜的東西,我們的大腦可以存儲很多記憶,但是把記憶場景轉換成可傳承,可分享的信息,無論記錄方式如何,總是有言辭,用圖不盡意之處。(但是,高質量且精細度高的數據仍然可以為我們提供良好的分析基石。)
既然信息在傳播過程中一直在流失,為什麼我們還要錄視頻,拍照,寫影評,用數據記錄呢?
就我們討論的百老匯而言,不是人人都會去看歷史上最受歡迎的音樂劇,不是大家都會去時代廣場摩肩接踵,不是每個人都會有這閒心和閒錢去到一萬五千公裡以外的地方享受音樂文化。記憶、體驗無法分享,但是文字、圖片、表格可以。
數字媒體這種東西,究其本質,都不過是人類恐懼孤獨而創造的分享感受,促進理解,探索世界的工具。
數據作為未來的主流媒體信息,在信息爆炸的現代,總歸需要一些革新的呈現方式,以便於大眾消化。既然談到革新的方式,此刻該是邀請可視化這個老朋友入座了。
可視化就是我們轉述遊戲中最佳的下一環。「看」是我們人類利用自己視覺系統對於圖像信息的特殊處理方式,來消化大量信息的重要方法。
將自然世界的信息可視化,是人類自古用來增強自身認知能力的主要工具。而我們的祖先已經熟練使用可視化長達千餘年之久。
圖五:甲骨文例圖(1)
甲骨文的發明就是將自然世界的信息編入更加視覺性的元素——文字。日,雨,水等的形狀特徵被完全的用視覺元素記錄了下來,並傳承發展。
可視化的進程自然也不止步於此,更是在後世不斷突破,這副作於12世紀初宋朝的禹跡圖,記錄了500多個地名和80多條河流。是世界上最古老也是最早用網格符號表現比例的地圖。
圖六:宋代禹跡圖(7)
從三千五百年前的甲骨文到一千年前禹跡圖到現世的種種可視化作品。可視化的傳承歷史和文字一般悠久。我們為什麼這麼持之以恆地訴諸於將信息轉化成視覺元素的技巧呢?
因為人類對視覺信息的處理方式是我們所有感官中最為特殊的。當面對圖像信息時,我們的感知系統會平行(同時)處理視覺信息,這個處理過程是發生在「前知覺」(preconscious level)的。我們看到下圖,再進一步閱讀之前反應大多是,血!
圖七:南華早報:「伊拉剋死亡人數"(5)
但是這實際上是倒放的紅色條形圖。在我們面對大量視覺信息並意識到自己正在吸收什麼樣的信息之前,視覺信息早已悄悄地佔領了我們意識高地。
這種利用圖像進行潛意識影響我們思考的視覺技巧,叫視覺隱喻(visual metaphor),也正是可視化的魅力所在。
通常而言,圖像信息通過外在記憶(external memory)的形式,可以為我們的內在記憶(internal memory)減負。偉大的地圖學和圖像理論家Jacques Bertin總結得很好:可視化就是我們使用人造記憶(artifical memory)迎合人類天生對自然世界的觀察方式。
這樣的具象化信息的方式可以啟迪我們,利用從視覺方面的記憶,更加便捷地思考一些空想想不出來的問題,看不出的規律,和講不清的故事。
至於其他感官呢。我們對於聲音的處理方式是線性的,有次序的,因此聲音記憶不會像圖像記憶那樣在意識層面上多層影響我們(3)。舉個例子就是,我們做錯了事兒,爸爸小時候怎麼吼我們名字,長大還是怎麼吼我們名字。我們被叫的那一瞬間的「一激靈」,換別人真就吼不出咱爸的精神壓迫。味覺,觸覺的信息處理更是不如聽覺信息的靈敏了。
因此,正是這種對於不同感官信息的吸收程度,才造成了我們如今尖端的圖像處理技術,作為我們探索和理解世界的主要工具。
到此為止,我們終於可以回答最初的問題了。當數據與可視化結合之時,我們創造出了最符合我們信息消化系統的視覺工具,來幫助我們探索和理解自然世界。換句話說,探索與理解,是數據可視化的決定性特質。
當一個所謂的數據可視化作品無法達成基礎目標(探索或理解)的時候,我們可以斷定,這不是一個好的可視化作品。
我們目前的回答,也非常符合著名諮詢師和數據可視化專家Andy Kirk又在其書《Data Visualization》的對數據可視化的看法。「The Visual Representation and Presentation of Data to Facilitate Understanding」。即:以方便理解為目的,而在視覺上對數據的塑造和呈現。(2)
(作者註:該定義對設計風格,可視化所涉及領域,以及可視化作品質量未作要求。)
Andy Kirk也同意所有的數據可視化作品都至少服務於一個終極目的:便於理解。而達成這個理解的,需要給數據選擇一個適當視覺塑造(Visual Representation),(比如好的圖表類型),以及合適的呈現方式,即設計。Andy Kirk為這裡面的學問寫了一本書,我們以後系列裡也會提到相關內容。
數據可視化是消費品但綜上所述,一個好的數據可視化是像眼鏡一般的存在,幫助我們在數據流中聚焦視線。帶上了,我們就能從數據中更加地理解和探索現實世界。
可在21世紀,數據可視化又被默默地賦予了新的屬性:商品屬性。我們不妨設想一下:消費商品,需要金錢;消耗脂肪,需要運動;消化信息,需要什麼?注意力。大量的信息必會大量地消耗著我們注意力。諷刺地是,隨著人類所創造信息量的增加,人類自己對信息的注意長度(attention span)卻在劇減。我們也許早已是信息的富翁,可我們註定成為注意力的貧民。
數據可視化這時候正在發揮它最本質的作用:增強人類的感知能力,幫助人類探索和理解複雜且龐大的信息。
尾言:按照開頭Bremer:「將數據編入視覺元素」的說法。可以看作數據是攝世界之象,而數據可視化是攝數據之象,數據可視化設計師在不斷具象化數據而製成的作品,讀者在理解之時,卻需要重新倒著經歷一邊數據可視化設計師對抽象事物不斷具象提取的歷程:視覺元素-數據-現實世界。正應了國際設計界的一句俗語:Designers encode; users decode。
我們下期從數據可視化設計流程講起,來日一步一步講解、印證如何設計出讓讀者可以舒適消化一個可視化作品。
參考文獻
甲骨文. Accessed Octover 12, 2020. http://zidiantong.com/jgw/. 查字典通
Kirk, Andy. Data Visualization: A Handbook for Data Driven Design. SAGE Publications Ltd. 2019
Munzner, Tamara. Visualization Analysis & Design. CRC Press. 2015
Riche, Nathalie Henry, Hurter, Christophe. Data-Driven Storytelling. CRC Press. 2018
Scarr, Simon. Iraq’s bloody toll. Last modified December 17, 2011. https://www.scmp.com/infographics/article/1284683/iraqs-bloody-toll. South China Morning Post
Tu, Yukun. Data visualization design. https://www.pinterest.com/tugordon0744/data-visualization-design/. Pinterest
Unknown. 禹跡圖. 1136. https://www.wdl.org/zh/item/3048/. 世界數字圖書館
Yau, Nathan. Data Points: Visualization That Means Something. John Wiley&Sons, Inc. 2013
下面是文末福利,本次送出原價300元的「蘇有熊的商務圖表知識星球」會員一份,關注後留言,留言點讚數最多者獲得本期獎品。
知識星球包含1000+精彩主題,部分預覽如下,如需購買可前往自定義菜單——「產品」——「知識星球」,到達購買頁面。
前往知識星球也可以識別下方二維碼: