Lisa Charlotte Rost是Datawrapper(位於柏林的一家在線數據可視化工具公司)的設計師和博客寫手。多年來,她一直致力於分享關於數據可視化的乾貨和經驗。我們試著翻譯了她11月份的主題講座《當我們在考慮數據可視化規則時,我們在考慮什麼》的文字內容,一起看看國外一線可視化從業者有哪些思考。
整個講座分為三個部分:為什麼喜歡探討規則;我喜歡什麼樣的規則;為什麼有時候規則會相悖。
話不多說,快趕上這趟開往柏林的列車。
1、為什麼探討數據可視化規則?學生時代剛開始我還不太會設計,雖然在學校確實掌握了一些基本設計技巧,但我更願意稱之為「機器學習」,或者說「黑盒子」探索。什麼意思呢?打個比方,我在電腦裡上傳100張梵谷的畫作,然後再上傳任意一張圖片,電腦可以把這個圖片模擬成梵谷風格的畫。這一過程完全是計算機完成的,我並不知道具體是怎麼做到的。
所以,為了突破這個「黑盒子」,我繼續學習,很幸運地發現了Edward Tufte寫的寶藏圖書《The Visual Display of Quantitative Information》。在這本書裡我發現,原來數據可視化也有那麼多規則可循,而這些規則能幫助我成為更好的設計師。
不可否認的是,規則有局限性。一些創造性的方案難以通過規律得到,比如Eleanor Lutz製作的這份太陽系可視化地圖。
↑ https://eleanorlutz.com/mapping-18000-asteroids
但在繪製簡單圖表時,規則就能派上大用場。
我的願望是,人人都能不太費力地做出質量不錯的可視化作品。
2、我喜歡什麼樣的規則?1)完整的
好的數據可視化規則應當是完整的,滿足不同背景受眾的。下圖是我在講堆積柱狀圖的博客裡提到的例子,堆積柱狀圖適合比較多個整體下的不同部分;如果你只需要比較一個整體的不同部分,條形圖可能會更直觀。
https://blog.datawrapper.de/stacked-column-charts/
可能你覺得這樣的常識顯而易見,但事實上不少人會出錯。我喜歡從優秀的數據可視化作品中尋找靈感,但最能激發我思考數據可視化規則的卻是那些不夠好的作品。
2)可跳過的
由於不同原則可能適用於不同人群,我的文章是以「文字-圖片-文字-圖片」的結構展開的,並通過小標題進行劃分,你可以直接跳過那些對你來說顯而易見的規則。
3)引發反思的
我不想直接告訴讀者規則是什麼,我更希望讀者能主動地理解和思考規則可能有什麼。我不想讀者說:「好,聽你的就行」,我希望讀者可以思考:「也許我可以自己發現這些規則」。
例如,我希望大家能自己意識到,柱狀圖比餅圖更適合展現哪個值最大,
但餅圖又很適合展現接近25%、50%的數據。
4)可解釋的
向讀者解釋規則為什麼有效是很有必要的,當大家知道了規則背後的原因,就可以將其類推到相似的問題上。
例如,一般情況下數據應當處於同一基線。為什麼呢?因為這樣一來讀者就更容易對比他們的值了。這條規則不僅適用面積圖,也能舉一反三應用到堆疊柱狀圖。
5)可選擇的
數據可視化規則不是自上而下的硬性規定而是可供選擇的。你可以忽略它們,把它們當作「精神食糧」來激發靈感,而不是照單全收。
6)有條件的
規則是人定的,不是不可改變。例如,儘管低對比度的文字不易閱讀,但也不意味著文字只能是高對比度的;儘管柱狀圖不從零刻度開始會讓人困惑,但也不是說柱狀圖只能從零開始。
我們有必要知道我們的目的是什麼。數據可視化本沒有好壞,目的不同讓它們有了好壞之分。只有理解了創作者的目的,我們才能評判可視化的好壞。
3、為什麼規則有時會相悖?數據可視化原則都是相互依存的。例如,當我遵循「網絡內容可讀性規範」增強了文字對比度後,顏色卻不太好看了。這一現象在很多專業的數據可視化作品中也很常見(如圖中圈出的)。
為什麼會這樣呢?如果沒有遵循這些規則,還算優秀的數據可視化嗎?本章我將介紹五種傳統的理論:形式主義、工具主義、表現主義、模仿主義和制度主義。這些理論有助於我們思考數據可視化規則為何會相悖。
1)形式主義
形式主義評判藝術的標準常常是:有趣嗎?元素的整合和諧嗎?顏色和形狀運用的好嗎?抽象藝術常常希望受形式主義的評判,例如這幅澳大利亞畫家Grace Crowley的作品:
同樣的,有些數據可視化也很關注美學。例如Nadieh Bremer這樣的設計師就因其極富美觀的可視化而著稱,例如她的作品《Royal Constellations》展示了歐洲目前10位世襲王室領導人與其祖先錯綜複雜的血緣關係:
↑ https://www.visualcinnamon.com/portfolio/royal-constellations
除此之外,每一個儘可能嘗試新事物的可視化也屬於這一類。大多數情況下,這樣創新的圖表可能不是最易讀的,但它絕對看起來有趣。
例如Lazaro Gamio在2017年創作的《The Emoji States of America》用emoji面部表情展現了美國各州居民的生活狀況指標,如眼袋越大睡眠時長越短,眼睛越大學歷水平越高等:
↑ https://www.axios.com/an-emoji-built-from-data-for-every-state-2408885674.html
2)工具主義
工具主義的支持者認為藝術應該具有目的性。藝術應該影響社會、對社會有益。Steve Lambert的《Capitalism works for me! True/False》就是一個很好的例子,該裝置在全世界資本主義國家中巡展,各國的觀眾們自發地走到投票裝置前思考同樣的問題:「資本主義對你來說起作用了嗎?」。
↑ https://visitsteve.com/made/capitalism-works-for-me-truefalse/
同樣的,數據可視化也可以用來產生某種社會影響、引發大眾反思。來自柏林的社會工作者利用全球氣溫光譜生成工具製作了可視化圖譜,展示了全球1850-2018年溫室效應逐漸加劇的過程,呼籲大眾保護環境。
↑ https://showyourstripes.info/
那些僅僅把「告知」作為其最大的目標,專注於向儘可能更多的讀者傳達更清晰洞察的可視化,也屬於「工具主義」的範疇。比如德國新聞網站ZEIT Online發布的德國疫情可視化,我最近幾個星期以來每天早上都會看它:
↑https://www.zeit.de/wissen/gesundheit/coronavirus-echtzeit-karte-deutschland-landkreise-infektionen-ausbreitung
3)表達主義
對於一些藝術家來說,藝術就是表達情感,很多影像藝術都是典型的例子,在Alex Prager的電影攝影中也能看出這一點:
也有很多人在利用數據創作美麗的、主觀的、有表現力的可視化。其中走在前沿的毋庸置疑是Giorgia Lupi。她2018年的作品《Bruises: The Data We Don't See》記錄了一位患有特發性血小板減少性紫癜(ITP)的女孩的治療過程。每個「花瓣」都是新的一天,花瓣上紫紅色暗斑越深代表女孩身體上的淤青越嚴重,聚集的紅點代表血小板數。僅憑臨床記錄幾乎無法捕捉到兒童疾病對家庭的影響,可視化傳達出了這些情緒。
↑ http://giorgialupi.com/bruises-the-data-we-dont-see
2017年,Giorgia寫了一份《數據人道主義宣言》,明確地宣稱數據可視化應該是主觀的,而不是公正的,數據的背後是人,而不是數字本身:
《紐約時報》的這張可視化圖顯示了美國截止4月26日所有已知死於COVID-19的人的數據。但與Giorgia Lupi的作品相反,我們對這種可視化創造者的感受知之甚少。其主要目的是喚起情感,而不是表達情感。
4)模仿主義
當你覺得藝術應該是接近真實的,那你就在無形之中具有「模仿主義」思維,也許你會喜歡超真實的作品。
↑ https://www.gautierdeblonde.com/?page_id=9
將「儘可能真實」的想法轉化到數據可視化領域非常有趣。展現數據的深度和主題的複雜性是非常具有「模仿主義」特徵的,即使這會讓圖表本身變得難懂。這讓我想起了Mark Allan Thorton 2014年創作的網絡圖《What Interest Reddit?》,它揭示了20萬Reddit用戶8400萬評論中關鍵詞的聚類和聯繫:
http://markallenthornton.com/blog/what-interests-reddit/
這種可視化沒有什麼主觀性,它只是試圖近距離和客觀地展示數據,並沒有做出自己的觀點陳述。從這個意義上說,Micah Allan的雲雨圖也算一種模仿主義,它試圖展示數據的所有細微差別,同時在數學上做出正確的聚合:
https://micahallen.org/2018/03/15/introducing-raincloud-plots/
在做模仿主義的數據可視化時,重要的是要思考分析和傳達之間的區別。在分析階段,雲雨圖確實很適合幫助你從數據中發現一些值得探索的點。但這種方式總會帶有一種目的性:你總想儘可能真實地對待數據,即便會變得不太好理解。
5)制度主義
去年,在邁阿密海灘舉行的巴塞爾藝術展上,兩根這樣的香蕉以12萬美元的價格售出。它們是好的藝術,主要因為某些人稱其為好藝術。制度主義意味著有權威的人定義什麼是好的藝術,什麼是壞的藝術。
↑ https://news.artnet.com/art-world/maurizio-cattelan-banana-explained-1732773
在數據可視化中,雖然沒有那麼極端但我們也有這種能力。我們有像凱度信息之美、Malofiej和Iron Viz這樣的獎項,也有一些社交媒體的大V,他們扮演著策展人的角色,並對數據可視化是好是壞提出自己的意見。
而在團隊或組織中時,我們也會遇到字面意義上的「制度主義」:公司和同事定義了什麼是好可視化和壞可視化。
這樣的意見其實會在無形之中影響我們。我敢打賭,如果在社交平臺上看到一個很多人點讚的數據可視化,那麼大家也會傾向於嘗試類似的東西。
4、界線是模糊的每個數據可視化都有其形式和功能,或多或少地顯示數據的真實性。通常情況下,你甚至說不出重點是二者中的哪個。
例如,Stefanie Posavec對達爾文的《物種起源》的可視化,既關注了它的形式,也展示了完整的數據,是形式主義和模仿主義的結合產物:
↑ http://www.stefanieposavec.com/entangled-word-bank
許多科學研究中的可視化都致力於顯示數據的複雜性(模仿主義),但不是為了模仿而模仿,而是因為這樣確實是有實際意義的(工具主義),例如這張截取自基因變異論文中的可視化圖表:
↑ https://academic.oup.com/bioinformatics/article/32/19/3018/2196527
我發現這些模型有助於弄清楚規則為什麼會相互矛盾,因為它們來自不同的「數據可視化理論」。我舉三個例子:
例1 可讀性 vs 好看的顏色
讓我們回到一開始提到的網頁易讀性和色彩選擇的例子。如果你通過工具主義來判斷,並希望儘可能多的人理解,那麼你就要遵循可讀性的規則;如果你是一個設計師,比如在一個作品中你想用藍色,因為你還沒有這樣做過,或者你就是喜歡這個效果,那麼你可以遵循「使用美觀顏色」的規則,這是基於形式主義的判斷。
例2 易懂性 vs 數據正確性
第二個例子是「做一個容易理解的清晰陳述」vs.「公正地對待數據的複雜性」。同時兼顧兩者幾乎是不可能的,你必須做出犧牲。
「易懂性」是典型的工具主義規則,而「數據性正確」則是模仿主義規則。對於一名數據記者來說,讓他的主流受眾容易理解數據可能是他「唯一最重要的目標」。但是對於其他人來說,可讀性可能不如對數據進行公正呈現重要。我們既可以為了美觀而創作,也可以選擇對複雜數據進行描繪,但要清楚這麼做的目的是什麼。
例3 吸引注意力 vs 避免條形競賽圖
條形競賽圖是用動畫展示發展過程的條形圖,條形圖始終按等級順序排列。
條形競賽圖真的很吸引人,它們甚至沒有操縱任何東西便吸引住了人們的注意力,是工具主義的一個很好的例子。但不得不說有些專家真的很不喜歡它們。這就是工具主義(或形式主義)和制度主義之間的衝突。
5、總結不同的目的遵循著不同的規則,數據可視化的好壞取決於你的目標和優先項,本文的五種模型:形式主義、工具主義、表達主義、模仿主義和制度主義可以幫助我們思考我們的目的是什麼。試著多問問自己:「你想讓你的數據可視化因為什麼而被評判?」
數據可視化是否應該由它的外觀來判斷(形式主義)?它們達到了什麼目的(工具主義)?它們能喚起多少情感(表達主義)?它們是對事物的真實反映嗎(模仿主義)?專家們喜歡它們嗎(制度主義)?
原作者 | Lisa Charlotte Rost
翻 譯 | 宋丹琳
編 輯 | 鄒 磊 鄭舒雅 小 唐
圖片來自:What to consider when considering data vis rules
原標題:《數據可視化有統一規範嗎?》
閱讀原文