現在的疫情傳播中,類似下圖的作品很多。
這是用線性比例尺表示的累計確診數量。從圖中看到,確診曲線隨著時間推移劇烈攀升。而1月20日前,曲線幾乎是貼著x軸的,乍看似乎為0,實則是因為後面的數值過大,而被壓縮得看不出來具體數值。
有沒有什麼製圖方式可以解決這個bug?如何在一張圖中看到小數據的變化?我們需要了解對數比例尺。
什麼是對數比例尺?
對比下面兩張圖,可以幫助你快速理解對數比例尺。
上圖是最為常見的製圖,下圖則使用了對數比例尺。從下圖可見,大約1月18日起,國內累計確診數呈現指數型增長,2月中旬後逐漸放緩。從100人到1000人,大約花了14天;而從1000人到1萬人,花了16天左右。之後增長進入平臺期,人數未突破10萬。
或許你已經發現,用下邊的方式,似乎可以更清楚地找到疫情拐點。
兩張圖最大的區別,在於Y軸。對數比例尺的Y軸,呈指數增長。什麼是指數增長?問出這個問題,說明你和我一樣一度喪失了高中數學記憶。
傳染病有一個術語是「基本傳染數R0」,即一個感染者,平均傳染多少個人。R0 > 1,則傳染病會以指數方式散布。R0值越大,傳染病則越難控制。假設新冠肺炎的R0值為2,則一個患者平均傳染2人,這2人又會傳染另外4人,以此類推,這樣的增長就是指數增長。
我們可以用下面這張圖來解釋線性比例尺和對數比例尺之間的區別。
在線性比例尺中,假設間隔為1,那麼每增加一個間隔,數值加1;在對數比例尺中,假設底數為10,那麼每增加一個間隔,數值乘以了10。
也就是說,線性比例尺中,數值等距以等差方式逐步累加;對數比例尺中,數值以指數方式逐步疊加。
什麼時候可以使用對數比例尺?
除了表示指數增長外,對數比例尺還有一個用法,用於差距劇烈的數據。就像在文章開頭所說的,由於疫情數值變化太大,1月20日之前的曲線貼近x軸,可能會使得讀者誤以為數值為0,而使用對數比例就能解決這個問題。
同樣,它對蘋果公司股價也適用。在下半部分的對數比例圖中,我們能讀出股價增速的變化,還能清晰地看到2005年以前的數據,而在上半部分的線性比例中,這部分的數據也存在著貼近x軸的問題。
數值差異過大的問題,可能出現在任何含有數軸的圖表中。比如下面這張《紐約時報》的散點圖,x軸為基本傳染數R0,y軸為致死率,其意圖是給出預測的「新冠肺炎」致死率及R0範圍(表示「新冠肺炎」的點落在紅框範圍內),和歷史上的其他傳染病互相對照。
請仔細看圖,這張圖的x軸表示R0,採用的是線性比例,而y軸表示致死率,採用的是對數比例。
對數比例尺還經常出現在意想不到的地方。下圖為安徒生童話裡的性別用語詞頻,需要注意的是,y軸是詞頻的排名,而非詞頻本身,即越貼近x軸的詞語排名越高,使用的頻率也越高(圖中,左列的男性性別詞語的使用排名遠高於右列女性詞語)。
圖中正是使用了對數比例尺,才使得詞頻排名差距極大的詞語可以清晰地顯示在同一個空間。別小看這輕微的斜率,差距可不小。例如斜率較大的men-women那條線,兩個詞語的排名可差了大好幾百。
對於讀者來說,理解這樣的量級變化,有一定的門檻。不然你們為啥需要我呢?(一個卦姐的微笑)
對數比例尺之下的疫情
回到這次疫情的數據可視化,《金融時報》就交出了幾乎完美的答卷。其可視化團隊的成員Burn-Murdoch利用對數比例尺,觀察了重點疫區的數據。下圖的x軸以確診案例超過100例的那天為起點,把多個國家和地區放在了同一個起跑線上,可以輕鬆比較疫情發展的快慢。從圖中可以看出,伊朗和義大利的擴散速度很快,而中國香港、新加坡、日本已經控制住了疫情。
作為對比,我們製作了一張全球疫情圖,同樣使用對數比例尺。首先很明顯,中國疫情開始較早,目前新增確診逐漸清零,疫情進入平臺期,和其他國家拉開了差距。
再從大洲來看,中國受災,首當其衝的是往來最為密切的亞洲國家,而後逐漸波及歐洲、美洲、大洋洲和非洲。在圖中,我們可以看到,2月底開始,疫情逐漸擴散到新一批國家中,線條越來越密集,不難理解,為什麼到了3月12日,世衛組織會宣布新冠疫情為「全球大流行」。
而對比下面這張線性比例的確診病例圖,由於數值差異過大的問題,損失了很大一部分信息,而且讀者還可能認為相比中國,其他國家的疫情都不嚴重。
總結
相信閱讀了這篇文章的你,一定已經非常了解對數比例尺了。它主要有兩個用途:
1. 表示指數增長,傳染病的傳播就是典型的指數增長案例;
2. 應用於數值差異很大的數據,可以緩解數值被壓縮導致的可見性變弱的問題。
運用了對數比例尺的圖表,仿佛被添加了一個魚眼鏡頭。通過這個稜鏡,我們可以更直觀地比較出各國疫情發展的快慢,以及發現疫情的階段性特徵。
對數比例尺非常有用,但並不能被所有人理解,在使用時還是需要慎重,考慮好受眾是誰。如果非常希望運用對數比例尺,可以在圖中添加適當的視覺指引。
現在,花火也支持一鍵切換對數比例尺了。一鍵變身對數比例尺,你值得擁有哦!
當班卦姐/ 雞丸、傑英、賽艇
運營/ 雞丸、fff凡