如果說,數據分析是一種工具和手段,一種生產過程,那麼分析結果的呈現就可以說最終的產品,也就是報告。從產品的思路來講,這個報告,有沒有可讀性,故事性,能不能讓讀者一目了然的明白數據間蘊含的趨勢和複雜意義,直接影響了數據分析工作的成敗!
但從我們自身的閱讀情況看,圖像永遠比文字來的更有力度。就像漫畫書永遠比純文字的書本,更讓人感興趣。所以如何能把數據可視化呈現給讀者,就是整個數據分析工作最後的,也是最重要的一環。
一、數據處理
數據處理是對數據的採集、存儲、檢索、加工、變換和傳輸。它的基本目的是從大量的、可能是雜亂無章的、難以理解的數據中抽取並推導出對於某些特定的人們來說是有價值、有意義的數據。
數據處理是系統工程和自動控制的基本環節。數據處理貫穿於社會生產和社會生活的各個領域。數據處理技術的發展及其應用的廣度和深度,極大地影響了人類社會發展的進程。
二、可視化工具
1、現成的工具
(1)Excel :最常用工具,不用多說,每一個數據分析入門的人都應該掌握。只不過excel所支持的圖表類型比較少,圖表也不夠美觀,如果想做酷炫美觀的可視化大屏是遠遠不夠的。
(2)Google Spreadsheets:可以理解為excel的雲版本,所有的數據全都在google伺服器上,所以你只要有網絡,隨時可以通過自己的帳號做數據工作。
(3)Smartbi:該軟體設計過程可視化,滑鼠拖拉拽即可快速完成數據集準備、可視化探索和儀錶盤的製作,豐富的可視化展示。可以把excel文件,文本文件,資料庫文件導入然後生成各種圖形。
2、編程工具:這部分就是進階的數據分析師要掌握的內容了,在此僅做簡單梳理
(1) Python和Java:這兩個就不用多說了吧。
(2) PHP:比較適宜web的程式語言。
(3)processing:適合各類設計師和數據藝術家,編程邏輯簡單易學,效果好。
(4)Flash 和 Actionscript
(5)HTML、Javascript 和 CSS
(6)R:這是統計學家比較喜歡使用的語言,免費、開源,圖形功能強大,可以說專為 數據分析而生。 但是缺點也比較明顯:只能在桌面運行,不適於動態網頁。而且不善於創建可交互的圖形或動畫。
3、繪圖軟體:從編程工具生成的圖片,雖然能夠解決基本需求,但是和美觀基本上就無緣了。所以如果為了更好的視覺效果,我們還應該考慮美化圖片。簡言之即用來作圖的軟體,通常是指計算機用於繪圖的一組程序。
(1)Adobe Illustrator:這個軟體和Photoshop最大的區別在於它能提供矢量圖,這樣你就不用擔心圖片放大後會因為解析度的原因出現討厭的鋸齒。
(2)Inkscape:基本都能實現Illustrator的功能,最關鍵是:免費噠!
(3)Corel Draw
不過,大家在面對各種不同的需求,用到的工具當然是不盡相同的,專業的數據分析師可能會用一些程式語言製作他們的可視化圖表;如果是業務人員的話,對代碼一竅不通,又想省時省力,就可以嘗試用可視化工具。舉例來說,如果你想創建一個動態的可視化報表,那麼你可以先用Excel準備好你所需要的數據,然後用Smartbi創建一個自助儀錶盤,通過拖拽的方式,給你的數據用合適的圖表類型呈現出來,自己DIY出屬於你自己的可視化圖表。