CDA數據分析研究院原創作品,轉載要授權喲
前段時間考研結束,衷心祝願那些奮鬥數載的小夥伴們可以考到自己夢寐以求的大學。人生短暫,人間美好,希望通過努力奮鬥你我都可以體會到生活的點點滴滴。
開頭說點題外話哈哈哈,今天呢,小編想跟大家分享的是那些超級好用的數據分析軟體,好用到吹爆它,恨這麼晚才遇見。
菜單式操作軟體
電子製表軟體一哥:Excel
Microsoft Excel是Microsoft為使用Windows和Apple Macintosh作業系統的計算機編寫的一款電子表格軟體。直觀的界面、出色的計算功能和圖表工具,再加上成功的市場營銷,使Excel成為最流行的個人計算機數據處理軟體。
事實上,當數據量不大,我們常作為平日裡數據預處理的一個首選菜單式軟體,快速填充、缺失值填補、數據格式規範化等等,另外,excel強大的文本和數值處理函數也讓它在表格軟體地位不可撼動。
市場調查的寵兒:SPSS
SPSS是統計產品與服務解決方案(Statistical Product and Service Solutions)的簡稱,為IBM公司的一系列用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟體產品及相關服務的總稱。同樣是菜單式軟體spss和excel有什麼區別呢,正如我給SPSS的帽子:市場調查的寵兒。SPSS裡有一套完整的統計分析模塊,菜單式的步驟操作也讓非統計學專業的人可以自己實現一套統計分析,另外數據結果輸出窗口、數據編輯窗口的分開式安排也讓我特別喜歡,不像excel全部放在一個sheet裡。
中小型網站資料庫戀人:MySQL
MySQL在過去由於性能高、成本低、可靠性好,已經成為最流行的開源資料庫,因此被廣泛地應用在Internet上的中小型網站中。隨著MySQL的不斷成熟,它也逐漸用於更多大規模網站和應用,比如維基百科、Google和Facebook等網站
什麼?資料庫也能做數據分析?當然這裡的數據分析不是深層次的使用統計分析或者算法進行挖掘和建模,這裡的分析更多是提取有特定條件的數據,對數據進行一個簡單的摘要統計。
程式語言式軟體
統計學人自己的工具:R
R語言,一種自由軟體程式語言與操作環境,主要用於統計分析、繪圖、數據挖掘。
R基於S語言的一個GNU計劃項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不作修改的在R環境下運行。R的語法是來自Scheme。
基本上學統計學的學生都會使用R 語言做統計分析,R有一個很鮮明的地方就是R內置多種統計學及數字分析功能。
R的功能也可以透過安裝包增強(各種領域,實現各種分析功能的包真的是應有盡有)。因為S的血緣,R比其他統計學或數學專用的程式語言有更強的面向對象。
R的另一強項是繪圖功能,製圖具有印刷的素質,也可加入數學符號,所以R語言也可作為可視化工具。
數據分析網紅:python
對於python,數據科學的大佬真的視若掌上明珠,什麼「人生苦短,我學python「,什麼「學python,養發護肝」。推特上充滿了愉悅的氣味(滑稽)。
Python是完全面向對象的語言。函數、模塊、數字、字符串都是對象。並且完全支持繼承、重載、派生、多重繼承,有益於增強原始碼的復用性。Python支持重載運算符,因此Python也支持泛型設計。
可是作為膠水語言的python原生語句用來做數據分析可遠遠不夠格,pandas庫的開發和更新讓python一下子變成數據分析的流量小生,另外,scikit-learn機器學習庫也讓數據分析師對其偏愛。