公眾號幾年前開的,斷斷續續產出一些關於數據可視化的內容,後來覺得不滿意,以前寫的都是啥,就都撤掉了。
未來主要還是寫數據科學方面的東西,涵蓋數據分析、數據挖掘、數據可視化、數據產品、機器學習及深度學習等。初衷還是希望普及數據思維,希望關注的人都能學到點有用的知識。
趁著假期有時間,寫一下數據分析的書單,零基礎入門的同學可以對著看一看,推薦的都是不錯的書籍,也節省大家找書的時間。當然正如標題「深入淺出」,在考慮書單的時候儘量都是些淺顯易懂又不缺乏深度的書籍。
統計學深入淺出統計學深入淺出系列書籍,使用大量圖片和對話,使得統計理論的學習既有趣又自然。
對於入門統計學來說很重要一點就是淺顯易懂,學起來非常輕鬆,當然這本書還挺厚的,不過翻起來很快,打包票不會被勸退。
商務與經濟統計學經典的統計推斷入門教程,強調培養統計思維,有很多實際的應用案例。該書涉及描述統計、概率、各種分布、各種檢驗以及回歸,結構相比前面的書籍會更加嚴謹些。
線性代數是數學基礎中很重要的一部分,而國內教材偏向於線性代數的定義、定理及證明,卻使得內容更難理解。這本線性代數注重線性代數的方法和應用,同時也有大量的數值計算過程,是本學起來有用又有趣的教材。
本書是在MIT開設概率論入門課程的基礎上編寫的,內容全面,例題和習題豐富,結構層次性強,能夠滿足不同讀者的需求。
如果是在網際網路做數據分析,那麼SQL是一定要會的,大量數據存儲在資料庫中,不懂得如何取數,沒有統計的數據做分析就會很困難。
日系書的風格「簡潔」和「實用」,書中配套大量的示例程序和操作步驟說明,可以直接動手解決實際問題,循序漸進地掌握SQL的基礎知識和技巧,切實提高自身的編程能力。
這本是前面的《SQL基礎教程》的進階版,有更多複雜的關聯查詢,對多業務場景交叉關聯計算很有幫助。
又一本深入淺出系列書,每章節會配圖加對話,介紹數據分析的基本步驟及方法,評分稍微低了點,但是作為入門基本原則容易讀不難理解,算是足夠了。
強烈推薦想要做網際網路數據分析的同學讀下這本,書中涵蓋數據指標、商業模式、數據分析框架以及數據分析模型。
專門做客戶分析的書籍,作者具有六西格碼數據分析師的專業背景,也是客戶體驗量化分析的開拓者。從書中可以學到如何改善客戶體驗,如何收集、測量以及解讀客戶數據,如何使用數據創建良好的客戶關係,如何實現向數據導向的客戶體驗轉變。
書中涉及到的數據分析方法適合傳統行業和網際網路行業,更加適應企業的分析需求,就是評價的人太少,難道就沒人發現嗎。。
Python適用於大量數據以及複雜的數據分析場景,而常常用到的Pandas的主要貢獻者就是該書作者。本書含有很多實踐案例,用Python對數據進行處理、整理以及分析,適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程式設計師。
工欲善其事必先利其器,想做好數據分析怎麼能少了Excel呢?不被Excel玩,要玩Excel,閱「表」無數,當個「表」哥、「表」姐。該書的「三表概念」非常實用,無論是做統計報表還是分析報表。
Excel比較難在函數的應用上,特別是數據分析除了透視表還需要各種統計分析函數。該書對函數方面的理解是比較深刻的,學會後用來做日常分析足夠了。
做數據分析的時候常常需要圖表來輔助分析判斷,更加直觀的查看分析結果,另外數據報告也常常需要各種可視化圖表。
該書介紹了如何用數據講故事、可視化工具以及各種關係的數據可視化,基本可以適應絕大多數可視化的場景需求。
除了複雜或高維的數據可視化,Excel基本能完成其餘的圖表展示。該書教你如何設計和製作達到雜誌級質量的、專業有效的商務圖表,例如《商業周刊》、《經濟學人》等全球頂尖商業雜誌上的精彩圖表案例進行分析。
《數學女孩》以小說的形式展開,重點描述一群年輕人探尋數學中的美。內容由淺入深,數學講解部分十分精妙,被稱為「絕贊的初等數學科普書」。內容涉及數列和數學模型、斐波那契數列、卷積、調和數、泰勒展開、巴塞爾問題、分拆數等,非常適合對數學感興趣的初高中生以及成人閱讀。-- 豆瓣讀書
這個系列目前有四本,感興趣的可以看看,總之像讀小說一樣就是了,當然會涉及數學上的浪漫。
原刊載於谷歌黑板報,吳軍博士重寫了一遍,把高深的數學原理講得通俗易懂。讀者通過具體的例子學到的是思考問題的方式 —— 如何化繁為簡,如何用數學去解決工程問題,如何跳出固有思維不斷去思考創新。