想學數據分析卻不知道看什麼書,為你推薦精選書單

2020-12-16 DataHunter

數據分析師越來越火了,小夥伴們想要在眾多求職者中脫穎而出,就要多看相關書籍並不斷總結從而提升自己的競爭能力。可是數據分析相關書籍那麼多,如果全部看一遍,估計不吃不喝也得好多年吧……為此寵粉的小編特地找了大佬們推薦的書籍,終!於!整理出了這份數據分析師必備的書籍清單。趕快收藏啦~

本次書單推薦包含「入門篇」、「進階篇」、「高階篇」,適用於不同層次的學習者。請大家對號入座,收好適合自己的修煉秘籍吧~

入門篇

1.《誰說菜鳥不會數據分析》

推薦理由:基於通用的Excel工具,在8個章節中,分別講解數據分析必知必會的知識、數據處理技巧、數據展現的技術、通過專業化的視角來提升圖表之美、數據分析報告的撰寫技能以及持續的修煉。讀者完全可以把這本書當小說來閱讀,跟隨主人公小白,在Mr.林的指點下輕鬆掌握數據分析的技能,提升職場競爭能力。

2.《深入淺出數據分析》

推薦理由:數據分析入門第一本。通俗簡單,卻能夠讓讀者對數據分析的相關概念有大致的了解,詮釋了數據分析的基本步驟,實驗方法,最優化方法/假設檢驗法/貝葉斯統計法/等等方法論,還有數據整理技巧,這個太重要了,為讀者搭建了走向深入研究的橋梁。

3.《深入淺出統計學》

推薦理由:號稱「文科生也能看懂」的統計書。儘管閱讀容易,但所講的知識在數據分析中都是常見且必須掌握的,比如基本的統計量,基本上每個分析項目中都會用到;比如基本的概率分布,總體與樣本的概念、置信區間、假設檢驗、回歸分析,都是關於數據分析的統計學知識。

4.《赤裸裸的統計學》

推薦理由:作者年輕時是個追求學習意義的學霸,後來自己從統計學中發掘了很多可以應用到生活的地方。這也是本書的主旨,結合生活講解統計知識,生動有趣。可以避免統計學一上來就大講貝葉斯概率和隨機分析的枯燥。

進階篇

一、數據分析—Excel

1.《EXCEL數據處理與分析實戰技巧精粹》

推薦理由:詳盡的實例,精彩的講解,細緻的描述,多角度的剖析,融匯Excel Home萬千問題與答案,彰顯Excel豐富內涵。相信本書是你愛不釋手、輕鬆辦公的利器。

2.《Excel VBA從入門到精通》

推薦理由:本書分為五篇,其中第一篇是VBA基礎知識篇,主要內容包括VBA的概念、宏和VBA開發環境;第二篇是VBA基礎語法篇,主要內容包括VBA語法基礎、VBA基礎語句、程序結構控制語句、過程、Sub與Function過程;第三篇是Excel VBA對象篇,主要內容包括Excel VBA對象模型和應用程式對象、工作簿對象、工作表對象、單元格對象和圖表對象;第四篇是VBA高級應用篇,主要內容包括自定義Excel 2010的用戶界面、工作表控制項、界面設計、XML與VBA、加載宏和資料庫編程等;第五篇是綜合實例與面試問答篇,主要講解了成績管理系統和日程安排表兩個綜合實例,並提供了30多個近幾年各大公司經常考察的面試題。

二、數據分析—R

1.《R語言實戰(第2版)》

推薦理由:本書從解決實際問題入手,儘量跳脫統計學的理論闡述來討論R語言及其應用,講解清晰透澈,極具實用性。作者不僅高度概括了R語言的強大功能、展示了各種實用的統計示例,而且對於難以用傳統方法分析的凌亂、不完整和非正態的數據也給出了完備的處理方法。第2版新增6章內容,涵蓋時間序列、聚類分析、分類、高級編程、創建包和創建動態報告等,並分別詳細介紹了如何使用ggplot2和lattice進行高級繪圖。通讀本書,你將全面掌握使用R語言進行數據分析、數據挖掘的技巧,並領略大量探索和展示數據的圖形功能,從而更加高效地進行分析與溝通。

2.《統計建模與R軟體》

推薦理由:書中結合數理統計問題對R軟體進行科學、準確和全面的介紹,以便使讀者能深刻理解該軟體的精髓和靈活、高效的使用技巧.此外,還介紹了在工程技術、經濟管理、社會生活等各方面的豐富的統計問題及其統計建模方法,通過該軟體將所建模型進行求解,使讀者獲得從實際問題建模入手,到利用軟體進行求解,以及對計算結果進行分析的全面訓練。

三、數據分析—Python

1.《利用Python進行數據分析(原書第2版)》

推薦理由:本書由Python pandas項目創始人Wes McKinney親筆撰寫,詳細介紹利用Python進行操作、處理、清洗和規整數據等方面的具體細節和基本要點。第2版針對Python 3.6進行全面修訂和更新,涵蓋新版的pandas、NumPy、IPython和Jupyter,並增加大量實際案例,可以幫助你高效解決一系列數據分析問題。

2.《Python數據分析從入門到精通》

推薦理由:對於希望使用Python來完成數據分析工作的人來說,學習IPython、Numpy、pandas、Matplotlib這個組合是目前看來不錯的方向,本書就是這樣一本循序漸進的書。內容精練、重點突出、實例豐富,是廣大數據分析工作者必備的參考書,為讀者能真正使用Python進行數據分析奠定基礎。

3.《Python數據挖掘:概念、方法與實踐》

推薦理由:本書使用Python程式語言和基於項目的方法介紹多種常被忽視的數據挖掘概念,如關聯規則、實體匹配、網絡分析、文本挖掘和異常檢測。每個章節都全面闡述某種特定數據挖掘技術的基礎知識,提供替代方案以評估其有效性,並用真實的數據實現該技術,幫助你「知其然,知其所以然」,從而邁向數據挖掘專家的道路。

四、數據分析— SPSS

1.《SPSS統計分析基礎教程》

推薦理由:本書改變了以往SPSS書籍對統計理論和軟體操作「兩條主線、各自表述」的編寫方式,將這兩者完全融合了起來。它以SPSS 12.0為準,針對統計初學者和SPSS初級用戶的需求,以統計理論為主線,詳細介紹了在SPSS中的界面操作、數據管理、統計圖表製作、統計描述和常用單因素統計分析方法的原理與實際操作。其內容完全覆蓋目前國內大部分專業本科統計課程的教學範圍,並結合SPSS的強大功能作了很好的擴展。全書內容深入淺出,風格簡潔明快,是一本難得的統計理論與SPSS操作相結合的統計參考書。

2.《Discovering statistics using spas》

推薦理由:國外的一些入門書籍很容易上手, 在學術論壇和知乎等頁面都有網友推薦這本書。國外圖書價格偏貴,但是據說某寶的PDF版很便宜。

3.《問卷統計分析實務: SPSS操作與應用》

推薦理由:本書的內容架構,在於完整介紹問卷調查法中的數據處理與其統計分析流程,統計分析技術以SPSS統計軟體包的操作界面與應用為主,內容除基本統計原理的解析外,著重的是SPSS統計軟體包在量化研究上的應用。

五、 數據分析—SAS

1.《The little SAS book》

推薦理由:內容不深,但是全面、實用,很經典的一本書,適合初學者看。英文版讀得太累可以搜一下中文版。

2.《SAS統計分析應用》

推薦理由:本書基於SAS 9.1.3中文版本編寫,介紹了SAS Learning Edition基於窗口點擊式環境以及Base SAS、SAS\STAT的用法。全書以統計分析方法為主線,通過大量實例,詳細介紹了SAS程序設計方法及各種統計過程適用條件和使用方法,並對統計過程實例的輸出結果做了詳盡的解釋。

3.《SAS統計分析與數據挖掘》

推薦理由:從SAS編程出發,用案例形式介紹SAS數據挖掘在各領域的廣泛應用,全書分為SAS基礎篇、提高篇及應用篇,每章均給出大量分析案例。

六、數據分析—SQL

1.《SQL必知必會》

推薦理由:本書是深受世界各地讀者歡迎的SQL經典暢銷書,內容豐富,文字簡潔明快,針對Oracle、SQL Server、MySQL、DB2、PostgreSQL、SQLite等各種主流資料庫提供了大量簡明的實例。與其他同類圖書不同,它沒有過多闡述資料庫基礎理論,而是專門針對一線軟體開發人員,直接從SQL SELECT開始,講述實際工作環境中最常用和最必需的SQL知識,實用性極強。通過本書,讀者能夠從沒有多少SQL經驗的新手,迅速編寫出世界級的SQL!

2. 《SQL基礎教程》

推薦理由:本書介紹了關係資料庫以及用來操作關係資料庫的SQL語言的使用方法,提供了大量的示例程序和詳實的操作步驟說明,讀者可以親自動手解決具體問題,循序漸進地掌握SQL的基礎知識和技巧,切實提高自身的編程能力。在每章結尾備有習題,用來檢驗讀者對該章內容的理解程度。另外本書還將重要知識點總結為「法則」,方便大家隨時查閱。

3.《高可用MySQL:構建健壯的數據中心》

推薦理由:本書是「MySQL High Availability」的中文翻譯版,主要講解真實環境下如何使用MySQL的複製、集群和監控特性,揭示MySQL可靠性和高可用性的方方面面。本書由MySQL開發團隊親自執筆,定位於解決MySQL資料庫的常見應用瓶頸,在保持MySQL的持續可用性的前提下,挖潛各種提高性能的解決方案。

七、數據挖掘

1.《數據挖掘導論(完整版)》

推薦理由:本書全面介紹了數據挖掘,涵蓋了五個主題:數據、分類、關聯分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章。前一章涵蓋基本概念、代表性算法和評估技術,而後一章討論高級概念和算法。這樣讀者在透徹地理解數據挖掘的基礎的同時,還能夠了解更多重要的高級主題。

2.《數據挖掘概念與技術(原書第3版)》

推薦理由:本書完整全面地講述數據挖掘的概念、方法、技術和最新研究進展。本書對前兩版做了全面修訂,加強和重新組織了全書的技術內容,重點論述了數據預處理、頻繁模式挖掘、分類和聚類等的內容,還全面講述了OLAP和離群點檢測,並研討了挖掘網絡、複雜數據類型以及重要應用領域。

3.《大數據:網際網路大規模數據挖掘與分布式處理(第2版)》

推薦理由:暢銷書全新升級,新增影響與同質性、社交媒體推薦和行為分析等超實用內容,涵蓋解決數據挖掘核心問題所用算法,及實際應用數據挖掘所需知識,理論與實現並重。史丹福大學數據挖掘方向專家Jure Leskovec、Anand Rajaraman、Jeffrey David Ullman重磅力作。

八、數據可視化

1.《數據可視化之美》

推薦理由:在本書中,20多位可視化專家包括藝術家、設計師、評論家、科學家、分析師、統計學家等,展示了他們如何在各自的學科領域內開展項目。他們共同展示了可視化所能實現的功能以及如何使用它來改變世界。成功的可視化的美麗之處既在於其藝術設計,也在於其通過對細節的優雅展示,能夠有效地產生對數據的洞察和新的理解。

2.《用數據講故事》

推薦理由:本書通過大量案例研究介紹數據可視化的基礎知識,以及如何利用數據創造出吸引人的、信息量大的、有說服力的故事,進而達到有效溝通的目的。具體內容包括:如何充分理解上下文,如何選擇合適的圖表,如何消除雜亂,如何聚焦受眾的視線,如何像設計師一樣思考,以及如何用數據講故事。本書得到了國內數據分析大咖秋葉、範冰、鄧凱的推薦。

3.《ggplot2:數據分析與圖形藝術》

推薦理由:ggplot2 是最優秀的數據分析可視化工具之一,這本書系統地講解了 ggplot2 的基本原理和具體操作,書中有大量的例子,也可以下載原始碼。更建議直接學習英文版的教材(如果英文過關的話)。

九、報告撰寫

《麥肯錫教我的寫作武器》

推薦理由:本書分為基礎篇和實踐篇兩部分,結合實際案例,系統地介紹了運用邏輯思考,製作一份兼具邏輯力與明確表達力的精彩商務文案所需的諸多方法,如金字塔原理、MECE原則、分辨問題類型的高杉法、SCQOR故事展開法以及具體製作報告與簡報的方法等,讓你學會邏輯思考方法、提高寫作能力的實用工具書。

高階篇

1.《精益數據分析》

推薦理由:此書優勢在於將企業分成了幾個大的行業類別,並分門別類的講解了每個行業的商業模式特點及分析技巧,對使用者的分析能力要求較高,且必須具備相應的業務知識。書中並沒有講到具體的數據分析技術,主要分析了各種產品中用到的指標、模型和「數據驅動型產品」的一些思路。

2.《數學之美》

推薦理由:本書把高深的數學原理講得更加通俗易懂,讓非專業讀者也能領略數學的魅力。讀者通過具體的例子學到的是思考問題的方式 —— 如何化繁為簡,如何用數學去解決工程問題,如何跳出固有思維不斷去思考創新。

3.《集體智慧編程》

推薦理由:本書以機器學習與計算統計為主題背景,專門講述如何挖掘和分析Web上的數據和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,並得出有用的結論,通過複雜的算法來從Web網站獲取、收集並分析用戶的數據和反饋信息,以便創造新的用戶價值和商業價值。全書內容翔實,包括協作過濾技術(實現關聯產品推薦功能)、集群數據分析(在大規模數據集中發掘相似的數據子集)、搜尋引擎核心技術(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息並進行分析統計得出結論的優化算法、貝葉斯過濾技術(垃圾郵件過濾、文本過濾)、用決策樹技術實現預測和決策建模功能、社交網絡的信息匹配技術、機器學習和人工智慧應用等。

4.《機器學習》

推薦理由:展示了機器學習中核心的算法和理論,並闡明了算法的運行過程。本書綜合了許多的研究成果,例如統計學、人工智慧、哲學、資訊理論、生物學、認知科學、計算複雜性和控制論等,並以此來理解問題的背景、算法和其中的隱含假定。

5.《R數據分析——方法與案例詳解(雙色)》

推薦理由:R是屬於GNU系統的一個自由、免費、原始碼開放的軟體,用於統計計算和統計製圖。這本書從實用的統計研究角度逐例分析R在數據處理、模型構建、以及圖形操作上的由淺入深的結合,堪稱經典。

6.《Python高級數據分析:機器學習、深度學習和NLP實例》

推薦理由:本書介紹了基於Python的高級數據分析,探討了Neo4j、Elasticsearch和MongoDB等資料庫,討論了如何實現包括主題爬取在內的ETL技術,並用於高頻算法交易和目標導向的對話系統等領域;還介紹了一些機器學習概念(如半監督學習、深度學習和NLP)的例子;同時涵蓋了重要的傳統數據分析技術,如時間序列和主成分分析等。

以上就是小編整理的書單啦,你還推薦哪些數據分析相關的書呢?歡迎留言交流~

-數據分析展示就用DataHunter-

相關焦點

  • 想做數據分析師,學資料庫看什麼書?
    在大數據處理當中,資料庫起到非常關鍵的支持性作用,不管多大規模的數據處理,都要基於資料庫存儲才能執行,尤其是在大數據時代,大規模數據存儲,對於資料庫支持也有了更高的要求。那麼零基礎學資料庫看什麼書?今天我們為大家帶來資料庫入門書單推薦。
  • 書單丨想學心理學卻不知道該看什麼書?7本經典心理學書籍推薦
    越早懂點兒心理方面的知識,越能幫助你更好地處理日常生活中遇到的各種難題。本期推薦7本超經典的心理學必讀書目,任意一本都值得你一讀再讀,這份書單,建議你收藏!閱讀本書,不僅能讓人明白什麼是科學的心理學,還能夠為自己所從事的心理學工作找到依據,並能激發心理學的研究熱情,促進更多新的、對實踐有指導價值的研究出現。
  • 入門必備|大佬們推薦的 Python 書單匯總
    作者 | 蘇克1900來源 | 高級農民工摘要:此文主要針對想入門 Python 但不知道看什麼書好和有選擇糾結症的童鞋,大佬們可繞道。轉眼也到了年終,這一期換個話題,圍繞這幾個問題:「學習 Python 該看哪些書?
  • 培養孩子閱讀習慣,推薦這些書,不看必讀書單
    現在大家都知道閱讀是很重要的事情,所以要從小抓起。順勢,官方或民間機構,乃至大V都會推薦所謂的「必讀書單」。必讀的意思,是不讀不行,有強制的味道。家長們都很忙,也不太能分辨,一般就是推薦了,就買回來給孩子讀。但是這個書單有多少實際價值,我們很難判斷。
  • 數據分析必看的十本好書,看完學不會你來找我|文末有福利
    在數據分析行業裡待了近十年,最近好多人想要讓我整理書單出來,幫助大家進行數據分析的入門學習。其實書不在多,而在於精,尤其是對於數據分析來說,重要的不是看了多少書,而是從書中獲得了多少數據分析知識,掌握了多少分析技能,學會了多少分析思維。
  • 學習咖啡看什麼書?從業十年咖啡師推薦的書單,趕緊收藏吧!
    作為一個過來人,今天給大家推薦一份咖啡學習書單!抓緊收藏吧!一、韓懷宗 《精品咖啡學》上下兩冊咖啡學習的書單如果沒有韓懷宗老師的書,那一定是不合格的,這套《精品咖啡學》全書共分上下兩冊,一直都是被奉為咖啡學習的教科書。上冊偏重理論知識,就算是咖啡小白,也能對咖啡有個大概的認知。
  • 數據分析師的入門書單,請收好
    數據分析是一門專業且跨越多個領域的學科,電商行業的數據分析師要了解的業務,一定和金融行業的有很大不同。所以相應的業務知識也是大不相同。這份書單,只是在初學數據分析的思維模式、統計學和應用工具上,為大家進行一個整理,如果大家有更好的,可以推薦給小編!
  • 留美必讀丨十所美國頂尖大學閱讀榜書單推薦,打開你思想的維度
    專業相關的書單推薦為了讓大家可以容易地找到所感興趣專業的書目,更好更明確地知道自己心儀專業將來要所涉及的書籍,學姐特地從這些美國頂尖大學的授課大綱的必讀書單裡,整理出來了每個專業對應的書籍推薦:英語寫作類目的書,大家無論打算學什麼專業都可以(都需要!)看看。進入大學以後,會發現寫作要求會陡然提高很多。千萬不要以為託福SAT滿分就all set了。以英語為母語的頂尖美國高中生進入大學都會發現很難寫出達標的學術論文。
  • 書評《世界圖畫書閱讀與經典》——圖畫書界的超級書單,彭懿推薦
    看書名就知道,這本書講的是圖畫書,此書分上下篇。上篇主題「閱讀圖畫書」:包括什麼是圖畫書,圖畫書的組成部分以及圖畫書的內容構成。有哪些經典圖畫書書單,求推薦?圖畫書都有哪些權威獎項,求推薦?放心吧,不用求推薦,你想要的答案,這本書裡都有。你看,作者解讀的63本經典圖畫書,就是一個很好的書單。
  • 2019年書單:我讀了40多本書,想推薦這10本給你
    ——魯巴金你的氣質裡,藏著你讀過的書,走過的路,愛過的人。一個人讀什麼類型的書,取決於當時有什麼樣的困惑或者感悟。而通過整理一年的書單,正好回顧這一年的心路歷程。都說好書貴在精不在多,可惜的是,現在很多出版社的營銷水平太強大,對書的推介往往言過其實,導致這一年看了不少不怎麼樣的書。梳理完我的2019年書單,精讀和泛讀總計有40多本,值得推薦的卻僅有10本。下面按照不同類型,分三部分推薦給大家。
  • 想學理財,不知道看什麼書?這裡有你想要的!
    大家好,我是大老師,今天我給大家帶來的是關於理財的書籍推薦。上篇文章說了我們接觸理財的一部分原因,那如果你對理財感興趣,但是不知道從何下手,怎麼辦?小編在這裡給大家整理了基本不錯的書籍,希望有興趣的人可以買實體書或者在網上閱讀。
  • 兩百多份書單告訴你:宣傳幹部在讀什麼書
    擴充更新知識結構 努力成為行家裡手  看了這些書單,如果你以為宣傳幹部們只看那些看起來很高大上的理論文學作品,那你就錯了。因為熱播的同名電視劇,路遙的小說《平凡的世界》也在宣傳幹部的書單裡火了。此外,《麥田裡的守望者》、《大數據時代》、《貨幣戰爭》、《世界是平的》、《明朝那些事兒》、《富爸爸窮爸爸》、《幸福的方法》、《教父》、《人性的弱點全集》、《百年孤獨》、《致加西亞的信》等等暢銷書,你在讀,他們也在讀。宣傳幹部們同樣緊跟時代發展,努力學習新知識、新理論。他們的閱讀面非常廣泛,涉及各個學科門類。
  • 澎湃精選|赤戟的十二月推書單(2018)
    澎湃精選,本來是赤戟在澎湃新聞的每月約稿,所以首發澎湃新聞。每期九本,選擇那些超過50萬字,連載或完本的優秀作品,用作推薦!選書範圍是海納百川,不管是遠古佳作,還是近期熱書,亦或是冷門經典,都有可能入選澎湃精選。
  • 13本語言學好書推薦丨書單
    趙平安先生《隸變研究》一書多有發明,富於新意,無論在深度或廣度方面都超過了前人,是這項研究的一次突破。此書初次出版至今已有二十餘年,在海內外影響頗大,已被翻譯成英文、韓文等文字。二十餘年間頻出的新材料,直接或間接佐證了書中的觀點。《隸變研究(修訂版)》,改定了前出版本之訛誤,修訂部分觀點,重新摹寫了字形及構件等,並精選與本書研究直接相關的重要圖版附於書前,新增附錄文章,以加深對隸變的理解。
  • 結果偏見:為什麼不推薦你看成功學的書?
    最近認識一些新朋友,對方知道我喜歡看書,便讓我推薦了幾本。我說了幾個書名之後,他困惑地問我,「老師,沒有成功學的書嗎?」我果斷搖搖頭。我為什麼從來不推薦身邊的人看成功學的書?賣個關子,先講一個小故事吧。
  • 書太多,不知道讀什麼好?看這篇就夠了
    上期的漫遊指南分享了 忙碌一天裡,如何找到讀書的時間,這次想和大家聊聊 選書的事情。很多人知道讀書好,卻不知道看什麼。按著市面上暢銷排行榜和微博上五花八門的書單,買回來一堆。她來聊聊自己是如何找到喜歡的書。全文3600字,真的很有用。找到自己喜歡的書,沒那麼難文/法雅經常有朋友會這樣問:「你最近在看什麼書?能不能給我推薦一本?」我不會給別人一個固定的書單。
  • 不知道如何選書單,家長只要選對一套書,就能幫孩子提高語文成績
    我們很多家長都發愁孩子的閱讀,知道中小學階段的閱讀重要性,但卻做不好。於是你可以看到很多五六年級的小學生,語文成績不行,缺乏閱讀的積累,家長著急,又不知道該怎麼辦。眼看升入了中學,更沒有時間花在語文學習上,沒有閱讀的基礎,語文成績越來越差。學科之首都學不好,其他學科也不會好到哪裡去。
  • 哈佛學霸在看什麼書?調查發現:名列前茅的孩子,書單都極其相似
    美國哈佛大學曾做過一項調查顯示:智商和成績都名列前茅的學生,閱讀書單裡歷史書籍出現的最多。今年清華新生的在收到錄取通知書的同時,也都收到了清華校長為他們準備的一本書——《萬古江河》,並且附贈自己寫的一封信,說希望他們可以「從歷史文化中汲取力量」。
  • 三個月從小白到數據分析師,都是靠著這份書單!
    如何快速成為數據分析師?是很多想轉行數據分析的人經常問的問題,數據分析設計多個領域的知識,內容繁雜,很多人沒有基礎的人自學起來,感覺摸不著頭腦,今天就圍繞數據分析師的成長路徑為大家整理了一個相對完整的從入門到進階的學習書單,內容較多,建議大家採取階段性學習。
  • 讀好書,跟「爛書」說拜拜 |2月書單
    ——趙忠祥《華西都市報》報導有些人看書,不會自己精挑細選,而是別人推薦什麼就看什麼;或者在網上,被某個書名簡介吸引,下單購買。結果看了開頭,就想睡覺……也有一些人,喜歡讀書,也的確讀了很多書,但是工作表現平平,生活毫無起色,用行動在詮釋什麼叫「讀了很多書,依然過不好這一生」。