三個月從小白到數據分析師,都是靠著這份書單!

2020-12-04 數據分析不是個事兒

如何快速成為數據分析師?是很多想轉行數據分析的人經常問的問題,數據分析設計多個領域的知識,內容繁雜,很多人沒有基礎的人自學起來,感覺摸不著頭腦,今天就圍繞數據分析師的成長路徑為大家整理了一個相對完整的從入門到進階的學習書單,內容較多,建議大家採取階段性學習。

數據分析基礎-統計學

統計學是數據分析方法論中的核心基礎,在數據分析的方法模型中,很大程度上都來源於統計學的方法,所以掌握統計原理是必須的。

1、《數學之美》吳軍 著

此書名為數學之美,實為信息技術(自然語言處理)中的數學原理(統計語言模型)之美。

更深刻地理解大學所學的線性代數、概率論與數理統計和應該學而沒學的隨機過程、圖論、機器學習的應用意義。

書中將高深的數學原理講得更加通俗易懂,讓非專業讀者也能領略數學的魅力。

讀者說,讀了「數學之美」,才發現大學時學的數學知識,原來都如此親切,並且栩栩如生,才發現自然語言和信息處理這麼有趣。

2、《深入淺出統計學》Dawn Griffiths 著 李芳 譯

《深入淺出統計學》具有「深入淺出」系列的一貫特色,提供符合直覺的理解方式,讓統計理論的學習既有趣又自然。

從應對考試到解決實際問題,無論你是學生還是數據分析師,都能從中受益。

3、《統計學習方法》李航 著

這本書系統地介紹了統計學習的主要方法,特別是監督學習方法,包括感知機、k近鄰法、樸素貝葉斯法、決策樹、邏輯斯諦回歸與最大熵模型、支持向量機、提升方法、EM算法、隱馬爾可夫模型和條件隨機場等。

這些是之後可以直接應用到你的數據分析項目中去的一些方法。從統計向機器學習深入和過渡,對目前目前的統計學習方法有全面的介紹。

數據分析入門

了解一部分統計學的基礎知識之後,接下來就可以正式上手學習較為基礎的數據分析知識了。

這一部分主要是了解數據分析和數據挖掘的方法、工具等理論上的東西,是為後續的數據分析實戰打好基礎。

1、《深入淺出數據分析》Michael Milton 著 李芳 譯

這本書算是數據分析入門的經典書籍了,基本上被推爛了。這本書最大的優點就是非常的簡明易懂,還給你填了很多統計方面的坑,讓沒有統計知識的你不至於一臉懵逼。

數據分析基本步驟、實驗方法、最優化方法、假設檢驗方法、誤差處理、相關資料庫、數據整理技巧等相關知識都有介紹。

2、《數據挖掘導論》Pang-Ning Tan,Michael Steinbach 範明 範宏建 譯

這絕對是你進入數據分析和數據挖掘領域的核心書籍,也是數據挖掘的入門經典。書中對數據、分類、關聯分析、聚類和異常檢測作出了細緻入微的闡述。還有一些常用的數據挖掘算法和偽代碼,可以作為延伸學習。

當然數據挖掘的東西更多的是要去理解,而不是記憶,理解理論背後的原理會讓你在後續的實戰中能夠更加得心應手。

03《數據挖掘概念與技術》Jiawei Han,Micheline Kamber 著 範明 孟小峰 譯

這本書的定位和《數據挖掘導論》的定位比較相似,都是在數據挖掘、分析技術的問題上的探討。

這本書雖然名為data mining,但其實思想都是機器學習的東西,這也可以是一個了解機器學習的不錯的切入點。

實戰-數據技術

經過前面對於數據分析和數據挖掘知識的積累,相信你已經形成了最基本的數據分析知識體系,也對數據分析的方法和流程有了較為全面的了解。那麼接下來就需要上手實踐了,做數據分析的工具有很多,比如大家常見的excel,還有python、R等程式語言,這裡首推python。

1、《利用python進行數據分析》Wes McKinney 著 唐學韜 譯

此書絕對是計算科學和數據分析經典中的經典,強大的地方在於,書中不僅建立了一個完善的python分析方法論體系,還有大量具體的實踐建議,以及大量綜合應用方法。

將學會如何利用各種Python庫(包括NumPy、pandas、matplotlib以及IPython等)高效地解決各式各樣的數據分析問題,所以這將是你真正意義上數據分析實戰的開始。

2、《python核心編程(第二版)》Wesley J. Chun 著 CPUG 譯

要用python進行數據分析,學習python這門語言是必須的了,這本書就是python編程的經典。

尤其是每一小節後面的核心筆記,講解了一些有用的編程技巧和知識,知識點非常細緻,你可以學到很多以前不知道的編程知識。

當然這本書用來掃盲可能有一定的難度,可能更適合進階,讓你打紮實python 的基礎。

3、《python數據分析與挖掘實戰》張良均 王路 等 著

從數據挖掘的應用出發,以電力、航空、醫療、網際網路、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。

通過這本書,你完全可以閱讀過程中,充分利用隨書配套的案例建模數據,藉助相關的數據挖掘建模工具,通過自己進行上機實戰掌握Python的數據分析。

補充-資料庫

在涉及到大量的數據之後,數據的存儲可能會成為你要考慮的問題,所以關於SQL方面的知識作為一個數據分析師應該有所儲備。好在這部分難度並不是很大,並且不要要特別深入的研究。

1、《深入淺出SQL》貝裡 著

非常淺顯易懂, 圖表間的注釋是本書精華所在。細緻到幾近囉嗦,小白都可以輕鬆看懂,可能是因為資料庫技術本身難度並不是特別大。

作為入門的書相當的不錯,有輔助理解的講解和例子,同時有有練習題加深記憶。但書的內容略多,如果你是需要快速學習的話,在你已經理解之後就不必過度扣細節,畢竟你可能需要更多在實戰中應用。

2、《高性能mysql》Baron Schwartz 等 著

分享MySQL實用經驗的圖書,它不但可以幫助MySQL初學者提高使用技巧,更為有經驗的MySQL DBA指出了開發高性能MySQL應用的途徑。

書中的知識點非常全面,但可能學習成本略高,並非全要掌握,作為遇到困難時的詞典查閱也不錯。

高手進階-機器學習

學完上面的書,你基本上已經能夠進行簡單的數據分析,並且能夠較為完善地操作一些簡單的數據了。

那麼機器學習這部分一定是提升你整個思維方式和數據分析水平的殺器。你將會有目的地去選擇合適的方法應用在不同的場景,分析水平得以提升。

1、《機器學習》周志華 著

簡明而深刻,厚積薄發的評註非常開拓思維,多是遊刃有餘之後才可得出的見解。

這確實是機器學習裡優秀的中文書籍了,大牛周志華將機器學習中的模型方法,應用場景、理論推導、優化過程、算法等進行了全面而細緻的講解,堆積初級的宏觀學習機器學習分析方法可以說是既簡潔而又實用。

2、《機器學習實戰》Peter Harrington 著

這本書會讓你意識到那些被吹捧得出神入化的分類算法,竟然實現起來如此簡單;那些看似高深的數學理論,其實一句話就能道明其本質;一切複雜的事物,出發點都是非常簡單的想法。

3、《集體智慧編程》TOBY SEGARAN 著

以機器學習與計算統計為主題背景,述如何挖掘和分析Web上的數據和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,並得出有用的結論。

想把 paper 上的公式轉變為可以運行的代碼,這是件考驗功力的事情這本書就是是修煉此種功力的武林秘笈之一。

最顯著的特點是,實戰性極強!針對每個算法,他從頭到尾演示了一個完整的實現過程:從獲取數據,組織存儲,到算法實現,加載運算,再到最後的結果的分析利用。

應用-商業數據分析

經過上面的技能學習,我相信你已經具備了一名數據分析師的核心技能,接下來,你就需要在專業的領域進行深耕,不斷積累技術經驗和強化業務能力。

此時許多小夥伴可能已經開始從事數據分析師的工作,而數據分析這項技能所能進入的行業範圍廣,涉及的領域也非常多,你可以根據自己的業務方向來進行書籍的選擇,下面推薦的則是比較通用的。

1、《精益數據分析》Alistair Croll 等 著 韓知白 王鶴達 譯

這本書裡講解了創業公司該如何確定指標體系,如何用數據指導產品和運營。本書還針對電商、媒體、SaaS、雙邊市場、UGC等,列舉了要關注的指標,並有豐富的案例。

整個書的內容比較散,但依舊是講網際網路產品數據分析方面非常好的書了,對於想就職網際網路數據分析的人來說非常實用。

2、《網站數據挖掘與分析》宋天龍 著

本書是目前網站數據挖掘與分析領域最具系統性、深度和商業實踐指導價值的著作,由來自在線數據分析領域巨擘Webtrekk的官方資深數據分析專家撰寫。

本書從認知、技術、應用、管理和工具5個維度對網站數據分析進行了全面的講解。具體內容包括: 科學地認識網站的數據分析 ; 從零開始建立企業數據體系 ; 網站數據採集和配置等。

3、《數據分析:企業的賢內助》陳哲 著

本書章節邏輯清晰,從企業的一個個具體的需求出發,使讀者對數據分析的了解循序漸進,將複雜的數據分析知識體系串成有機的整體。

以企業經營中的案例為依託,將複雜的數據分析知識巧妙地融入其中,完整呈現數據分析項目的流程,系統闡述數據分析的專業思路、方法和技能!

這一套推薦下來,需要讀的書並不少,不要覺得頭大,其實根據推薦的步驟已經給出了一條明確的學習路徑,即「統計學基礎-常用模型理論-程式語言和資料庫技術-機器學習方法」。

這些書不必一一啃下來,以所列出的技能為目標學習即可。已經學過的知識也不必回爐重造,比如你之前就有統計的基礎,那麼統計學部分的書你就沒必要看了。

但更重要的是,不要只看書,要儘快讓自己步入實踐階段。數據分析作為一門技術,只有在不斷地操作當中才能掌握真正的技巧和方法,將知識學以致用。

最後,希望大家在成為數據分析師的路上越走越遠~

(附:詳細推薦書單目錄)

本文中部分書籍,可轉發文章並在後臺私信我「書籍」領取!

相關焦點

  • 數據分析師必讀的養成書單!
    但是當你的潛意識和頭腦都能真心覺得讀書這件事太好了,而且執行起來並沒有想像中那麼難,時間自然就會來到你的面前。讀書的好處切切實實存在,它可以慢慢改變你,讓你從1.0升級到2.0、3.0,乃至無限大的N.0。以下是今日推薦的7本書,建議收藏喔~1.
  • 2020年怎麼能成為數據分析師,你想了解的都在這裡
    我們通常了解數據分析師首先我們要知道:數據分析師是幹什麼的?數據分析師的薪資?數據分析師需要的技能?數據分析師這個職業是越老越吃香的,就是因為隨著年限的增加,他的業務知識、他的思考的方式都是一直在積累,這些都是分析師很珍貴的東西。
  • 什麼樣的人適合學習數據分析?小白如何自學數據分析?
    主圖時下的大數據時代與人工智慧熱潮,有很多人對數據分析感興趣,卻下手無從。零基礎小白剛接觸數據分析會有這樣的疑問,沒有數學基礎,可以學習數據分析嗎?如何找到一份數據分析的實習呢?一、什麼叫做數據分析數據是21世紀最性感的行業,生活在大數據年代,需要用到數據去解決問題,並且支持決策,數據分析從廣泛上來理解,不僅包含數據分析師這個崗位,同時更多的是一種技能,無論從事什麼行業什麼崗位,都可以通過學習這種技能,來提高自己的工作效率,增強自己對於數據的洞察能力,而這個能力,無論是在工作學習還是生活中,都能起到很大的作用。
  • 女生適合做數據分析嗎?數據分析師是否是青春飯?
    在當下大數據分析與人工智慧火熱發展的的浪潮下,數據分析師或大數據分析師已然成為當前炙手可熱的熱門就業職位之一,就業待遇和發展前景也是被好多人看好,於是乎想進入數據分析行列的人群也日益增加,很多女生也會蠢蠢欲動,想轉行或立志從事數據分析領域的工作,但顧慮也由此產生——女生適合做數據分析嗎?
  • 「361行」新職業②在頂級電競俱樂部當數據分析師是種什麼樣的體驗?
    中午起床吃飯,到第二天凌晨兩三點睡覺,每天訓練超過10個小時,這是電競選手的日常,同樣也是王炎的日常。但王炎不是電競選手,而是RW電競俱樂部的英雄聯盟數據分析師。去年,國家人社部將電子競技員列為新職業,其中電競數據分析師也是屬於電子競技員的細分崗位。電競數據分析師跟傳統體育項目的數據分析師有什麼不同?怎樣成為電競數據分析師?
  • 轉行數據分析師後悔了?脫穎而出才是關鍵!
    轉行這個詞彙,一直是職場上此起彼伏的一個熱門話題,相信很多朋友都想過或已經經歷過轉行。工作可謂是我們生存乃至生活的主要收入來源,誰都希望擁有一份高薪又穩定的工作,以此來改善自己的生活和實現自己的大大小小的夢想!
  • 數據分析師的80%時間都在清洗數據?到底怎麼洗?
    就拿做飯打個比方吧,對於很多人來說,熱油下鍋、掌勺翻炒一定是做飯中最過癮的環節,但實際上炒菜這個過程只佔做飯時間的20%,剩下80%的時間都是在做準備,比如買菜、擇菜、洗菜等等。  在數據分析中,數據清洗就是這樣的前期準備工作。對於數據分析師來說,我們會遇到各種各樣的數據,在分析前,要投入大量的時間和精力把數據「整理裁剪」成自己想要或需要的樣子。
  • BI數據分析師,一個正在被悄悄淘汰的職業
    請容許我先再此插播一段故事論壇朋友L兄是一名BI數據分析師,原來在T公司上班。工作不複雜甚至可以說簡單,就是給業務人員調取數據。做了大概一年時間,之後L兄就覺得這個工作太過機械化,對自己的成長沒有什麼實際意義,因此就跳槽到了公司A。
  • 這份書單,是對心靈雞湯的反抗
    五年前,快手短視頻的用戶數從1億漲到3億,抖音短視頻軟體也上線不久,沒有人能夠想像到短視頻軟體和直播行業會如此深刻地改變人們的生活——就像當年十五歲的丁真無法想像到,在他20歲時,一段短暫的直播出鏡之後,他能夠獲得海量的關注。今年,「出圈」的一切,都似乎成為了當下焦慮的映照。
  • 數據分析入門學習指南,零基礎小白都能輕鬆看懂
    數據分析在如今的求職場上越來越重要。然而,讓很多朋友困惑的是,我是沒有編程基礎的小白,能學會數據分析麼?該如何學習數據分析呢?其實,如果你打算成為一名數據分析師,如何出身並不重要,數據科學是一門應用學科,你需要系統提升數據獲取、數據分析、數據可視化、機器學習的水平。下面我就簡單提供一個數據分析入門的路徑。
  • 怎樣從數據分析師轉型數據科學家?
    數據分析師的首要作業是對數據進行搜集和處理,並通過統計算法分析已處理的結構化數據,從而為數據賦能,改進決策。數據科學家也會進行相似的作業,但對其提出了更高的要求。那麼,怎樣從數據分析師轉型數據科學家呢?
  • 數據科學家和數據分析師的區別在哪兒?
    數據科學家和數據分析師的區別在哪兒?數據科學家和數據分析師在所用程式語言、平臺/工具,以及所解決的問題方面都有共同之處。2、SQL,SQL是你從事數據科學必備的技能。工作中數據集往往不會直接發給你的,這跟學術界不同,你需要通過SQL獲得自己的數據集。現在有很多SQL的分支,比如PostgreSQL、MySQL、Microsoft SQL Server T-SQL,以及Oracle SQL。它們都屬於同一種查詢語言,形式接近,但平臺不同。因此,會其中任何一種就行,換到另一種SQL很容易。
  • 如何成為一名數據分析師?
    這是一個用數據說話的時代,也是一個依靠數據競爭的時代。目前世界500強企業中,有90%以上都建立了數據分析部門。IBM、微軟、Google等知名公司都積極投資數據業務,建立數據部門,培養數據分析團隊。各國政府和越來越多的企業意識到數據和信息已經成為企業的智力資產和資源,數據的分析和處理能力正在成為日益倚重的技術手段。
  • 從零開始數據分析:一個數據分析師的數據分析流程
    幫助數據分析師更有針對性的控制數據生產和採集過程,避免由於違反數據採集規則導致的數據問題;同時對數據採集邏輯的認識增加了數據分析師對數據的理解程度,尤其是數據中的異常變化。在數據採集階段,數據分析師需要更多的了解數據生產和採集過程中的異常情況,能很大程度上避免「垃圾數據進導致垃圾數據出」的問題。2.
  • 博睿同創|數據分析師需要考證嗎?
    # 一、需求是最好的引導 當我們在各大招聘網站搜索數據分析相關職位的時候,可以看到一般要求是運用大數據分析工具解決業務問題,以及所需要具備的數據分析相關的技能以及各大企業侃侃而談的邏輯思維、表達能力等等,似乎都沒有要有數據分析師證書這項要求
  • 從零開始數據分析:一個數據分析師的數據分析流程 | 網際網路數據...
    幫助數據分析師更有針對性的控制數據生產和採集過程,避免由於違反數據採集規則導致的數據問題;同時對數據採集邏輯的認識增加了數據分析師對數據的理解程度,尤其是數據中的異常變化。在數據採集階段,數據分析師需要更多的了解數據生產和採集過程中的異常情況,能很大程度上避免「垃圾數據進導致垃圾數據出」的問題。2.
  • 「興·閱讀」 | 青年大學習,線上推好書~這份書單快快收好(一)
    「興·閱讀」 | 青年大學習,線上推好書~這份書單快快收好(一) 2020-04-23 16:25 來源:澎湃新聞·澎湃號·政務
  • 一名數據分析師的「實戰解碼」
    中部戰區空軍雷達某旅數據分析師劉志成(右一)指導戰勤參謀完成作戰課題研究。喜歡數據、追逐數據、痴迷數據,這是劉志成給許多人留下的第一印象。走進劉志成辦公室,記者一眼就發現了「不一樣」:他的電腦桌上,有橫豎兩塊屏幕。豎屏上,爬滿了正在仿真推演的信息數據;橫屏裡,排列著10多項與數據相關的課題。再仔細一看,每項課題的「完成時限」都精確到了某一天。
  • 挫折中成長——數據分析師面經
    、「某大廠放出的這個崗位好心動啊」…… 在這個蠢蠢欲動的時候,一個從業 2400 天的分析師小前輩,來給大家介紹一下數據分析師崗位的面(cuo)試(zhe)經(gu)驗(shi)。
  • 數據分析師入坑指南
    從2015年回國加入百度,我已經在分析師這個行業工作了5年,也算是個milestone了。恰逢最近總有親戚家小孩請教畢業後怎麼找一份數據分析師的工作,而我在分析師的招聘方面也有一定的經驗,所以今天就來寫一寫我的想法。專業要求幾乎沒有要求,我曾經問過周圍的數據分析師, 大家的專業還是挺具有差異化的。