來了?坐。歡迎來到經管小酒館。
今天給大家推薦了解大數據必讀的10本書籍。
「你現在正坐在一座金礦之上,這些金子或被深埋於備份、存檔數據之中,或正藏在你眼前的數據集裡。」大數據現在已經成為企業發展戰略中的一枚重要的「棋子」,與大數據相關的東西都變得更有價值,從市場從業人員的薪資或許就能看出來一點大數據這個「香餑餑」的地位。
大家滿懷期待的來,我們也要負責任的說明,成為大數據高手是一件非常困難的事,不可能看完這篇文章大家就能學會大數據了,但是我們是在指出一條通往大數據高手的道路,雖然其中修煉的過程極其艱辛,但是前途卻是非常光明的。沒有毅力的人,看看就好了,千萬別認真。
《大數據時代》
作者:[英]維克託·邁爾-舍恩伯格,[英]肯尼思·庫克耶
翻譯:盛楊燕,周濤
出版社:浙江人民出版社
如果你想了解大數據,肯定要從這本書入手。
讀完這本書,你對於大數據的概念應該也有所了解了,歸納一下主要是這麼幾點:
1、絕不是有很多數據就叫大數據;
2、大數據是一種數據分析方式,與傳統數據分析方式有著本質上的不同;
3、大數據的特點是「關注相關性,不關注因果」,這是大數據最核心的東西,一定要真正理解,並牢牢記住,不然你就很容易被別人忽悠;
4、大數據採用的是統計的方法;
5、大數據主要是結合人工智慧進行機器的自動數據挖掘;
6、大數據主要是用來作預測的。而不是象一般的數據分析,只是分析出歷史情況和現狀,未來還是要靠人去預測,大數據則是直接告訴你未來的結果。
同樣適合初級階段人群閱讀的書籍還有:
《大數據》
作者:塗子沛
出版社:廣西師範大學出版社
大數據浪潮,洶湧來襲,與網際網路的發明一樣,這絕不僅僅是信息技術領域的革命,更是在全球範圍啟動透明政府、加速企業創新、引領社會變革的利器。現代管理學之父德魯克有言,預測未來最好的方法,就是去創造未來。而「大數據戰略」,則是當下領航全球的先機。
《深入淺出分析數據》
作者:(美)米爾頓 著,李芳 譯
出版社:電子工業出版社
我們生活在數據的天地裡,你的工作就是淋漓盡致地發揮數據的作用。這本書以類似「章回小說」的活潑形式,生動地向讀者展現優秀的數據分析人員應知應會的技術:數據分析基本步驟、實驗方法、優化方法、假設檢驗方法、貝葉斯統計方法、主觀概率法、啟發法等等等等,總之你想要了解使用的工具都在其中。
《失控》
作者:凱文·凱利(KEVIN KELLY,很多人都親切地叫他KK)
翻譯:東西文庫
出版社:新星出版社
為什麼是這本書呢?學完初級階段要記住的幾件事還沒忘吧?對,用統計的方法而不是因果的方法,預測未來。那麼,下面我們就來看看這本書說了些什麼:
「在對預測機制進行剖析的時候,法默最喜歡用這個例子來進行說明:「來,接著!」他說著就朝你扔過來一個棒球。你抓住了球。「你知道你是怎麼接住這個球的嗎?」,他問道。「通過預測。」
……
幾乎可以明確地說,「活系統」——獅群、股票市場、進化中的種群、智能——都是不可預測的。它們所具有的那種混亂的、遞歸式的因果關係,各個部分之間互為因果的關係,使得系統中的任何一個部分都難以用常規的線性外推法推斷未來。不過,整個系統卻能夠充當分布式裝置,對未來做近似的推測。」
——摘自《失控》
「歸納」即是「統計」的意思,或者說是較粗略的統計,歸納是不問原因的,接住這個球就完了,管它是什麼原因。
你想成為大數據高手,你想用統計的方法來對某些東西進行預測?(我現在來預測下你心裡想的某些東西是什麼。股票!噢,別誇我,我只不過是歸納了很多人的想法而已。)
好了,現在你來告訴我,還有什麼理由不去好好讀這本書?
同樣適合中級階段人群閱讀的書籍還有:
《數據之美》
作者:(美)西格蘭,(美)哈梅巴赫 著
出版社:東南大學出版社
通過一系列的個人故事,你很快就會發現基於數據的工作會變得多麼廣泛和美妙。該領域的39位數據從業者解釋了他們是如何為各式各樣的項目來開發簡單而又優雅的解決方案。
《網際網路+:從IT到DT》
作者:阿里研究院
出版社:機械工業出版社
2015年,「網際網路 」寫入李克強總理的政府工作報告,「網際網路 」成為國家經濟社會發展的重要戰略。
這本書深度解析了「網際網路 」的內涵及其與雲計算、大數據、新分工網絡的關係。世界正從IT走向DT(數據技術)。IT以自我控制、自我管理為主,DT以服務大眾、激發生產力為主,未來屬於DT時代。
《重新定義大數據》
作者:大數據戰略重點實驗室
出版社:機械工業出版社
大數據是人們獲得新的認知,創造新的價值的源泉。隨著移動網際網路和物聯網的發展,數據——這個曾經被忽視的東西,現在卻得到爆發式增長。不管是消費者,還是智能設備,它們所產生的數據大大超越了人們的想像。《重新定義大數據》提出了包括:塊數據、主權區塊鏈、秩序網際網路、激活數據學、5G社會、開放數據、數據交易、數據鐵籠、數據安全、數權法這些將引領未來發展的十大新趨勢。新的大數據技術進入市場將帶來新的增長,應當如何理解與運用大數據來指導未來的發展?這一切都可以從本書中找到答案。
(PS:這本書正在熱賣中,點擊文末閱讀連結即可獲得)
《複雜性》
作者:[美]尼古拉斯·雷舍爾(NICHOLAS RESCHER)
翻譯:吳彤
學完中級階段,你接觸到了一件事,「複雜性」,知道了事情複雜到一定程度,就不可能用尋找因果的方法去進行預測。
那麼到底什麼是複雜性,它的本質和原理是什麼?想成為大數據高手,你不能對此一無所知,因為你將一輩子與複雜甚至是極其複雜的事情打交道。
如果你讀過《失控》,可能此時心裡在想:完了,中級就已經這麼燒腦,那高級豈不是要把腦燒死了。畢竟微信之父張小龍也說過,讀完這本書(就是《失控》)的人可以直接去他的公司上班,而且他說的是「讀過」不是「讀懂」。但是和這本書相比,《失控》又顯得簡單多了,讀到這兒,是不是覺得高級階段的書簡直不是人看的書。其實還是可以努力看看的,我給大家稍微介紹一下。
再試圖根據事物如何必須按照理論的一般原理發展去解決問題,而是根據事物如何在通常的情況下按照我們能夠確定的最好情況去解決問題。與其尋求抽象必然性的一般原理,不如以某種經驗主義的精神,在經驗——帶有它的全部特徵偶然性和潛在不完備性——中尋求指引。
……
(然而)機會和混沌的宇宙不是不守秩序的(無政府狀態的),而只是複雜的,通過其自然的運轉展現著更高階規律的湧現。而當形式邏輯屈從於它的經典不變性時,一種新的非經典的、多值的(或者「模糊的」)邏輯業已誕生並取而代之。確定性(certainties)也有效地被或然性(probabilities)和似真性(plausibilities)所取代。
……
鑑於在複雜世界中對行動過程做出理智選擇難免是困難的……如果我們是相信統計學結論的學者,用概率統計推斷行為的正確性,那麼事情就變得更容易處理。
——摘自《複雜性》
是不是越介紹約不明白了,不用擔心,這是高階才會接觸到的知識。學習也要循序漸進,一下跳到高階肯定是懵的。但是如果你已經熟練掌握了中階知識,那進入高階就是順理成章的事。高階涉及的內容不只是技術上的,更多的是眼界的開闊,幫你打破思想的界限,突破自身的局限性。
同樣適合高級階段人群閱讀的書籍還有:
《量子物理史話》
作者:曹天元 著
出版社:北京聯合出版公司
這本書以極具詼諧但又不乏科學嚴謹的口吻敘述了經典物理和量子力學的碰撞,以及量子力學從無到控制整個微觀世界的艱難發展歷程,回顧了一些我們曾經學過的經典實驗。
《數據挖掘導論》
作者:(美)陳封能 等
出版社:人民郵電出版社
這本書全面地介紹了數據挖掘,涵蓋了五個主題:數據、分類、關聯分析、聚類和異常檢測。這樣讀者在透徹地理解數據挖掘的基礎的同時,還能夠了解更多重要的高級主題。