數據 25個令人大開眼界的大數據現象及有趣事實

2021-01-20 裡屋裡

  隨著巨量數據時代來臨,大數據一詞已經十分普及,甚至有些被濫用的趨勢。在這個時代,切身體會到「大數據」貨真價實的存在、以及解讀大數據的潛力成為我們的重要課題。

  在此整理了 25 個所謂的「大數據現象」及「大數據事實」(Big Data fun facts)並附上數據來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。

  我們現在每兩天產生的數據量是相當於過去到 2003 年為止累積的數據量。


  根據 IDC,現今世界上 90% 的數據量是在過去兩年多裡所產生的。


  根據 UCSD 的研究調查,2008 年光美國居民就生產了 3.6 ZB 的數據量。


  2016 年的網絡流量將會到達 1.3 ZB(Zettabyte = 10^21 bytes)。


  根據 IDC 跟 EMC 的研究分析,估計了 2020 年時,數碼數據量將會從 3.2 ZB 成長到 40 ZB。


  企業所獲取且儲存的數據量每 1.2 年就雙倍成長。


  每分鐘世界上有近 2 億封 E-mail 被寄出,也就是每天 2470 億封 E-mail,不過其中 80% 是垃圾信件。


  每分鐘 Youtube 影片被上傳超過 100 個小時,而且每天上傳的影片量要花你 15 年的時間來看完。


  如果我們將一天內產生的數據全部燒錄進 DVD 光碟內,那這些光碟疊起來可以搭成地表到月球的 DVD 高塔,而且還是「雙塔」。


  每天每分鐘有約 570 個新網站出現。


  大數據飛快成長,到 2015 年,為了處理大數據,全球多出了 4.4 百萬個 IT 職位,也因此這方面的專業人士缺口,各行各業都在搶奪大數據專家 >> 還沒決定未來方向的學子們不妨考慮這個領域。


  根據 McKinsey Global Institute 的數據,到 2018 年時,美國地區將面臨 14 萬到 19 萬的大數據專業人才短缺,以及 1 百 50 萬個擁有洞察大數據的能力、因而做出好的企業決策管理階層人才。


  目前世界各地的數據中心(超過 50 萬個)加起來相當於 6000 個足球場的大小。


  從 2012 年到 2014 年,行動裝置上傳輸的數據量成長了 81%,達到 1.5 Exabytes (Exabytes = 10^18 bytes),其中 53% 來自影音數據。


  NSA 每天得分析 1.6 % 的全球網絡數據量 —— 約 30 PB (Petabytes = 10^15 bytes)。


  Hadoop 被公認為大數據主流技術(請參考文章:認識大數據的黃色小象幫手 –– Hadoop),根據市場研究機構 Allied Market Research,Hadoop 市場價值從 2013 年 20 億,估計到了 2020 年時會飆漲到 500 億。


  根據 IDC 的分析,2008 年時數碼數據量就超過了目前已知的宇宙內星星數量,而且以數據成長的速度,2023 年時全球數據量將會超過亞佛加厥常數(Avogadro's number)—— 也就是 6.022 × 10^23。


  由於物聯網的蓬勃發展,智慧型裝置的數量將會從現在到 2020 年將從 130 億成長到 500 億。


  在加州及一些其他地區,大數據已經被用來建立模式、預測犯罪,而且比現今的其他預測技術來得準確。(有興趣請參考相關文章:英美城市用大數據,揪出未知的細菌、罪犯與惡棍交易員)


  根據 Tata Consultancy Services Limited(TCS)在 2013 年發表的研究,各企業的數據裡 51% 是結構化數據、27% 是非結構化數據、21% 是半結構化數據。


  有將近 75% 的企業表示將逐漸增加對大數據的投資。


  根據 CIO 的報告,38% 的機構根本不知道大數據是什麼,27% 的機構對大數據則是一知半解。


  根據 EMC2 的報告,25% 的企業已經有聘請數據科學家,24% 的企業正在使用大數據分析工具,57% 的企業則在慎重考慮採用大數據分析工具。


  如果大數據能善加利用在醫療領域,以美國地區為例,將會減少 8% 的醫療開銷並省下 3000 億美元。


  最近幾年來,已經有 5 億美元的風險投資基金注入大數據科技公司裡。

相關焦點

  • 25 個令人大開眼界的大數據現象及有趣事實
    在此整理了 25 個所謂的「大數據現象」(Big Data phenomenon)及「大數據事實」(Big Data fun facts)並附上資料來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。1、我們現在每兩天產生的資料量是相當於過去到 2003 年為止累積的資料量。
  • 甜點 25個令人大開眼界的大數據現象及有趣事實
    在這個時代,切身體會到「大數據」貨真價實的存在、以及解讀大數據的潛力成為我們的重要課題。  在此整理了 25 個所謂的「大數據現象」及「大數據事實」(Big Data fun facts)並附上數據來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。我們現在每兩天產生的數據量是相當於過去到 2003 年為止累積的數據量。
  • 大數據奇葩說:盤點10個有趣的大數據
    大數據早已成了我們耳熟能詳的詞彙,大數據也逐漸得到的政府,企業和個人的重視。基於此,大數據究竟在如何影響著我們的生活?(以下圖片來源:baidu.com和yandex.ru)大數據(Big data)  因為他,我們的生活是否變得更舒適?亦或,從此我們的生活細節都要暴露在數據的分析之下?我們該如何正確認識大數據?
  • 盤點 大數據應用之10個趣味大數據案例
    大數據早已成了我們耳熟能詳的詞彙,大數據也逐漸得到的政府,企業和個人的重視。基於此,大數據究竟在如何影響著我們的生活?
  • 如何發現數據報告中的事實:單指標模型
    如果沒有重視找出事實的步驟,那你後面出來的見解,可能會出錯、片面或一知半解,甚至所謂的見解,其實還是事實而已。 例如你下屬給你做好了圖表後,下屬告訴你圖上看到本月較去年同期下滑了25%,其實這就是在告訴你事實,而事實上我們要的是結論。
  • 關於人類行為的8種以上的心理彎曲事實
    了解一些最令人大開眼界和有趣的心理學事實,可能會在很多方面震驚您。什麼是心理學?簡而言之,心理學是對人的研究。他們是誰。他們如何以及為什麼表現自己的行為方式。它分析了我們的思維方式。作為有意識的人類,我們所做的一切都與心理學有關。
  • 25個冷知識:學校裡不大可能學到,但真實存在於世界的有趣事實
    25個學校裡不大可能學到,但卻真實存在於世界的有趣事實。睡覺一·長期趴在桌子上睡覺會使面部變形。
  • 大數據篇:一文讀懂@數據倉庫
    然而隨著資料庫使用範圍的不斷擴大,它被逐步劃分為兩大基本類型:操作型資料庫(OLTP)主要用於業務支撐。一個公司往往會使用並維護若干個資料庫,這些資料庫保存著公司的日常操作數據,比如商品購買、酒店預訂、打車下單、外賣訂購等;分析型資料庫(OLAP)主要用於歷史數據分析。
  • 關於伯裡克利的30個有趣和有趣的事實
    請看下面有關.伯裡克利的30個有趣且有趣的事實。1.伯裡克利對雅典社會產生了如此深遠的影響,當代歷史學家修昔底德稱他為「雅典的第一位公民」。2.伯裡克利將德利安聯盟變成了一個雅典帝國,並在伯羅奔尼戰爭的頭兩年帶領他的同胞。
  • 移動醫療大數據的幾個偽命題:大數據的陷阱與小數據的重要性
    上一篇我們提到,在醫療大數據項目中,很多情況下,由於無法驗證有效性、敏感性和特異性,所以即使得出了100個結果趨勢,卻沒有幾個是有臨床參考意義的,就是說即使看起來是那麼一回事,又怎麼樣,能反過來指導臨床嗎
  • 14個超有趣的數據科學項目,數據集都準備好了!
    對於對數據,數據分析或數據科學感興趣的人,我們提供了一份可以利用業餘時間完成的數據科學項目清單,一共14個! 這是一個有趣的項目,可以利用Plotly或Matplotlib數據可視化工具來可視化野火的規模和對地理的影響。
  • CPDA數據分析師講堂:如何避免大數據項目的危害
    來源:CPDA數據分析師網 / 作者:數據君 /一些組織並不僅僅是為了增強現有系統來處理大數據相反他們將其現有系統替換為使用Hadoop生態系統技術和/或基於雲的數據平臺構建的大數據湖,您如何避免陷阱和危害,從而可以利用大數據來獲得更多的客戶見解,改善運營並實現其他關鍵目標
  • 《兔博士地產大數據奇點研究院大數據報告會》房產成交周期或可...
    金評媒(https://www.jpm.cn) 編者按:近日,兔博士「地產大數據奇點研究室」發布了《房產成交周期特徵大數據報告》。「房產成交周期數據」可成為人們買房、賣方交易中的重要參考指標。  對此,參與該課題研究的謝明結合上述報告總結了目前行業的幾大指徵。  一線城市裡,深圳房產成交周期最快  謝明指出,成交周期會受總價格分段/面積分段/房型/房齡/裝修程度等影響。通過大數據的整理,在七大房產熱門城市中,成交周期最快的城市並不是北京或上海,而是深圳。
  • 兩南出學霸、北方人顧家,大數據背後各地男女的有趣特點
    找個什麼樣的另一半,到哪去找心儀的人,這是一個千古話題。中國這麼大,東西南北中,咱得瞄準了找。央視財經《中國經濟生活大調查(2019—2020)》在大數據背後發現了不同地域男女的有趣特點。原來北方人挺顧家大調查發現,如果休閒時間宅在家,有接近一半的(46.3%)中國人會選擇做家務。《中國經濟生活大調查(2019—2020)》數據顯示,吉林、河北、內蒙古這三個地方的男人最愛做家務,而最喜歡做家務的女人則是內蒙古、山西、河北偏多。
  • 14個超有趣的數據分析項目,數據集都給你整理好啦
    轉載自大數據文摘 對於那些對數據,數據分析或數據科學感興趣的人,提供一份可以利用業餘時間完成的數據科學項目清單,一共14個!3個數據集可以用於創建一些有意思的可視化效果並加到你的簡歷中。
  • 什麼是大數據?大數據正在吃掉你的隱私?
    近幾年來,網際網路行業發展風起雲湧,而移動網際網路、電子商務、物聯網以及社交媒體的快速發展更促使我們快速進入了大數據時代。但你真的了解大數據嗎?什麼是大數據大數據。他是數據的集合,簡單來說就是體量巨大的數據。
  • 大數據是什麼?大數據時代四個特點
    大數據是什麼?其實很簡單,大數據其實就是海量資料巨量資料,這些巨量資料來源於世界各地隨時產生的數據,在大數據時代,任何微小的數據都可能產生不可思議的價值。大數據有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般我們稱之為4V。
  • 大數據在反腐上的數據應用
    2019-05-08 16:43:25 來源: 寒武紀大數據 舉報
  • 從數據可視化到交互式數據分析
    (點擊連結可以看看最近在現代藝術博物館展出的照片check this recent one exposed at MOMA)(2)解釋現象第二個用途是使用圖形圖表來說明一些複雜的想法,現象或過程。這是一個圖形表現的領域:人類是視覺生物,所以一張圖片有時勝過千言萬語。
  • APP大數據「殺熟」現象頻現,您被「割過韭菜」嗎?
    APP大數據「殺熟」現象頻現,您被「割過韭菜」嗎?元,嚴重懷疑被平臺方使用「大數據」進行「殺熟」。《財經》E法特約評論員、對外經濟貿易大學法學院副教授張欣也指出,平臺企業利用大數據技術對消費者進行歧視性定價的事件近年來層出不窮,眾多網友曾指出餓了麼、京東、攜程、飛豬、去哪兒等知名平臺公司均存在大數據殺熟現象,雖歷經多次曝光,但並未有實質性改善。