大數據奇葩說:盤點10個有趣的大數據

2021-01-12 中關村在線

  大數據早已成了我們耳熟能詳的詞彙,大數據也逐漸得到的政府,企業和個人的重視。基於此,大數據究竟在如何影響著我們的生活?(以下圖片來源:baidu.com和yandex.ru)


大數據(Big data)

  因為他,我們的生活是否變得更舒適?亦或,從此我們的生活細節都要暴露在數據的分析之下?我們該如何正確認識大數據?現在,先讓我們了解一些真實的大數據的例子。

  從地球到月球的距離

  如果我們將一天內產生的數據全部燒錄進DVD光碟內,那這些光碟疊起來可以搭成地表到月球的DVD高塔,而且還是雙塔。

  大數據與星星

  根據IDC的分析,2008年時數碼數據量就超過了目前已知的宇宙內星星數量,而且以數據成長的速度,2023年時全球數據量將會超過亞佛加厥常數(Avogadro's number)--也就是6.022×10^23。

亞佛加厥常數

  男性內褲銷量反映經濟形勢

  已故美聯儲前主席格林斯潘(Alan Greenspan)曾提出過一個著名的"男性內褲銷量反映經濟形勢"的理論。即經濟形勢良好,內褲銷量會平穩上升,反之則下降。

  原因很簡單,經濟蕭條時,男性會節儉開支,少買內褲。。。

  啤酒與尿布

  這是個經典的商場數據分析案例。在上世紀90年代,美國沃爾瑪的超市管理人員分析銷售數據時發現了一個令人難於理解的現象:在某些特定的情況下,"啤酒"與"尿布"兩件看上去毫無關係的商品會經常出現在同一個購物籃中。

啤酒與尿布

  在美國有嬰兒的家庭中,一般是母親在家中照看嬰兒,年輕的父親前去超市購買尿布。父親在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相干的商品經常會出現在同一個購物籃的現象。

相關焦點

  • 盤點 大數據應用之10個趣味大數據案例
    大數據早已成了我們耳熟能詳的詞彙,大數據也逐漸得到的政府,企業和個人的重視。基於此,大數據究竟在如何影響著我們的生活?
  • 10個「大」數據盤點2016猴年春節
    新華社北京2月14日電 題:10個「大」數據盤點2016猴年春節  新華社「新華視點」記者  2016猴年春節7天假期結束。「新華視點」記者通過10個大數據勾勒這個春節發生了哪些新變化。  (數據3)271個城市空氣品質超標:「春節霾」較去年明顯加劇  環境保護部監測數據顯示,2016年除夕夜——2月7日19時至2月8日6時,338個地級及以上城市監測結果顯示,271個城市空氣品質超標,其中47個城市空氣品質達到嚴重汙染,92個城市空氣品質為重度汙染。
  • 數據 25個令人大開眼界的大數據現象及有趣事實
    隨著巨量數據時代來臨,大數據一詞已經十分普及,甚至有些被濫用的趨勢。在這個時代,切身體會到「大數據」貨真價實的存在、以及解讀大數據的潛力成為我們的重要課題。  在此整理了 25 個所謂的「大數據現象」及「大數據事實」(Big Data fun facts)並附上數據來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。  我們現在每兩天產生的數據量是相當於過去到 2003 年為止累積的數據量。
  • 25 個令人大開眼界的大數據現象及有趣事實
    隨著巨量資料時代來臨,大數據一詞已經十分普及,甚至有些被濫用的趨勢。在這個時代,切身體會到「大數據」貨真價實的存在、以及解讀大數據的潛力成為我們的重要課題。在此整理了 25 個所謂的「大數據現象」(Big Data phenomenon)及「大數據事實」(Big Data fun facts)並附上資料來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。1、我們現在每兩天產生的資料量是相當於過去到 2003 年為止累積的資料量。
  • 甜點 25個令人大開眼界的大數據現象及有趣事實
    在這個時代,切身體會到「大數據」貨真價實的存在、以及解讀大數據的潛力成為我們的重要課題。  在此整理了 25 個所謂的「大數據現象」及「大數據事實」(Big Data fun facts)並附上數據來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。我們現在每兩天產生的數據量是相當於過去到 2003 年為止累積的數據量。
  • 最奇葩的撤稿理由——我們的數據被新冠大流行吃掉了
    但更令人關注的是,面對質疑,第一作者聲稱由於Covid-19大流行的限制使得他們無法恢復原始數據。這恐怕是小編見過的最奇葩的撤稿聲明。根據科睿唯安的Web of Science中的記錄,這篇論文已被引用了16次。
  • 什麼是大數據?大數據正在吃掉你的隱私?
    近幾年來,網際網路行業發展風起雲湧,而移動網際網路、電子商務、物聯網以及社交媒體的快速發展更促使我們快速進入了大數據時代。但你真的了解大數據嗎?什麼是大數據大數據。他是數據的集合,簡單來說就是體量巨大的數據。
  • 大數據是什麼?大數據時代四個特點
    大數據是什麼?其實很簡單,大數據其實就是海量資料巨量資料,這些巨量資料來源於世界各地隨時產生的數據,在大數據時代,任何微小的數據都可能產生不可思議的價值。大數據有4個特點,為別為:Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值),一般我們稱之為4V。
  • 大數據掃盲——什麼是spark
    關於大數據技術之前的文章裡已經提到了HDFS和MapReduce。HDFS解決了大數據的存儲問題,MapReduce解決了大數據的運算問題。既能存儲又能運算,貌似這樣已經很完美了。比如這兩天發生的郭某鵬事件(郭某鵬返鄭後被查出隱瞞境外行程,但3月10日8時,經大數據比對,發現其有境外旅居史,公安民警和社區工作人員趕至居住地,由120救護車將郭某鵬轉運至二七區集中隔離點)。但是MapReduce也有「不稱職」的時候。MapReduce只能進行離線運算(數據要先存儲到硬碟上,然後在運算),而且延遲較大,不能實時運算。
  • 移動醫療大數據的幾個偽命題:大數據的陷阱與小數據的重要性
    當然把大量的人的小數據整合起來可以視為大數據分析,但是前文Dr.2也說過,有的時候整體平均趨勢對個人是無價值的,甚至有害的。前天看個笑話,有個身高1.8米的人問大數據科學家能不能過前面這條河,科學家經過全河流域的大數據分析後,得出平均水深1.2米,於是他放心地趟過去,結果淹死了!
  • 2020百度沸點,10億網民搜索大數據鑄就權威社會風向標
    「但隨著項目的進行,關注和參與的網友越來越多,我們也越來越意識到在百度搜索數據的背後,不單單只是一次次普通的搜索行為。每一次搜索的發生,都代表著一個個鮮活的個體行為。他們不僅關心娛樂,更關心社會民生。」尹英利說。從2011年起,百度沸點榜單的內容開始涵蓋國民生活的方方面面,綜合呈現網民一年內在各個領域中最關注的焦點議題。
  • 大數據開發和大數據分析有什麼不同?
    大數據分析工程師和大數據開發工程師分別能做什麼?通俗解釋開發和分析非要把他倆分開的話,一個是偏向於數據,一個偏向於工程。好比要炒個菜,工程師是燒火、墊勺的那個,偏向於工具的使用。分析師是放調理、掌握火候的那個,偏向菜怎麼做好吃。數據影響生活數據越來越多的影響並塑造著那些我們每天都要交互的系統。
  • 來自大數據的反思:需要你讀懂的10個小故事
    甚至,《大數據時代》的中文版翻譯者周濤亦在序言裡說,「放棄對因果關係的追求,是人類的墮落」。對於這個觀點,李國傑院士認為【10】:在大數據中,看起來毫不相關的兩件事同時或相繼出現的現象比比皆是,相關性本身並沒有多大價值,關鍵是找對了「相關性」背後的理由,才是新知識或新發現。
  • 《兔博士地產大數據奇點研究院大數據報告會》房產成交周期或可...
    金評媒(https://www.jpm.cn) 編者按:近日,兔博士「地產大數據奇點研究室」發布了《房產成交周期特徵大數據報告》。「房產成交周期數據」可成為人們買房、賣方交易中的重要參考指標。  對此,參與該課題研究的謝明結合上述報告總結了目前行業的幾大指徵。  一線城市裡,深圳房產成交周期最快  謝明指出,成交周期會受總價格分段/面積分段/房型/房齡/裝修程度等影響。通過大數據的整理,在七大房產熱門城市中,成交周期最快的城市並不是北京或上海,而是深圳。
  • 大數據思維養成從認識大數據的本質開始
    大數據思維養成從認識大數據的本質開始 發布時間: 2020-04-26 11:58:50   來源:  作者:   踐行數據的商業價值,理解大數據的本質,從哪裡開始?應該從認識不確定性開始。
  • 大數據人才缺口這麼大,現在轉行大數據容易嗎?
    隨著國家信息的高速發展和人工智慧的興起,從2016年開始全國各大高校陸續開設了大數據專業,但主要還是985/211院校居多,這意味著大數據專業設立時間短而且不是所有的學校都有,直接結果就是畢業生數量不能滿足市場需求。另外大數據覆蓋範圍很廣泛,比如電商,金融,醫療,交通,農業等各行各業都有應用,所以市場缺口大,崗位需求多。
  • 12個頂級大數據工具 - 大數據_CIO時代網 - CIO時代—新技術、新...
    而在這些工具中選擇是一個挑戰,特別是許多大數據工具只具有單一用途,而企業需要使用大數據完成許多不同的任務,因此企業的分析工具箱會變得過於充實。根據這個行業領域的專家顧問的建議,以下列出一系列主要的大數據分析工具,並列出三個主要類別。
  • 什麼是大數據,權威專家談大數據的4V1C特質
    國內知名大數據專家、中科院計算所博士、職品匯創始人龔才春博士對此做了詳盡的分析,他指出:「從常規定義來講,大數據就是大小超出常規資料庫工具獲取、存儲、管理和分析能力的資料庫,並且也強調,不是說一定要超過特定TB的數據集才是大數據。這個定義並沒有詮釋什麼是常規的資料庫工具,也沒有詮釋大數據與數據量的關係,是一個比較原始的大數據定義。」
  • 大數據時代:十大最熱門的大數據技術 - 大數據_CIO時代網 - CIO...
    隨著大數據分析市場快速滲透到各行各業,哪些大數據技術是剛需?哪些技術有極大的潛在價值?根據弗雷斯特研究公司發布的指數,這裡給出最熱的十個大數據技術。   1、預測分析   預測分析是一種統計或數據挖掘解決方案,包含可在結構化和非結構化數據中使用以確定未來結果的算法和技術。
  • MapGIS 10.5大數據產品功能提升
    全市數以萬計的計程車運行軌跡展現在一張城市地圖上,每一個光點都代表著一輛計程車,一個個光點連成一道道絢麗的光線,道道光線交織點亮了城市夜晚的道路,繪製出一幅靈動多彩的圖畫,以別樣的方式展現城市的繁華,讓人們得以洞悉城市奧秘。這就是GIS與大數據技術與融合迸發出的魅力!