從美國大選預測分析,聊聊數據分析的7個段位

2021-01-09 人人都是產品經理

編輯導讀:美國大選進入倒計時,網友們都在熱火朝天地討論誰會是最後勝出的人選,他們有的憑靠「第六感」預測,有的拿出數據圖力證……本文作者通過對這些預測方案的梳理,對他們數據分析的段位進行了「點評」,一起來看看~

2020年美國大選馬上就要揭曉結果了,最近大選預測的文章好多。看了幾篇,發現預測大選的方法和數據分析挺像。

總結了幾種預測,差不多是青銅到王者都有,一起看看這些分析都有哪些類型。

01 青銅

青銅級的分析選手會說:美國大選不在乎到底誰最後贏得了總統。不管是川普還是拜登,對華的政策都是巴拉巴拉巴拉巴拉,他們都會延續巴拉巴拉巴拉。

這些分析如果拿到中美關係的發展趨勢下,沒什麼問題。但是在預測美國大選誰會當選的問題下,這個問題就顯得很奇怪了,因為他們連問題都沒搞清楚。

我們問的是誰會當選?你回答的是誰當選都一樣。

當然,他們這麼寫更多的是給熱血讀者看的。在這個層面上,回答的其實很好。

對於數據分析來說,這種直接青銅級,完全答非所問。

02 白銀

白銀級選手會這麼說:此次美國大選,雙方都有機會。

民主黨的拜登為什麼會贏?因為大家都煩川普、民調佔優巴拉巴拉,說一些拜登能當選的原因。

然後話鋒一轉,再說川普也不是沒有機會。川普在2016年就創造了奇蹟,這次的民調依然不能作為證據,然後再說川普可能當選的原因。

總結來說,這類預測是說兩邊都有機會。

白銀級的這個回答呢,至少會圍繞問題回答。雖然沒有正面回答,但至少他告訴了我,兩邊各自的優勢和缺點,還是帶來一些信息的,所以算是白銀級。

03 黃金

黃金級別的選手:會明確的告訴你預測到底是川普還是拜登贏。

有些支持川普,會把支持川普的證據擺出來,比如紅脖子的支持,民調的不靠譜,美國的割裂等等。

有些支持拜登,會說川普疫情的糟糕表現,民調的結果,辯論的良好表現等等。

這些分析確實給了一個明確的答案,也給出了些理由,似乎沒什麼問題。

但是支撐他們結論的理由往往都是觀點,而不是事實。這些觀點,要深究下去有很多邏輯問題。

所以這種分析啊最多算黃金級。

04 鉑金

鉑金選手會用事實來證明觀點。

我昨天看到篇文章說川普一定能贏。給的理由是什麼呢?他用了谷歌的搜索指數,川普的搜索指數一直要比拜登的更高。

而且他還分析得很細,考慮到美國選舉的選舉人制度,必須把州的情況考慮進來。於是他把每個州的數據都畫出來了,結論依然是支持川普能贏。

鉑金選手已經開始有數據的意識,會用事實來證明他的結論。但是這個谷歌指數跟投票之間到底有沒有必然的關聯?這個沒有給出證明,邏輯上有一定的漏洞。

這篇文章本來還收藏了,準備寫文章的時候截個圖,結果今天已經被刪了。

總的來說已經開始有數據分析的思維了,就是細節沒做好,給個鉑金。

05 鑽石

來到鑽石組,這個級別開始靠譜起來了。

鑽石選手呢,會列舉目前提前投票的數據,列出各個州不同的投票人數,以及目前的投票比例。依靠這些數據算出最終的選舉人票,然後給出了一個結論,目前是誰更有優勢。

這種分析已經開始進入數據分析的範疇了,相比鉑金選手好的地方是鑽石選手用的數據更可靠,直接反應結果,而不是關聯度不高的搜索數據。

不過鑽石選手沒有繼續深挖,他只是表明了現狀,給出了目前暫時的投票結果,算是歸納法。要想更精確,得用演繹法,也就是後續會如何演化,推算出最終的獲勝者。

06 星耀

星耀組的選手開始深入選舉的機制,從機制上進行推演。

星耀選手從選舉的機制入手,分析兩個候選人肯定能拿的票有哪些,肯定丟的票有哪些,然後各自需要爭取的有哪些。然後再分析搖擺州目前現狀是什麼樣的,誰的贏面更大。

星耀選手相比鑽石選手呢在數據上更加深挖了他從選舉制機制入手。

對川普和拜登分別分析他們兩者的得票情況:哪些州是肯定能拿到的,哪些州是肯定拿不到的。然後結合目前的提前投票的數據,計算出各自能得到的票數,這樣分析的結果一般是川普落選。

這還沒完。

然後再列舉出如果川普最終獲勝,存在哪幾種可能性。哪幾個州要翻紅才能讓川普獲勝,分別的組合是那些。

最後匯總給出結論,基本可以肯定是拜登獲勝,川普有小概率能翻盤,如果翻盤的話會是哪幾種情況。

這樣的分析已經非常全面了。

給個星耀,怕他驕傲。

07 王者

那麼最終王者的分析是什麼樣的呢?

前段時間知乎上的數據帝chenqin做了一個分析。很可惜,那個知乎問題已經刪掉了,所以現在已經無法追溯原貼了。

我大概說明一下:

首先,用數據預測大選,原來的做法是民調的數據。在過去民調數據預測是基本可信的,最終結果基本不會錯。但是為啥原來的這套方法不管用了呢?

因為2016年的大選,川普民調落後,最終卻贏得了大選。這給很多玄學的「美國觀察家」提供了豐富的豐富的創作土壤。

chenqin把各州的民調數據結果和最終的投票結果做了一個回歸,發現民調結果和最終的選舉結果高度擬合,這也可以證明民調確實可以預測大選,而且可信度非常高。

但是擬合度再高,也會有誤差,這個誤差在3%左右。也就是說優勢的一方必須在民調上有4%的領先,才能確定結果。而2016年的民調,希拉蕊領先川普只有2.3%,最終這個誤差導致了希拉蕊的失敗。

這其中美國的選舉人票制度放大了這個誤差。(美國的選舉制度,比如佛羅裡達州一共29張選舉人票,投共和黨的票數隻要比民主黨多一票,那麼共和黨拿全部的29張選舉人票。)

那今年的民調結果差距如何呢?

拜登領先8%。

所以從這個數據上來看,拜登贏定了。

這個分析為什麼是王者級。

因為不用看提前投票的情況,根據歷史數據和投票前的民調數據直接預測了結果,時效性最強。

總結

當然最終的結果沒有出來,一切都有變數。至於究竟誰當選,不是這次話題的重點。

附:還有一個數據大神nate sliver的大選預測,他的方法屬於數據建模,不是特別偏分析。而且16年的時候翻車的很厲害,我個人不太喜歡。

#專欄作家#

三元方差,公眾號:三元方差(sanyuanfangcha),人人都是產品經理專欄作家。專注用數據驅動業務增長,擅長數據分析、用戶增長。喜歡閱讀、思考和創作。

本文原創發布於人人都是產品經理。未經許可,禁止轉載。

題圖來自Unsplash,基於CC0協議

收藏已收藏 | {{ postmeta.bookmark }} 點讚已贊 | {{ postmeta.postlike }}

相關焦點

  • 美國大選,預測市場大顯身手
    一些分析人士認為,美國大選或在其中起到了推動作用;也有加密行業分析師認為,比特幣在此時間點上漲只是因其減產後的上漲周期與美國大選周期一致,另外,灰度不斷增持,為上漲提供了燃料。 雖然大選對加密資產價格的影響尚不確切,但這一公共事件,實打實地推動了加密資產行業的發展。
  • 手把手教你用數據分析看美國大選
    數據分析到底是什麼?該怎麼做?數據思維又是什麼?數據分析怎麼應用到日常工作生活? 為了更好的理解數據分析的這些問題,我們來結合美國大選這個具體例子,帶著大家做一場「探索性數據分析」。
  • 數據分析|1000萬+,疫情下的大選,讓美國深陷撕裂
    全文3535字,閱讀約需7分鐘 數據新聞編輯 陳華羅 新媒體設計 許驍 校對 陳荻雁 當地時間11月7日上午,美國多家媒體宣布民主黨總統候選人喬
  • 雷伊·馬沙耶吉:美國總統大選誰將獲勝?用經濟指標來預測
    用美元走勢預測總統大選結果 圖片來源:《財富》儘管美國洲際交易所美元指數從2020年初至今已下滑3%,但自8月3日以來形勢開始發生了一點變化。在這段時間裡,該指數略有攀升,漲幅不到0.2%。這對喬拜登來說似乎是個好消息,對川普總統來說則是壞消息。不過,正如德特裡克指出的那樣,美元走勢相對不那麼明顯,可能會使這一指標在預測此次大選結果時「一敗塗地」。
  • 預測不準美國大選,是世界錯了嗎?
    文/孫興傑2020年的美國大選備受關注!川普和拜登之間進行了一場跌宕起伏的選舉之戰,之外還有一場關於選舉的「戰爭」,那就是大選結果的預測之戰。直到開票,我們能夠看到2020年的大選並沒有像之前主流媒體和民調機構所顯示,拜登獲得大勝。恰恰相反,2016年大選的情節在某種程度上重演。川普拿下了非常關鍵的搖擺州,包括佛羅裡達州。
  • 常見的7種數據分析手段
    本文將為產品經理介紹數據分析的基本思路,並基於此,衍生出 2 個常見方法和 7 個應用手段,希望在數據分析的實際應用中能給大家帶來幫助。一、數據分析的基本思路數據分析應該以業務場景為起始思考點,以業務決策作為終點。
  • 【美國大選選情分析:拜登後繼無力 川普贏下佛州、俄州和德州...
    【美國大選選情分析:拜登後繼無力 川普贏下佛州、俄州和德州、有望再拿逾80張選舉人票】周三(11月4日)亞市盤中,美國大選計票緊張進行中。川普和拜登誰能贏得大選即將揭曉。目前只剩9州尚未宣布勝負,雖然民主黨候選人拜登在選舉人票及總得票數上暫時領先,但綜觀剩餘州的選舉人配票數和開票走勢都不利拜登,恐後繼無力輸給川普。
  • 1984年以來美國總統大選,每一次他都預測對了
    他叫艾倫·利希特曼(Allan Lichtman),是一位美國歷史學教授。歷來對美國大選結果的預測有很多,但從來沒有哪一個人、哪一個機構能像利希特曼教授那樣,從1984年以來,連續9次預測美國大選結果,都被他預測中。
  • 神奇股市大數據預測美國大選:過去76年19次中16次算準,揭曉後如何...
    當地時間2020年11月3日,美國迎來「選舉日」,各州選民可現場投票。近幾日美國各種民調、預測層出不窮。《華夏時報》記者注意到,一項在美國投資界小有名氣的「大選預測指標」(presidential predictor)正式出爐。在該指標規律下,過去76年的19次美國大選,16次結果命中。
  • 大選不能只看民調,BBC大膽預測:美國總統仍有5種可能通往勝選
    即便疫情數據顯示,美國新冠確診人數已經突破800萬,但在美國社會也沒有引起更多回應和反思的聲音,因為大家都在忙著做另外一件事——美國大選,上層政要們在忙著給兩位候選人站臺造勢,底層民眾們作為雙方支持者,也在忙著參加各種形式的競選集會。
  • 白銀走勢分析預測最新消息:美國大選逼近 白金價格能否繼續上行?
    隨著美國大選的臨近,市場情緒愈加緊張。儘管有民調顯示美國民主黨候選人拜登領先,但是眼下似乎越來越多的民調暗示現任總統川普將獲得連任。周一(11月2日)亞市早盤,現貨白銀跳空低開後,多頭強勢崛起,銀價轉漲並站上24美元/盎司,日內漲1.7%。
  • 2020年美國大選時間和公布時間 美國大選實時數據直播
    二、美國大選怎麼選的?  美國總統是間接選舉產生的,而非直接選舉。簡單來說,選民會先投票選出各州的「選舉人」,由各州的選舉人團(electoral college)代表選民進行最終的投票選出總統。  因此,選民在投票時,不僅要投總統的人選,還要投自己所在州的選舉人(參眾兩院議員)。
  • 【2020年美國總統大選】美國大選最新民調:還剩不到3天!這一機構...
    北京時間11月1日(周日),距離2020年美國大選投票日僅有3天不到的時間,一份來自statespoll的民調分析認為,川普最終將取得全部538張選舉人票中的322張,從而以較大優勢贏得大選,被廣泛看好的民主黨總統候選人則只能獲得216張選舉人票。值得注意的是。
  • 張召忠預測美國2020年總統大選 拜登概率大嗎
    根據美國實行總統制,每4年都會舉行一場總統大選,而今年正是美國總統大選之年。對於今年誰會當上新美國總統總統,這個問題引起了熱議!然而,現在張召忠預測美國2020年總統大選了,認為川普會連任,也就是說川普會再當4年總統。
  • 【美國大選最新消息】拜登勝選,美國大選落敗者如何退場
    查看詳情 2020年11月7日: 美國福克斯新聞消息,密西根州共和黨主席考克斯(Laura Cox)當地時間6日表示,該州安特裡姆縣的計票軟體發生故障,導致該縣6000張投給川普的選票被算到拜登名下。 據美國福克斯新聞最新統計數據顯示,美國共和黨總統候選人川普已拿下23個州,民主黨候選人拜登已贏得22個州和華盛頓特區的支持。
  • 如何用EXCEL線性回歸分析法快速做數據分析預測
    回歸分析法,即二元一次線性回歸分析預測法先以一個小故事開始本文的介紹。二元一次線性回歸分析法是一種數據分析模型。在EXCEL函數公式是FORECAST(英文意思是:預測),其用途是根據一條線性回歸擬合線返回一個預測值,此函數使用可對未來銷售額、庫存需求或未來數據趨勢進行預測分析。
  • 2020年美國大選,「義烏指數」怎麼不靈了?
    「義烏指數」反映的是義烏小商品的售賣前景,也在一定程度上反映了國際大勢的走向,比如在2016年美國大選中,「義烏指數」押對了寶,因此一戰成名。但是,2020年美國大選則有所不同。
  • 「義烏」指數能預測美國大選?這是造謠還是有事實依據
    在川普不斷抵制中國的情況下,美國總統大選所需物料,依然大量在義烏採購。中國義烏是一個充滿創新力和製造力的地方,這裡的人們非常勤勞,能夠把很貴的物品通過改良以後,降低成本的同時,保證了商品的使用質量。所以中國義烏的這種製造能力,被世界稱之為「中國奇蹟」。
  • 預言川普獲勝的教授再次對美國總統大選作出預測
    據俄羅斯衛星通訊社sputniknews報導,以自己準確預測總統大選結果而著稱的美國歷史教授艾倫•利希特曼預測,今年的總統大選將以約瑟夫•拜登獲勝而告終。為確定獲勝者,利希特曼利用了自己的「入主白宮的13個關鍵要素」體系,該預測體系其實就是只需回答「是」或「否」的13個問題。
  • 數據分析的四個層次
    編輯導讀:單純的數字是沒有靈魂的,但是數據分析卻可以洞察出數據背後業務的規律。因此,數據分析是商業活動中重要的一項工作。本文將圍繞數據分析的四個層次展開介紹,希望對你有幫助。一、引言我通常把數據理解為業務的另一個他,單純的數字是沒有靈魂的,而背後的業務卻是鮮活的。