民調:特不靠譜,還是有點譜?

2021-02-15 大七環

美國大選最重要的一天——選舉日(Election Day)已經結束,但所有選票尚未統計完畢,這場年度美劇已經兩次大反轉,紅了又藍,藍中帶紅。

 

這次選舉的激烈程度超乎想像。川普和拜登、紅藍兩黨、白人中老年男性和少數族裔青年女性,川大智勝和登雲股份,甚至於太平洋對岸微信群裡的兩撥圍觀群眾,都吵得不可開交。

 

鐵鏽三州(賓夕法尼亞、密西根、威斯康辛)中後兩者的結果塵埃落定,亞利桑那的14票基本已歸拜登,焦點已經落在270-264=6票的內華達州,而目前開票86%的內華達,拜登仍保持0.6個點的領先。一旦內華達落入拜登陣營,川普就得開始打包行李搬家走人。


但是,特不靠譜團隊準備「最後一搏」,聲稱選舉結果存在大量問題,要求差距小於1個百分點的威斯康辛州重新計票、暫停重審密西根州的計票。共和黨一方最終選擇訴至最高法庭,會否改變結局也未可知。

 

但無論誰勝誰負,這次的最大輸家之一,一定有美國的民調機構們。他們猜中了開頭,但沒有猜中過程,也不知道能不能猜中結尾。

 

在2016年之後,民調機構這次錯得更離譜了嗎?

1824年的總統選舉,哈裡斯堡賓州人報(The Harrisburg Pennsylvanian)對路過的行人做了訪問調查,詢問他們會支持亞當斯還是傑克遜,這是歷史上第一次「民意調查」。在近200年間,民調機構的存在為指明和預測大選的結果提供了有效的證據。

 

但在2016年,幾乎所有民調都看好希拉蕊的情況下,川普意外翻盤,讓民調的可信度畫上問號。

 

在今年選舉日前,三大民調機構紛紛給出了自己的選舉地圖和預測數據,均認為拜登將以300-350張左右的選舉人票入主白宮。這次,他們又錯了。

RCP:預測拜登拿下319張選舉人票

資料來源:RealClear Politics,大七環

FiveThirtyEight:預測拜登拿下348張選舉人票       

資料來源:FiveThirtyEight,大七環

270 to win:預測拜登拿下351張選舉人票   

資料來源:270 to win-Map Based on Polls (No Toss-ups),大七環


實際上,川普在計票開始的前12個小時都來勢洶洶,表現超出預期,而即使拜登後半程有翻盤之勢,兩者也始終勢均力敵。

令民調機構們更為恐慌的是,他們不僅押錯了選舉人票,連四年前用來「挽尊」的普選率也與真實數字差距甚遠當時,即使錯誤預判希拉蕊會取得勝利,但民調預測普選中希拉蕊領先3.3%,和真實數字2.1%非常接近。

11月2日,三家匯總各方民調的中立機構270 to win,538和RealClear Politics公布了對近期民調的統計數據,拜登在全國領先8個點左右。但實際上,截至11月5日中午,這個數字的實際值僅有2.5%,與預測結果整整相差6個點

權威中立非盈利機構民調統計,至11月2日

資料來源:公開資料整理,大七環

美國大選奉行選舉人團制度,對50個州採取勝者全得的策略。對於傳統的「鐵票州」來說,事先的民調沒有太大意義。只有搖擺州的傾向會對最終的結果起到決定性作用。

莉莉安統計了一下,在大選前一周,各個搖擺州的民調數量都在10份以上,而在最重要的佛羅裡達、賓夕法尼亞和北卡羅萊納州,甚至在一周內出現了20份以上的民調。

但數量不意味著質量,民調在搖擺州的失準,對於最後的判斷是致命的。

民調結果顯示拜登能在大選中輕鬆拿下11個搖擺州中的8個,包括起決定性作用的佛羅裡達州和賓夕法尼亞州。

但事實上,四年前的噩夢再度上演。

川普在保住了擁有傳統優勢的俄亥俄、愛荷華和德克薩斯外,還勢如破竹地拿下了重磅搖擺州佛羅裡達州。而在其他搖擺州,都開始了與拜登長達兩天的拉鋸戰。

平均來看,在各個搖擺州,民調對拜登的優勢都出現了5%以上的高估。這甚至超出了四年前的差值。

民調與實際結果差距(截至11/5中午)

資料來源:公開資料整理,大七環

民調偏誤(實際川普得票率增加值)

資料來源:公開資料整理,大七環

但我們也要注意,仍有民調機構總給出「萬藍叢中一點紅」,比如Trafalgar這家被標註了「共和黨民調」的機構。它在2016年對最終結果的預測相對準確,今年,Trafalgar對共和黨非常看好,在大部分搖擺州都給出了川普領先2-5%的預測,這使得其更接近真實投票數據,比如其在佛州給出的民調數據(川普領先2.1%),和大選結果(川普領先3.4%)非常接近。


但正因為這家民調對川普的支持率估計一直高於平均,往往被指責具有黨派色彩。同樣遭遇的還有Rasmussen,這也是同樣被打上了紅黨標籤的民調機構。部分研究機構,例如經濟學人雜誌,在分析討論的時候認為這類民調「存在偏差」而棄之不用。

Trafalgar預測結果     

資料來源:公開資料整理,大七環

但是具有民主黨色彩的民調機構,如PPP(Public Policy Polling)等卻並沒有面臨這樣的質疑和嘲諷。正是這種機構和媒體的偏見,使得民調染藍越來越嚴重,預測結果也越來越偏離現實。

 

但從結果看,唱唱反調,對最後預測的準確性未嘗不是好事。


為了預測誰將入主白宮,不同的學者、機構、企業紛紛出招,從調研到建模不一而足。從PredictIt這樣的博彩機構,彭博社、經濟學人這樣的研究類機構,到佛羅裡達大學教授Michael McDonald、美國大學教授Alan Lichtman等專家學者,紛紛在事先對今天的結果做出了預判。民調已經失準,那麼其他預測是否正確呢?


數字時代,更多的信息湧入,這個預測的黑箱該如何設計?怎樣才能輸出可信的預測? 

       

第一類是正統民調派,這次的結果再次證明了他們的不靠譜。

第二類是硬核技術流。

「經濟學人」(Economist)雜誌綜合各州、全國民調數據和各類經濟指標數據,通過模型預測選舉人票分布和兩黨勝率。他們推測拜登獲勝的概率高達96%,其拿到選舉人的票數在253-415之間,他們給出的最終預測數字是356票。

   經濟學人預測結果    

資料來源:Economist,大七環

彭博社(Bloomberg)同樣構建了自己的模型,對總統、兩會的選舉結果做了預判,至11月2日,他們推斷民主黨橫掃的概率高達32%,而拜登當選的概率則有64%。

   

彭博社預測結果    

資料來源:Bloomberg,大七環


最近,中國的一家機構「圖勝科技」給出了極其複雜的理論模型,號稱「運用到神經網絡BP算法和聯合假設檢驗,綜合多項先進算法技術搭建的大選預測模型」,從經濟、就業、民調、疫情等多個角度,預測拜登當選的概率達78.8%。

     圖勝科技預測模型  

資料來源:圖勝科技,大七環

事實證明,理論派們的模型越複雜,可能離現實也更遙遠。

第三類是社會分析派。

美國大學(American University)的歷史學教授Allan Lichtman號稱在預測總統選舉上「四十年未嘗一敗」,他通過對每位競選者提出13個問題,包括政黨授權、競爭、謀求連任、第三黨、經濟、政策、社會、軍事外交等多個方面,如果這13點中有半數是肯定答案,則其會當選。在今年,他認為川普僅在4個問題上收穫正面答案,因此連任無望。

幾十年的精準判斷,在今年也許會馬失前蹄。

Allan Lichtman教授

在大量「藍潮」的預判中,還有一群研究者始終堅信川普將贏得選舉。

2016年在中外媒體對希拉蕊一片看好之聲中,部分研究人員通過判斷中國義烏市競選商品銷量作為美國總統選舉勝敗的預測指標正確判斷了川普獲勝,「義烏指數」在今年仍然另闢蹊徑預測川普將連任成功,但似乎這次不能再出奇制勝。

 

事實上,今年由於疫情,這一指數本身具有偏誤。第一,共和黨和民主黨選舉活動舉辦方式完全不同,前者人山人海而後者則採取社交距離;第二,進出口貿易受限,銷售數據可能有失真的危險。即使最後「義烏指數」的信奉者們正確預測了結局,但也只能說有湊巧的成分。

特不靠譜的民調機構已經努力變得靠譜了。

《文學文摘》雜誌(Literary Digest)在1916到1932年的5屆均成功預言了大選的結局。1936年,老牌民調機構馬失前蹄,而令其錯誤判斷結果的原因,就是其樣本選擇的偏誤。《文學文摘》的調研對象是雜誌的讀者,但在當時,能夠訂閱雜誌的對象都是高收入的人群,他們對羅斯福的社會經濟政策高度不滿,使得調查結果具有極大的偏誤,最終讓這份民調失準。

 

《文學文摘》雜誌

而同年,蓋洛普成立美國民意調查所,其作為新興調查機構不斷調整自己的抽樣方法來提高精度,更為準確地對大選結果做出了預判。在民調出現後的近兩百年中,技術的變遷和理論的進步,使得民調機構不斷修正自己的抽樣方法、採訪方式、統計方式、數據清洗等技術手段,來提高預測的精度。


在2016年的慘敗之後,民調機構更是付出了大量的努力來校正自己的結果。他們充分考量了樣本的多樣性,以更好地模擬全樣本。在2016年的一部分民調中,擁有大學學歷的人數佔比達45%,而實際美國人口中大學畢業生的比重僅有28%,過多的高學歷人群樣本導致對川普支持率的低估。所以今年,民調機構對於不同特徵人群,尤其是對不同教育程度人群的採樣更加全面,以彌補四年前的缺陷。


同樣,民調機構的調研方式因過於老舊,導致採訪對象過於單一而被攻擊,所以他們這次更多採取了線上、線下結合等方式,改變多年不變的電話調研的傳統。


電話訪談因為對象選擇單一而飽受攻擊

圖片來源:Photo by Paul Hanaoka on Unsplash


除此之外,由於單一民調可能具有傾向性,還誕生了諸如270towin這樣的第三方機構,對各家民調進行整合和再統計,希望能給出更為確切的結果。


但是,方法的不斷改進並沒有改變民調越來越失準的現實,特不靠譜的如果不是民調的方法,那到底是什麼呢?

第一,模型不是萬能的,不存在能完全刻畫現實的模型。

我們必須承認,現實太過複雜,抽樣樣本永遠無法代替全樣本。模型本身刻畫的是規律性、一致性,而決定現實的往往是偶然性和擾動項。

莉莉安有幸參與了上周的世界頂尖科學家論壇,諾貝爾經濟學獎得主Lars Peter Hansen就針對建模提出了質疑,如何把現實推導到模型的過程中,各種問題層出不窮,Hansen提出的三重不確定性,風險(risk)、模糊性(ambiguity)和錯誤設定(misspecification)

Lars Peter Hansen教授

圖片來源:Flickr


風險指給定概率模型後未來結果可能存在擾動;模糊性指模型選擇有不確定性,難以判斷不同模型的準確性;而錯誤設定則指模型本身存在缺陷。

即使抽樣設計已近完美,準確地反映了全樣本的特徵,但在最後真實投票中,突發事件和「十月驚奇」們可能臨時性地改變人們的選擇,比如亨特·拜登的硬碟事件。 

另一個嚴重的問題是不同的人群回答問題的概率並不一致,1980年「害羞的裡根選民」和四年前「壓抑的川普選民」一樣,接受調查的意願較低,或者並不願意公開承認自己的政治傾向。然而抽樣設計並不能解決這一問題,這一缺陷使得民調無法真實反映現實。

第二,人心的失準比模型的失準更嚴重。

今年,不同民調的數據差異非常懸殊,不同傾向的民調機構之間的差值超過10個點。對於分化的民調數據,不同分析機構、媒體或者普通民眾在選擇相信哪份民調時往往有先入為主的問題。


三州民調拜登領先點數分布,10/25-11/2

資料來源:公開資料整理,大七環

當自身對民主黨的執政理念更為信奉,或者對民主黨候選人更為崇拜,又或者是對川普有著更多惡感時,是否會對另一方的數據、民調視而不見呢?

比如在經濟學人的網站上,你無法搜索到Trafalgar和Rasmussen這兩家偏紅民調的數據。而在保守派媒體福克斯(Fox)的新聞裡,你也無法看到PPP、CNN這類偏藍民調中拜登大幅領先的數據。


自身的立場決定了你會相信什麼樣的民調和預測,並不斷尋找證據來論證自己的判斷。在對民調數據進行解讀時,需要站在更為中立的立場,用客觀的視角去判斷結果。

 

第三,美國社會的分化與撕裂才是特不靠譜的根本原因。

 

當下美國社會的分化,或者說世界的分化越來越嚴重。兩黨的價值觀越來越對立,各自陣營對對方的偏見和誤解也日益加深。


佛洛依德(Floyed)事件和隨之而來的「黑命貴」運動(Black Lives Matter);美股的一路狂飆和高淨值人群財富的增長;人山人海的共和黨選舉活動,而嚴格保持社交距離的民主黨選舉活動;以及大選日的夜晚,白宮外爆發的激烈對抗……無一不是撕裂的美國的縮影。


圖片來源:Photo by Jon Tyson on Unsplash

從選舉結果的變化上,也可見一斑。將選舉的結果和各郡自2016年的變化疊加在一起看,我們可以發現,這四年間藍州更藍,紅州更紅,沿海區域和內陸區域,城市和鄉村在政治觀念、意識形態上變得更加壁壘分明。


2020年選舉結果及變化傾向

資料來源:New York Times,大七環

分化的兩派更加勢均力敵,互相撕扯,誰都沒有絕對的優勢。這使得中間派的決定性作用越來越強,而最難判斷的永遠是最後0.1%。


一人一票和選舉人團制度,將每州微小的差距放大,比如威斯康辛州,拜登僅領先0.6個點,卻勝者通吃拿下了全部10張選舉人票。這種機制使得結果的偶然性越來越大,一點極小的擾動,就可能改變最終的結局。


四年之後,即使技術仍然難有寸進,即使依然「特不靠譜」,民調也依然會繼續。

但特不靠譜的並不是民調的技術或者方法本身,而是這個社會的裂痕難以彌合。在分裂的現實中,更需要大膽取證,小心求證,對於任何缺乏證據的片面之詞要更加謹慎,對於微小的偶然性事件也應當給予足夠的關注。

對於民調機構,對於美國的政客,對於即將上任的總統來說,與其說是修正預測選舉結果的方法,他們要做的,是如何和這個撕裂的美國共處。

點擊「閱讀原文」或後臺回復「都市圈」查看更多都市圈原創文章,歡迎關注微信公眾號「大七環」

相關焦點

  • 喜鵲:民調是真實的還是虛假的?
    還真有,就是現在的網紅總統川普,他在2016年大選的時候,無論哪個媒體公布的民調,川普都落後希拉蕊,大家都認為希拉蕊當選板上釘釘了,但是沒想到,真正開始投票的時候,川普不僅拿下了紅州,一些搖擺州也紛紛拿下,雖然後來折騰了很久,但是川普還是就任了,川普的當選似乎驗證了,民調有時候也不是那麼靠譜。民調到底靠不靠譜?
  • 四大跡象表明,2020美國大選民調或比2016靠譜
    拜登會不會贏得民調而輸掉選舉?有幸現場報導了過去兩屆美國總統大選。2012年初到美國,中規中矩地報導了我的第一次大選,歐巴馬戰勝羅姆尼,波瀾不驚;2016年在希拉蕊紐約競選總部連續24小時不間斷採訪直播,見證了川普逆襲。驚險,刺激。至今難忘希拉蕊支持者的淚水,還有第二天早晨驕傲的鐵娘子舉辦的那場艱難的認輸發布會。
  • 四大跡象表明,2020美國大選民調或比2016靠譜!
    拜登會不會贏得民調而輸掉選舉?有幸現場報導了過去兩屆美國總統大選。2012年初到美國,中規中矩地報導了我的第一次大選,歐巴馬戰勝羅姆尼,波瀾不驚;2016年在希拉蕊紐約競選總部連續24小時不間斷採訪直播,見證了川普逆襲。驚險,刺激。至今難忘希拉蕊支持者的淚水,還有第二天早晨驕傲的鐵娘子舉辦的那場艱難的認輸發布會。
  • 中美觀象|美國大選之後再看民調
    民調不僅可以衡量選民對競選公職候選人的態度,而且能夠反映選民所持的價值觀和他們對熱點問題的看法,好的民意調查會盡力顯示特定問題所體現的選民的價值觀。民調結果是歷屆美國政府和國會就重大事項決策時的重要參考,影響力很大。 2. 雖然公眾與主流媒體都對民調都表示了強烈質疑,但通過對2016年和2020年民調與實際選情的比對分析,總體上民調還是經受住了「考驗」。
  • 美國大選民調會不會再「失手」?聽聽專家怎麼說
    /《紐約時報》報導截圖「如果民調靠譜,那麼希拉蕊2016年已經當總統了。」自2016年預測大選結果的選前民調「失手」以來,4年間,人們反覆質疑,民調真能準確預測下一任美國總統?美國的民調機構和統計學家也在反覆總結,為什麼2016年民調幾乎「全軍覆沒」?
  • 2020美國總統選舉: 如何解讀民調結果?
    今天應該如何解讀民調數據才能夠儘可能地避免重蹈覆轍?法國電視臺新聞頻道追蹤了今年四月以來的美國民調機構最選民投票意向的調查,邀請法國的美國問題研究專家試圖對民調結果做出準確的解讀。民調是否可靠?首先全世界有關選舉的民調都與選舉結果存在一定的差異,因此,必須對民調結果持有保留,尤其應該吸取2016年美國選舉的教訓。
  • 美國大選支持率最新民調 2020年美國大選最新消息
    美國大選支持率最新民調,距離美國總統選舉投票日不到半個月,多項民意調查結果顯示,全國範圍內,民主黨候選人喬·拜登相對共和黨候選人、現任總統唐納·川普的領先優勢達到兩位數,但兩者支持率在六大「搖擺州」逐漸縮小差距。  四年前,川普在民調顯著落後的情況下獲勝,令人大跌眼鏡,選前民調可信度遭遇前所未有的質疑。
  • 臺灣民調準不準 2018封關民調準不準
    11月24日晚上開票,大家都很關心選舉結果,身為民調機構負責人的我,更是緊盯全臺22個選區各候選人的得票數。很欣慰的是,2018的九合一選舉,再次驗證「民調真的很準!」別嫌棄臺灣的抽樣電訪民調,只要方法得當,它對臺灣選舉的預測力還是「高度精準」。周玉蔻譏笑柯文哲選前民調那麼高,才贏了三千票。
  • 吳子嘉:韓國瑜創下臺灣政壇民調史上新記錄
    面對藍綠陣營的初選亂相,一些民調機構也都在忙不迭的推出各自的民調數據,說實話,在這些形形色色的民調機構中,質素也真的是良莠不齊,有一些機構純粹是為了陣營需求來服務和發布民調的
  • 韓流發威襲捲三重 綠營民調出爐 網:恭喜餘祥銓
    而高雄市長韓國瑜的韓流效應能否延燒,也備受關注,23日韓國瑜出席國民黨參選人鄭世維三重市前街造勢大會,現場湧進3萬人以上人潮,韓流旋風不減反增。不過,卻有媒體發布民調顯示,即使有韓流加持,民進黨候選人餘天的支持度依舊有41%、鄭世維則是23.4%。對此,網友譏諷,恭喜餘祥銓!第二波立委補選3月16日舉行,被視為2020年臺灣地區領導人大選前哨戰。
  • 民調失真,因為不夠科學?
    尤其之前一系列民調都顯示,Joe可能取得大勝。雖然民調方式相比2016有了一定的調整,但似乎還是有點失敗。所以不免有人提出各種疑問,尤其民調真的科學嗎?具體到美國大選來說,確實有幾個特殊之處。第一是選舉人票制度。韓國瑜曾經說過,選舉最大的秘密就在於,「票多的贏,票少的輸」,但美國還真不完全是這樣。已經有人開始痛批這樣的制度會毀了美國。
  • 民調的oversampling是怎麼回事?
    這裡面的oversample,符合很多 Trump 支持者所相信的諸多媒體民調都在有意地偏向民主黨,尤其是他們認為民調採樣中支持民主黨的選民通常大大高於共和黨,顯然是不正常的。像WikiLeaks 曝出的很多內幕一樣,這些細節反映了很多普通人所不熟悉的行業規範。在oversample 這個詞上,就很容易望文生意地理解成是故意放大某個群體在民調中的比重。
  • 民調真相出人意料,這個省最傷不起!
    >, 還是保持著最近SNC事件白熱化以來大多數民調呈現的微小差距。在本地政治圈裡,338 polls是公認比較靠譜的民調,對剛結束阿省大選的預測很準,尤其是……還記得👇這張讓很多人拒絕相信的 「愛橙」預測圖嗎?……
  • 真相丨美民調:美國朝著錯誤的方向前進
    美媒發文反思:弗洛伊德之死和因疫情而暴露的不平等為何會導致大規模的抗議活動?美市長:聯邦政府未能保護民眾《今日美國報》網站6日發文稱,抗議活動的歷史性本質「在過去一周成為焦點」,除了反對幾十年來警察的不當行為外,民眾還抗議疫情導致有色人種的死亡比例過高,這暴露了醫療體系內的不平等。
  • 臺灣最新民調顯示過半認為是中國人臺網民:自慰民調!
    原標題:臺灣最新民調顯示過半認為是中國人臺網民:自慰民調!   臺灣競爭力論壇公布今年第三季的國族認同調查結果,雖然有54.1%的民眾認同自己是」中國人」,也有84.8%認同自己是「中華民族的一份子」,但與歷次調查比較,仍是比率最低的一次。
  • 民調顯示:拜登支持率「碾壓」川普
    參考消息網12月8日報導據美國有線電視新聞網網站12月6日報導,一項新的蓋洛普民意調查發現,美國當選總統拜登的支持率達到55%,不支持率為41%。川普的支持率為42%,不支持率為57%。據報導,從歷次民調結果來看,川普的支持率通常在30%多至40%多之間徘徊,此次蓋洛普民調情況也一樣。在網絡出口民調中,川普的支持率為46%。川普支持率最高的時候是他贏得2016年大選後的一次民調,在當時的一次彭博新聞社民調中,他的支持率達到50%。
  • 國民黨2020初選民調8日起跑 15萬「韓粉」灌爆高雄衝民調
    民調決戰前的最後一個周末,國民黨初選參選人韓國瑜舉辦「76高雄觀光日」活動,15萬「韓粉」灌爆高雄、全力「護主」,爭取替韓國瑜衝高民調。國民黨初選民調明日登場,近日有綠營指標性人物在「臉書」號召「有瑜點魚、無魚吃菜(蔡)」,要灌爆韓國瑜民調,「讓蔡英文在大選比較好打」。
  • 看穿民進黨最新民調 陳揮文嗆問一句話
    據臺灣《中時電子報》報導,民進黨公布2020臺灣總體表現民調,蔡英文當局這1年來表現的總體滿意度達60.9%、不滿意度為36.6%,其中不滿意蔡英文這一年來的表現主要原因中,有7.7%的民眾認為是開放美豬牛。對此,資深媒體人陳揮文看完後,發現此民調不滿意的原因選項只能「單選」,令他忍不住砲轟「唬誰啊」。
  • 郭臺銘:我民調已經贏了韓國瑜
    而隨著他的民調支持度逐步的上升,他的信心也是越來越爆棚,30日,他在接受媒體採訪時表示,「我很有信心能在初選中勝出,而且目前內部民調我已超越韓國瑜」。他還向媒體訴苦抱怨說「民進黨中執會已拍板讓手機民調納入初選機制,但藍營卻不願納入,我多次呼籲高層必須重視這個議題,但卻沒人理我」。
  • 蔡英文「闖大禍」後,民調終於「翻車」了
    導讀:有句話叫好景不長,臺灣民進黨經歷了風光後,今年迎來了民調的冰點,在諸多議題上都不得民心。民進黨民調下滑臺灣民進黨年初「選舉」大獲全勝之時,恐怕做夢也沒想到,自己坐了回過山車,年初風風光光,到了年底,民調大幅下滑。民進黨當局不僅在諸多議題上不得民心,執政團隊的支持率也遭遇了下滑。