民調不靠譜?人工智慧預測拜登獲勝

2020-12-25 電子工程專輯

來源:AI前線

作者 | Kyle Wiggers

譯者 | Sambodhi

策劃 | 劉燕

預測美國大選,人工智慧會比民調更準確嗎?

本文最初發表於 venturebeat,由 InfoQ 中文站翻譯並分享。

預測美國 2020 年總統大選結果的一些民調似乎並沒有實現準確的猜測。

聚合網站 RealClearPolitics 的數據顯示,前副總統拜登比現任總統川普領先 7 個百分點,而 FiveThirtyEight 的數據顯示,拜登在全國平均至少領先 8 個百分點。實際上,這場大選更加激烈。例如,在佛羅裡達州,FiveThirtyEight 顯示拜登以 2.5 個百分點的領先優勢贏得勝利,但川普卻在邁阿密 - 戴德縣獲得了意想不到的支持。

民意調查並非一門完美的科學。

2016 年大選前的報告顯示,希拉蕊在全國領先,在威斯康星州、密西根州和賓夕法尼亞州等州的競爭更為激烈。但川普最終獲得了贏得大選所需的 270 張選舉人票。一份來自美國民意研究協會(American Association for Public Opinion Research)的報告得出結論,稱州一級的民調「低估了川普在上中西部地區的支持率」,預測人士指出,這些州缺乏高質量的民調數據。

那麼,比起主要依靠電話和網上小組調查的傳統民調,是否有更準確的方法來預測選舉結果呢?

KCore Analytics、Expert.AI 和 Advanced Symbolics 等公司聲稱,算法能夠捕捉到更廣泛的選舉動態,因為它們利用了諸如 Twitter 和 Facebook 消息等這樣的信號。

但是,目前還不清楚在 2020 年大選之後,人工智慧是否比民調更準確。

KCore Analytics 從社交媒體的帖子中預測,拜登將在民眾投票方面擁有很大的優勢,大約為 8、9 個百分點,但在選舉人團投票方面的優勢微乎其微。

總部位於義大利的 Expert.AI 發現,拜登在社交媒體上的情緒方面排名較高,認為民主黨候選人略微領先川普(50.2% 對 47.3%)。

相反,Advanced Symbolics 的 Polly 系統,由渥太華大學的科學家開發,其預測結果完全是錯誤的,該系統的預測結果顯示,拜登獲得了 372 張選舉人團選票,而川普則獲得 166 張,這要歸因於該系統預期拜登在佛羅裡達州、德克薩斯州和俄亥俄州獲勝,而這些州正是川普的票倉。

與民調類似的一點是,由算法驅動的預測中的一些差異也可以歸因於方法上的差異。

Expert.AI 利用一個知識圖譜來標識命名實體(包括人員、公司和地點),並嘗試對它們之間的關係進行建模。該公司表示,其系統將 84 個情感標籤附加到來自 Twitter 和其他網絡的數十萬條帖子上,這使得它能夠半自動地清除社交媒體中的「殭屍」帳戶。

Expert.AI 的算法對標籤進行排名,從 1 到 100(反映其強度),並將其乘以每個候選人出現的次數。與此同時,它將情緒分為「積極的」、「消極的」,並利用這一點來創建一個指數,可以比較這兩個候選人。

相比之下,KCore Analytics 公司聲稱他們已經使用了超過 10 億條經挖掘的推文來指導他們的預測,他們利用端到端的框架來尋找 Twitter 等網絡中的影響力人物和標籤。數據的選擇是基於內容和頻率,表面上看是實時的,但排除了機器人,一個名為 AWS-LSTM 的人工智慧模型對這些數據進行分析,並進行意見分類,據稱正確率高達 89.5%。

至於 Polly,它收集了一個隨機的、可控的美國選民樣本,通過他們在社交媒體上的帖子和對話進行識別。在 11 月 3 日之前,這一總數為 288659 人。

使用人工智慧預測選舉結果的一個挑戰是,必須訓練算法學習與全國預測相吻合的選舉人團的不同模型。另一個問題是,它們需要微調自己,以發現對特定少數群體和地區重要問題。群體越小,就越難以找到。

根據 Advanced Symbolics 的說法,Polly 在這方面徹底失敗了。這個模型預測,佛羅裡達州將把投票給拜登,佔該州總票數的 52.6%,但這只是因為系統沒有對古巴裔美國人進行單獨採樣,而古巴裔美國人通常會投票給共和黨候選人。相反,Polly 將他們與委內瑞拉裔美國人和墨西哥裔美國人一起歸為「西班牙裔」。

Polly 團隊本周在一篇博文中承認:「我們需要在下一次選舉中加入更多的種族和地區『因素』。放大錯誤使它們更容易被發現,通過一個問題一個問題,一個州一個州地找到 Polly 誤入歧途的地方。」

模型還難以解釋美國的農村地區。

這是因為這些地區使用 Twitter 的潛在選民 比例較低,導致模型低估了拜登選民的優勢。此外,Twitter 上的川普潛在選民更少,因為這個社交網絡傾向於 自由派。這意味著川普支持者的推文在基於社交的選擇預測模型中具有更高的權重,但有時候還不夠高,就像 Polly 的情況一樣。

今年大選日,川普獲得了超過 6860 萬張選票,而 2016 年這一數字為 6280 萬張。在像邁哈密 - 戴德縣等預期成為「藍州」的縣中,截止 10 月 30 日,共和黨人的投票比例略高於民主黨人(該縣登記的共和黨人的比例佔 63%,民主黨人的比例佔 56%)。

KCore Analytics 等公司聲稱,他們的人工智慧模型優於傳統民調,因為它們可以擴展到龐大的潛在選民群體,並根據抽樣偏差(例如代表性不足的少數族裔)和其他限制因素進行調整,以預測大選結果。他們正確預測了 2016 年英國將投票脫離歐盟,並正確預測了臺灣 80% 左右議會選舉勝利者,以及接近印度和巴基斯坦的地區選舉。

但它們也並非萬無一失。

正如《財富》(Fortune)雜誌指出的那樣,這些模型都沒有考慮到法律挑戰、失信選民(指選舉人團成員不投票給他們承諾支持的候選人),或者可能影響選舉結果的其它混合因素。

就拿 Polly 來說,這些方法,與傳統民調一樣,它似乎也低估了 2020 年選民對川普的熱情,特別是在黑人和拉丁裔選民,以及 LGBTQ(譯者註:非異性戀者,即男女同性戀、雙性戀、變性人和對自己性別認同感到困惑者)群體中。

哥倫比亞大學統計學和政治學教授 Andrew Gelman 提出了這樣的觀點:與根據民調平均數得出的猜測相比,根據特定選舉年的某些變量調整的民調模型可能更接近實際情況。

「政治學家們已經開發了一些模型,這些模型能夠很好地預測基於所謂的『基本面』的全國投票情況:經濟增長、總統支持率和在任情況等關鍵變量。如果我們採用這些模型中的一種,並根據 2016 年以來各黨派的得票率情況(而不是利用最近的民調數據)進行調整,我們將會預測拜登將以微弱優勢獲勝」,Andrew Gelman 在《連線》(Wired)雜誌的一篇專欄 文章 寫道。

作者介紹:

Kyle Wiggers,技術記者,現居美國紐約市,為 VentureBeat 撰寫有關人工智慧的文章。

原文連結:

https://venturebeat.com/2020/11/06/how-ai-predictions-fared-against-pollsters-in-the-2020-u-s-election/


1.2020年第11期《單片機與嵌入式系統應用》電子刊新鮮出爐!

2.為什麼要用C語言實現面向對象?

3.27種不同程式語言能耗對比!

4.當所有需求都是第一優先級時,該怎麼辦?

5.這個物聯網作業系統—OneOS,來了解一下!

6.可怕,別人把我MCU固件給反彙編了!

相關焦點

  • 美民調預測拜登輕鬆躺贏,被批「一錯再錯」
    對手拜登距離獲勝僅剩一州之遙。 雖然結果仍有懸念,但不爭的事實是,川普已牢牢守住數個搖擺州,在威斯康星這樣的失地也僅僅落後2萬餘票。這都令此前預測拜登大幅領先、「輕鬆獲勝」的民調機構與主流媒體雙雙「跌破眼鏡」。 事實上,美國民調機構繼2016年之後,今年大選再度「看走眼」,嚴重低估川普在德克薩斯、佛羅裡達、俄亥俄州的得票率,同時高估民主黨在國會的表現。
  • 專家:拜登獲勝在統計學上「是不可信的」
    民調專家派屈克巴沙姆(Patrick Basham)周日(12月6日)表示,民主黨總統候選人拜登在2020年總統大選中取得勝利,「在統計學上雖非不可能」(not statistically impossible),但「在統計學上是不可信的」(statistically implausible)。
  • 民調顯示支持率被拜登反超,川普回應:我不相信民調!
    面對民調支持率數據下滑,他依然「川普」。「無能」、「不稱職」、「災難」……川普形容民主黨對手拜登時接連拋出這樣的詞。美國總統川普當地時間29日在白宮橢圓形辦公室接受路透社採訪,他表示自己不相信民調顯示拜登在總統競選中領先,並補充說對這位前副總統的支持率感到「驚訝」——當然,從川普的話來看,是貶義的那種「驚訝」。當地時間29日,川普在白宮橢圓形辦公室接受路透社採訪時談及美國民主黨總統競選人、前副總統喬?拜登。
  • 三天出院,民調還反超拜登!為何美國媒體卻集體失聲?
    Express《快報》的結論還包括在全國綜合民調中,川普支持率為46%, 拜登45%。調查預測川普將拿走320張選舉人票,戰勝拜登的218票。 在同一天,美國媒體其實也報導了一項重大民調結果,就是拜登在全國民調中大幅領先川普14個百分點。NBC/華爾街日報的民調顯示,拜登以53%對川普39%;而在路透社/益普索的民調上,拜登也以51%對川普41%,以10%的優勢領先;FiveThirtyEight的全國民調,拜登也以50.8%對42.8%,領先川普8個百分點。
  • 民調I 拜登支持率上升 川普支持率下滑
    ,當選總統喬·拜登(Joe Biden)的支持率自選舉以來有所上升,而同期川普總統的支持率則略有下滑。 調查顯示,拜登的支持率得到了獨立人士和共和黨人的支持。獨立人士的支持率增長了7個百分點,從48%上升到55%,而共和黨人對這位前副總統的支持率從6%上升到12%。蓋洛普的數據顯示,民主黨人對拜登的支持率在90%左右,基本沒有變化。 最近幾周,共和黨人對川普的支持率下降了6個百分點,至89%。
  • 美國大選直播文(一):拜登在密西根州逆轉獲勝,離贏得大選只差6票
    ② 據CNN和NBC預測,拜登將贏得2016年川普取勝過的密西根州,從而獲得264張選舉人票。川普已得到214張,均未達到宣布勝利所需的270張。③ 拜登只需要再贏得一個州,例如內華達州或喬治亞州就能獲勝。他目前在內華達州領先,競選陣營認為喬治亞州的缺席投票將助他一臂之力。④ 拜登表示預計自己將獲勝。
  • 美國大選倒計時|股市指數看好拜登 川普支持率上升
    據美國新聞網消息,截至10月31日的統計數據,美國各大預測機構數據均指向拜登的獲勝機率遠超川普。除此以外,美國股市、華爾街及媒體輿論等多方跡象也表明了拜登的獲勝可能,然而,在經過一個周末的活躍拉票後,川普的民調支持率似乎又有迎頭趕上之勢。▲2020年美國總統大選投票日將近,「終極對決」即將見分曉。
  • 川普or拜登,到底誰會贏?美媒終極預測!| 外刊精讀
    Most of the time, that change has been to the benefit of Joe Biden, who started to open a lead in April and has not looked back since. A
  • 沈富雄:我如驚弓之鳥不敢預測了|沈富雄|唐納·川普|拜登|民調|大選_網易訂閱
    完全是免費訂閱,請放心關注(圖文來源於網絡,如有侵權請聯繫刪除)美國總統大選受到全球關注,前民進黨「立委」沈富雄上月就在臉書預言民主黨候選人拜登會大贏,但美選開票數據瞬息萬變,川普甚至一度領先,沈富雄於是在直播節目中改口「川普小贏」,但隨著關鍵搖擺州逐漸明朗,如今拜登贏面大,沈富雄兩度的預測也被網友虧是「政界糗爺。」
  • 美媒預測拜登在喬治亞州獲勝 共獲得306張選舉人票
    美媒預測拜登在喬治亞州獲勝 共獲得306張選舉人票
  • 美媒:別光看民調,還得看「療效」
    美國《國家利益》雙月刊網站10月11日發表了題為《民調無法決定川普和拜登誰獲勝,新冠病毒和經濟會決定鹿死誰手》的文章。文章認為,儘管538網站民調數據顯示,拜登在搖擺州的領先優勢總體上強於希拉蕊2016年同期優勢,但隨著疫情和經濟危機的持續,實際選舉結果仍不確定。大多數搖擺州往往是贏得大選的關鍵。
  • 美國大選支持率最新民調 2020年美國大選最新消息
    美國大選支持率最新民調,距離美國總統選舉投票日不到半個月,多項民意調查結果顯示,全國範圍內,民主黨候選人喬·拜登相對共和黨候選人、現任總統唐納·川普的領先優勢達到兩位數,但兩者支持率在六大「搖擺州」逐漸縮小差距。  四年前,川普在民調顯著落後的情況下獲勝,令人大跌眼鏡,選前民調可信度遭遇前所未有的質疑。
  • 美國大選100天倒計時:5數據表明拜登或將碾壓川普獲勝
    川普和他的支持者們卻對這看上去堪憂的景象不以為意,對拜登的民調優勢一直保持一臉無所謂的樣子,因為他們相信自己可以違抗民調公司給自己安排的命運,再次完成「2016奇蹟」。的確,2016是美國各大民調公司恥辱的一年,他們中的絕大多數都沒能正確預測川普的最終勝利。
  • 拜登支持率領先10%?美媒:這都是假象,川普會像2016年一樣獲勝
    在當前的民調中,拜登的支持率遠遠高於川普,領先超過了10%。一切似乎都已經成了定數,川普似乎也無力回天。但前日有美媒指出,事情或許還存在轉機,一些跡象表明,川普或許還存在機會。 10月20日,福克斯新聞網站刊登了加利福尼亞州共和黨前主席貝卡羅的文章,貝卡羅認為,一些明顯的細節表明,川普還存在著連任的可能性,如同2016年大選一樣。
  • 美國大選支持率最新民調 美國大選2020年什麼時候出結果
    最新民調顯示,拜登勝率較大,但參議院控制權依然焦灼;綜合看,市場預期民主黨「橫掃」依然是概率最大的情形。總統選舉方面,根據美國憲法,候選人獲得538張選舉人票中至少270票即獲勝。  2. 最新民調:民主黨「橫掃」,即同時掌控白宮、眾議院和參議院依然是概率最高的情形  1) 總統選舉民調。fivethirtyeight統計最新民調顯示(截至11月1日,下同),拜登vs.川普支持率為52.0% vs. 43.4%,拜登領先8.6個百分點。
  • 美國大選民調會不會再「失手」?聽聽專家怎麼說
    /《紐約時報》報導截圖「如果民調靠譜,那麼希拉蕊2016年已經當總統了。」自2016年預測大選結果的選前民調「失手」以來,4年間,人們反覆質疑,民調真能準確預測下一任美國總統?美國的民調機構和統計學家也在反覆總結,為什麼2016年民調幾乎「全軍覆沒」?
  • 為什麼如果拜登大選獲勝 歐洲經濟就會被看好?
    來源:新浪財經美國民調顯示目前拜登在11月的總統大選中擊敗川普的勝算頗大,有鑑於此,一些資金經理正在購買歐洲資產,因為他們預計如果白宮換屆,投注歐洲地區恐成最大贏家。有一些人表示,拜登的氣候和基礎設施計劃將提振歐洲清潔能源和周期性股市,而其他人買入歐洲股票主要是作為美國股市的替代選擇。他們預計,如果拜登當選後兌現提高企業稅的承諾,美國股市將遭拋售。儘管美國大選的結果非常不確定,而且正如過去的經驗顯示的那樣,很多事情可能在三個月內發生變化,但它有可能成為歐洲市場的又一個重大事件。
  • 美大選最後一場辯論即將開始 誰在民調中領先?
    民調:首場辯論讓拜登「穩住腳跟」民意調查能很好地反映出總統候選人在全國受歡迎的程度。自今年年初以來,拜登在大多數全國性民調中都領先於川普,且近幾個月,前者的支持率一直在50%左右。圖源:BBC官網截圖美國有線電視新聞網(CNN)在首場辯論結束後進行的民調顯示,60%的觀眾認為拜登贏得首場辯論,認為川普佔上風的只佔28%。此外,在辯論舉行後的兩天內,美國全國廣播公司(NBC)/華爾街日報進行了民意調查。結果顯示,辯論結束後,拜登對川普的領先優勢擴大到目前為止最大——高達14個百分點。
  • 最後24小時,川普和拜登都拼了!川普:計算每張選票是一個卑劣陰謀
    拜登則將最後賭注重點押在賓夕法尼亞州。多家美國媒體和機構公布的選前民調顯示,雖然拜登在全國民調中仍保持領先,但在關鍵搖擺州,兩人競爭相當激烈。CNN稱,川普和拜登都有通往勝利的道路。這場被美媒稱作「歷史性」的競選接近尾聲,美國社會對不確定性的擔憂卻不但沒有結束,反而在加劇。在一項全國調查中,與自己在這個不平常年份的痛苦遭遇相比,更多美國人擔心,這個國家將變得更糟。
  • 美國大選直播文:民主黨拜登暫時領先,川普或贏下關鍵洲佛州,美元...
    川普計劃在華盛頓觀看計票結果,拜登將在家鄉德拉瓦州。民調顯示拜登在全國和多數戰場州領先,但民主黨吸取希拉蕊·柯林頓2016年意外遭遇滑鐵盧的教訓,不敢因民調領先而有鬆懈。所有人都在關注賓夕法尼亞州,該州可能需要數天時間才能統計完選票,拜登在當地的領先優勢很小。川普將民調稱為「假新聞」,並稱他在共和黨內得到大力支持。