原創 服老思和同學們 P話
這是 pwords 的 36 次數據周報
再過不到半年,我們將迎來美國 2020 的總統選舉。
本次選舉受到全世界極高的關注。中美貿易戰徹底撕開,疫情嚴重衝擊經濟,美國多地大規模示威,都增加了許多不確定性。
為了幫助更多朋友了解這次選舉,我們準備了這次的專題數據周報,歷時約一個月,整理了超過 100 篇主流媒體報導、學術論文、專家博客,涵蓋信息圖、民調動態、大選綜述、2016 覆盤、網絡分析、文本分析、地圖製作等各方面。
下面,就讓我們從數據的角度來看看這場即將到來的大選。
全文共 15000 字,閱讀大約需要 30 分鐘。
#1. 2020 綜述
—
美國總統競選流程
2020 年 11 月,民主黨和共和黨候選人將競逐總統之位。根據美國憲法規定,美國總統選舉主要分為五個階段:黨內預選、黨內候選人提名、競選活動、全民投票、選舉人團投票,歷時接近 1 年。
美國總統選舉流程介紹 來源:https://www.usa.gov/election
各黨派競選人
根據美國憲法規定,總統必須年滿 35 歲、在美國出生,並且在美國居住至少 14 年。
民主黨和共和黨是美國兩個主要政黨,總統將會從兩黨派的候選人中決勝出。
來源:網絡
黨內初選
美國大選的第一步即黨內初選,即各政黨決定選舉出一位提名人。
美國的黨內初選主要分成六類:封閉式、半封閉式、開放式、半開放式、綜合式以及二輪決選制,主要區別在於是否允許弱黨派和獨立人士參與以及允許的參與程度。每個州黨內初選的制度都有區別,地方可以制定自己的選舉法規,選擇自己的選舉日期。
2020 年大選,共和黨內方面川普尋求連任,由於黨內缺乏有力的競爭者,加之其黨內支持率極高,所以今年的共和黨將會派出川普繼續出戰。
而民主黨方面,黨內有超過 20 名民主黨人爭取黨內提名。
民主黨內支持率較高的候選人有拜登、桑德斯、沃倫。其中拜登是美國前副總統,曾參加 1988 年和 2008 年兩屆美國總統選舉,但均未獲得提名。桑德斯也曾在 2016 年以民主黨人身份參與角逐總統選舉,但最終敗給希拉蕊。沃倫是民主黨內民調支持率最高的女性競選人,主張對華盛頓進行「重大的結構性改革」,其民調支持率在去年一直穩居前三,其於 2020 年 3 月 5 日宣布退選。
對於民主黨黨內候選人來說,今年 3 月 3 日,也就是「超級星期二」至關重要。美國許多州、行政區、管區在這天舉行民主黨初選。這意味著在 24 小時內,整個美國大約會開出三分之一的黨代表票,這些票數將在很大程度上決定黨內初選的最終結局。這是競選人可以獲得最多黨代表票的一天。此次「超級星期二」之後,拜登超前,其他民主黨候選人相繼退選。自 2 月 3 號第一場民主黨內初選選戰正式打響,直到 4 月 8 日桑德斯宣布退出初選,拜登正式被提名為民主黨候選人。
民主黨和共和黨各候選人獲得的黨代表票數(截止 5 月 23 日)
https://en.wikipedia.org/wiki/Primary_election#Primaries_in_the_United_States
https://zh.wikipedia.org/wiki/%E5%88%9D%E9%81%B8#%E5%88%86%E9%A1%9E
2020 年民主黨內初選各州情況
https://www.nbcnews.com/politics/2020-presidential-election
2016 年民主黨內初選各州情況 黃:希拉蕊 綠:桑德斯
選舉人團制度
根據美國選舉制度,美國總統最終由選舉人團,而非由選民直接選舉產生。各州選民投票給支持的總統候選人,同時投票選出參加兩黨全國代表大會的代表。各州的兩黨根據選民投票結果為各總統候選人分配黨代表票數,黨代表須承諾支持指定的總統候選人。絕大多數州和華盛頓特區均實行「勝者全得」規則,即把本州或特區的選舉人票全部給予在本州或特區獲得相對多數選民票的總統候選人。全國選舉人票為 538 張,按照規定,總統候選人需要獲得至少 270 票才能當選。
相關連結:https://zh.wikipedia.org/wiki/%E7%BE%8E%E5%9B%BD%E9%80%89%E4%B8%BE%E4%BA%BA%E5%9B%A2
川普和其他美國總統的同期支持率對比
和其他總統同期支持率對比可以看到,相比往屆總統,川普民眾支持率都偏低。從相對趨勢來看,大多數總統任期內的民調會有大幅度的波動,呈大規模下降趨勢;對比來看,川普的民調波動浮動較小,整體較平穩,且呈現上升趨勢。
川普和其他美國總統的同期支持率對比
https://projects.fivethirtyeight.com/trump-approval-ratings/
相比前任,民調顯示川普並不令美國民眾滿意。雖然其在共和黨內的滿意度很高,但在民主黨和獨立黨派的民眾中,其滿意度都低於其他總統。
2018 年 7 月和 2019 年 12 月川普民調和其他總統任期內民調對比
2018 年 7 月和 2019 年 12 月川普民調和其他總統對比(按黨派)
https://fivethirtyeight.com/features/trump-may-be-even-more-unpopular-than-his-approval-rating-shows/
川普任期內支持度
川普四年任期內的民調水平相對較平穩。考慮全球疫情爆發這一重要因素,單看自三月份以來,川普的支持率並未受到太大影響,反而在 3 月有過一些正向波動。但同時我們也要考慮到,其近一個月的支持率有所回落,呈下降趨勢。但整體來看,川普目前的支持率仍屬於任期內的中偏上水平。
川普民眾支持率變化 來源:FiveThirtyEight
經濟
美國的經濟發展是影響川普支持率的重要因素。在其任期的前三年,美國經濟整體向好。川普前三年民調一直保持平穩,且整體呈上升趨勢,美國經濟向好或許也是其中的重要原因,選民大多認可其經濟和外交政策。但現在受疫情的影響,美國經濟收縮,失業人數攀升,川普復甦經濟舉措以及成效也很關鍵,將會很影響其十一月大選的支持率。(選舉很重要的是選民對於選舉人的信心,川普前三年的經濟措施建設了選民對於其經濟制裁的信心,但疫情爆發這樣的特殊情況,他的行為將會更加關鍵,是否能讓民眾繼續信任?這也很重要)
對比歐巴馬和川普總統期間美國的失業率,截止 2019 年,美國失業率從 2016 年末的 4.7% 持續下降至 2019 年的 3.7%。
美國近十五年失業率(灰色部分為歐巴馬任期) 來源:https://www.washingtonpost.com/business/2019/08/20/trump-v-obama-economy-charts/
但同時,2020 年的新冠疫情,極大影響了美國的失業率。下面「是否連任和美國失業率變化「的關係圖,過往總統選舉數據表明,要獲得競選連任失業率非「下降」不可(見圖中左半部);而目前,美國失業率紀錄從4%飈升到25%,超過 20% 的升幅。在失業率上升的情況下,暫時還沒有連任的案例。
美國總統任期前後失業率變化 來源:https://twitter.com/CapEconMarkets/status/1257584139978641408
從美國道瓊工業指數來看,川普任期內其穩定增長。
美國近二十年道瓊工業指數 來源:https://www.bbc.com/news/world-45827430
考慮美國的經濟結構以服務業為主,下面展示了美國 ISM 非製造業指數近十年的變化。ISM 非製造業指數主要追蹤美國非製造業活動情況,是重要的經濟指標之一。川普任期內,ISM 非製造業指數整體水平上升。從最近的指數變化可以看到,指數在疫情爆發後直線下跌。
美國近十年美國 ISM 非製造業指數 來源:https://tradingeconomics.com/united-states/non-manufacturing-pmi
疫情影響
從下圖可以看出,民眾對於川普政府處理疫情的方式並不滿意,但 3 月民調較為平穩,從 4 月開始,隨著美國本土以及世界範圍內疫情的加重,支持率明顯持續下降,不支持率持續上升。
美國民眾對於川普政府疫情相關舉措的支持率變化
從下圖可以看出,接近 6 成美國民眾對疫情對經濟的影響持非常擔憂的態度,3 成民眾部分擔憂。上升的擔憂情況主要爆發在 3 月,從 4 月開始,民眾的擔憂保持在穩定的狀態,沒有明顯的下滑和上升。
美國民眾對經濟受疫情影響的擔憂變化
從下圖可以觀察到不同黨派人士對川普政府舉措的滿意程度變化。美國疫情爆發以來,除民主黨人士對其支持率下降之外,共和黨和獨立黨派人士對其滿意程度並沒有明顯變化,甚至在三月末有上升趨勢。由此我們可以猜測,其黨內支持率並沒有受到太大影響。但可以看到,自 4 月中以來,各黨派人士對其支持率都有緩慢下降的趨勢。
美國民眾對川普的滿意度變化(分黨派)
https://projects.fivethirtyeight.com/coronavirus-polls/
民調方法解釋:https://fivethirtyeight.com/features/how-were-tracking-donald-trumps-approval-ratings/
拜登和川普的民調比較
目前根據 Real Clear Politics 的民調可以看到,近五個月拜登的支持率基本穩定高於川普五個百分點左右,相對較平穩。相比 2016 年同期,希拉蕊和川普之間民調差距的波動更大更不穩定,兩黨派候選人的民調差距也更小。
但由於總統大選中的黑天鵝事件往往會造成很大的影響,譬如 2016 年希拉蕊的郵件洩漏事件。拜登目前唯一的醜聞是五月份的「性侵」指認,但由於事件本身證據單薄,加之疫情吸引了民眾更多的注意力,事件似乎並沒有對其民調造成很大影響。但現在離總統大選最終投票還有半年左右,所以很難預測之後是否有其他黑天鵝事件發生。
另外一個重要的變化是,在 2020 年之前,可以看到民眾對於拜登和川普的支持率是此消彼長,這一點在 2016 年總統大選中也很明顯。但在 2020 年之後,民調對於兩位總統候選人的支持卻近乎同步,升降趨勢大體一致,總體降低。是否可以猜測,民眾對於選舉的關注性降低。這也為今年大選結果增加了更多的不確定性。
2020 年拜登 & 川普 Real Clear Politics Poll Average 指數變化對比
2016 年希拉蕊 & 川普 Real Clear Politics Poll Average 指數變化對比
美國人對 2020 年大選的新聞關注遠不及疫情
Pew Research Center 在 4 月 20 日至 26 日進行的一項調查發現,當美國大選遇上疫情,媒體和民眾的關注度更多放在後者,這也為今年的大選結果增添了更多的不確定性。
https://www.pewresearch.org/fact-tank/2020/05/22/americans-are-following-news-about-presidential-candidates-much-less-closely-than-covid-19-news/
搖擺州
自 2000 年以來,大多數州在美國大選中都投票支持同一黨,所以這些州常常被認為是堅定的民主黨票倉或共和黨票倉。而剩下那些沒有一個單一政黨擁有壓倒性支持度以取得選舉人票的州被稱為「搖擺州」。
下圖中,深藍色的州為堅定的民主黨票倉,淺藍色為偏民主黨的州;深紅色為共和黨票倉,淺紅為偏共和黨的州;黃色則為搖擺州。
美國各州政治傾向劃分 來源:https://www.ft.com/content/6395f321-1390-4d50-9607-b0c7f629925e
搖擺州通常是大選的關鍵,根據民調數據,目前除北卡羅來納民調顯示川普支持率高於拜登外,在其他各搖擺州,拜登支持率高於川普。但考慮到 2016 年在各民調均顯示搖擺州希拉蕊民調高於川普的情況下,民主黨卻以細小差距失掉大多數州,所以對於民調結果依然要保持辯證態度看待。
搖擺州的選民近期民調變化
更進一步,根據 FT 報導,2016 年到 2020 這四年間,幾個搖擺州的選民越來越多樣化。淺藍色代表整體來看全國選民的變化,深藍色為對應州的選民變化。
美國各搖擺州疫情:
搖擺州因疫情死亡人數及預計死亡人數 來源:FT
從美國 4 月份的失業率來看,搖擺州的就業率不樂觀,這或許也將對兩位候選人在搖擺州的支持率帶來一些影響。
美國各州 4 月失業率(紅色標註為搖擺州) 來源:https://www.bls.gov/web/laus/laumstrk.htm
美國各搖擺州失業率變化 來源:FT
從 GDP 角度看,預計美國第二季度 GDP 將下降 29%,而大多數搖擺州的 GDP 下降幅度高於全國平均水平。搖擺州不穩定的經濟狀況也並不利於現任總統在各州的支持度。
美國各搖擺州第二季度預計 GDP 收縮情況 來源:FT
2016 年和 2020 年民主黨內初選選舉情況對比
隨著桑德斯的退出,拜登成為民主黨唯一候選人,將代表民主黨參加 2020 年的美國大選。比較 2020 年和 2016 年的民主黨各州初選結果,同時比較分析三位現在/曾經的民主黨候選人 ---- 希拉蕊、桑德斯和拜登在不同地區和群體間的優勢。可以看到,大片玫紅色區域代表 2016 支持希拉蕊,2020 年支持拜登的區域。橙色代表 2016 年支持桑德斯而今年轉而支持拜登的區域。
https://fivethirtyeight.com/features/how-is-joe-biden-remaking-the-2016-primary-map/
#2. 社交媒體
—
關注歐巴馬的成年美國推特用戶比關注川普的多
Pew Research Center 通過分析,估計在美國大約 19% 的成年推特用戶關注川普。而約有 26% 關注歐巴馬。由於推特是國際性平臺,且存在殭屍帳號,所以 Pew Research Center 基於對 2388 位使用推特的美國成年人的代表性樣本計算。
分黨派來看,民主黨議員的追隨者普遍遠高於共和黨議員的追隨者,可以由此推測,民主黨在推特上更有影響力。
歐巴馬和川普推特追隨者數量統計
https://www.pewresearch.org/fact-tank/2019/07/15/about-one-in-five-adult-twitter-users-in-the-u-s-follow-trump/
六成川普推特追隨者非活躍用戶?
根據 2018 年 10 月 SparkToro 的分析,川普的推特追隨者中超過60%的帳戶(約3,300萬個帳戶)被認為是假帳號。SparkToro 基於機器學習的工具分析了川普的所有追隨者,發現其中很多帳戶很有可能是偽造帳號。
這一情況同樣出現在其他總統的推特帳號上,且都不低。
https://qz.com/1422395/how-many-of-donald-trumps-twitter-followers-are-fake/
美國人對 2020 年大選的新聞關注遠不及疫情
Pew Research Center 在 4 月 20 日至 26 日進行的一項調查發現,有 52% 的美國人對 2020 年選舉候選人的新聞相當關注,相比 2 月的調查數字 59%,大家對選舉候選人的關注有所下降。在 2016 年 4 月,有 69% 的美國人表示他們相當關注選舉候選人新聞,這一數字遠高於 2020 年民眾選舉的關注。
調查發現,87% 的調查者表示,他們非常關注疫情相關信息消息。當美國大選遇上疫情,媒體和民眾的關注度更多放在後者,這也為今年的大選結果增添了更多的不確定性。
調查同樣顯示,男性、年齡較大和大學學歷以上的人,更加關注 2020 選舉。
https://www.pewresearch.org/fact-tank/2020/05/22/americans-are-following-news-about-presidential-candidates-much-less-closely-than-covid-19-news/
數據顯示推特用戶對川普推文的參與度降低
2019 年 7 月,Quartz 對川普的個人推特帳戶數據進行的分析顯示,自 2019 年初到七月,川普推文的參與度直線下降。
2017 年到 2019 年七月川普推文的參與度變化
https://qz.com/1665059/data-show-trump-is-right-fewer-people-like-his-tweets-now/
記者和川普支持者在推特上「脫節」
MIT Media Lab 通過分析社交媒體公司提供的完整數據集發現,在推特上,川普的支持者在大選期間談論政治時組成了一個孤立的團體,他們與柯林頓的支持者或主流媒體之間沒有什麼聯繫。也就是說,川普的支持者有自己的信息來源,而非主流媒體,所以主流媒體的信息很觀點很難影響他們。相比之下,希拉蕊的支持者和記者之間在推特傷的聯繫更緊密。這也可以再次解釋,2016 年在主流媒體都支持希拉蕊的情況下,川普最終勝利的原因。
研究者在最後也表明,由於分析的數據來源於推特這一單一社交媒體,並不一定能代表美國的整體情況。
相關閱讀:��老文存檔 | 據說,未來的城市長這樣
https://www.vice.com/en_us/article/d3xamx/journalists-and-trump-voters-live-in-separate-online-bubbles-mit-analysis-shows
新聞媒體如何在選舉中報導川普和柯林頓
作者分析 2016 年美國總統選舉前兩個月中來自美國排名前 53 位的新聞媒體機構的超過 12,000 條有候選人圖片的 Facebook 帖子,探究媒體如何報導兩位候選人。
可以看到,帶有川普圖片的帖子明顯多於希拉蕊,也就是說,一定程度上川普得到了更多的媒體曝光度和關注度。
https://pudding.cool/2017/03/elections/
推特的回音室效應
本研究考察了 2016 年美國總統大選在Twitter上的「回音室現象」。使用網絡分析和「大數據」分析來分析川普和希拉蕊超過5000萬條推文。結果表明 Twitter 社區上有關川普和柯林頓在政治上的同質性和輿論領導力都有很大的差異,這其中,推特上的意見領袖在回音室效應上起到了很大的作用,他們負責創造較為同質化的推特社群。
根據作者研究,與希拉蕊相關的十大推特意見領袖主要都是新聞機構或媒體專業人員,其中 WikiLeaks 的影響力僅次於希拉蕊本人的官方帳號,這可能簡介證明 WikiLeaks 事件在希拉蕊選舉失敗中佔到的重要位置。而川普相關的意見領袖,更換頻繁得多,基本每周會更換一次,其中經常出現的人包括川普本人的官方帳號以及 CNN 等。其中十大最經常出現的意見領袖中,六位來自右派的媒體組織,其中大多數是新聞記者。統計分析還顯示,以右派的意見領袖在推特社區有關川普的影響力比希拉蕊更具影響力。
最後作者總結:
當前批評回聲室效應還為時過早,因為當前有關其的批評通常忽略網絡討論中發現的細微差別。我們的發現表明希拉蕊和川普的 Twitter 網絡有很大的不同,不同的意見領袖都對 Twitter 社區的網絡性質做出了不同貢獻,很難得一個籠統結論。這項研究的結果揭示雙方 Twitter 網絡的細微差別,並希望大家對 Twitter 網絡以及意見領袖如何參與回聲室效應進行更謹慎的研究。
https://www.researchgate.net/profile/Lei_Guo23/publication/326525655_Who_is_responsible_for_Twitter%27s_echo_chamber_problem_Evidence_from_2016_US_election_networks/links/5c3c923e299bf12be3c6bdd8/Who-is-responsible-for-Twitters-echo-chamber-problem-Evidence-from-2016-US-election-networks.pdf
分析社交網絡對 2016 年共和黨初選的影響
作者通過分析推特數據和 Reddit 論壇數據,通過情感分析,分析選民對共和黨內初選選舉人的態度,以及在 Reddit 論壇上與不同選舉人相關議題的不同側重。
http://snap.stanford.edu/class/cs224w-2015/projects_2015/Analysing_Social_Network_Reactions_to_2016_Republican_Primaries.pdf
Twitter 意見趨勢與民意調查匯總:希拉蕊 vs 川普
主要介紹了通過對推特信息進行自然語言分析等處理研究推特上有關選舉的意見趨勢,並與傳統民調之間的吻合性進行對比,探討一種可在社交媒體時代使用的,結合社交媒體分析的民調方法。
https://www.nature.com/articles/s41598-018-26951-y.pdf
推特上的俄羅斯假帳號
作者利用 NBC 新聞發布的超過 200,000 條推文的資料庫,研究 2016 美國大選背後與俄羅斯有關的惡意帳戶。
他們發現這些帳戶大多創立於 2013 年,最常見的推文內容包括黑人、警察等。而 2016 年一些實時熱點的討論高峰都與這些假帳號有關。
作者總結:
這些偽造的帳戶通常通過名稱偽裝成 1)普通美國人,2)具有大都會名稱的新聞網站或,3)帶有相關主題(例如政治和宗教信仰)的國際名稱;他們通過在諸如醜聞和大型公告發生的周末等發布主觀性較強的推文來實現影響其他 Twitter 用戶對於事件的看法。同時,他們擅長使用推特的趨勢標籤進行宣傳,從而增加了其他 Twitter 用戶對於相應事件的關注。
https://towardsdatascience.com/russian-fake-tweets-visualized-6f73f767695
數據連結:https://www.nbcnews.com/tech/social-media/now-available-more-200-000-deleted-russian-troll-tweets-n844731
#3. 2016 回顧
—
1896 年紐約時報首張選舉地圖
根據 Matthew Ericson 的分享,紐約時報首張選舉地圖發表於 1896 年 11 月 4 日。
1896 年紐約時報首張選舉地圖
http://www.ericson.net/content/2010/11/first-nyt-election-map/
2016 美國大選預測哪裡出了錯?
作者認為,導致大部分預測結果出錯的其中一個重要原因是 2016 年大選中社交媒體在吸引選民方面發揮了重要作用。
•川普從其」數字優先「的策略中極大獲益。
•預測選舉本身非常困難,因為影響結果的變量往往很多,且變化率高。
•在方法上,從傳統選舉中積累的經驗和參考數據不再那麼適用於 2016 年的選舉。未來的選舉預測需要結合大數據並改進預測方法,從而提高預測結果的準確性和及時性。暫時還沒有足夠的歷史數據可以可靠得將社交媒體數據納入統計考慮。
https://link.springer.com/article/10.1057/s41270-016-0010-2
誰會成為美國總統?
作者 Nate Silver 是有名的總統選舉預測專家。2008 年,他預測的 50 個州中的 49 個是正確的;2012 年,他的 50 個預測全部準確。然而在 2016 年,知道選舉結果公布前,Nate 都表示 Trump 僅有不到 30% 的成功率。在 2016 年,他錯選了 5 個州,導致大約 70 票的選票錯位。
https://projects.fivethirtyeight.com/2016-election-forecast/
2016 年實時選舉預測 -- 紐約時報
每年美國大選,媒體及民間機構都會實時預測大選結果,追蹤最新的民調動態。
https://www.nytimes.com/elections/2016/forecast/president
哪些因素會左右 2016 美國大選?
下面的作品來自 FiveThirtyEight,2016,FiveThirtyEight 憑藉這一作品獲得 Data Journalism Awards 中的 「News data app of the year (large newsroom) 」。作品中各圖表間的變量相互關聯,讀者可以通過自行更改變量查看因素對於不同州結果以及最終選舉結果的影響。
https://projects.fivethirtyeight.com/2016-swing-the-election/
選區邊界劃分對結果的影響
來自 FiveThirtyEight 的作品。2018 年獲得了由全球編輯網(Global Editors Network,GEN)發起和組織的數據新聞 --- 年度新聞程式獎(Data Journalism Awards,DJA)。美國選區劃分對於選舉結果的影響一直飽受爭議,如果採用不同的選區繪製方式,大選結果會有怎樣的變化呢?作品嘗試了另外七種劃分選區邊界的方法,探討在選民投票意願不改變的情況下,對地區邊界的更改如何從改變美國眾議院的黨派和種族組成。讀者可以選者從宏觀角度看全國情況,也可以選擇觀察不同州的具體變化。
作品按照七個目標進行選區劃分:
1.現有國會選區劃分模式
2.「共和黨佔優」模式
3.「民主黨佔優」模式
4.使選民的黨派細分與選民相匹配
5.提高選舉競爭模式
6.最大化少數族裔地區的數量模式
7.優先考慮選區區域緊湊模式(使用算法)
8.遵循縣邊界同時儘量使區域緊湊模式
左圖為「共和黨佔優」的選區劃分;右圖為「民主黨佔優」的選區劃分
作品背後使用的方法比較複雜,設計大量繪製和分析工作,作者團隊也專門寫文章進行了詳細的解釋,感興趣的朋友可以移步 https://fivethirtyeight.com/features/we-drew-2568-congressional-districts-by-hand-heres-how/ 進行進一步研究。
https://fivethirtyeight.com/features/we-drew-2568-congressional-districts-by-hand-heres-how/
https://projects.fivethirtyeight.com/redistricting-maps/
由於美國大選採用「選舉人團制度」,選區的劃分有時起到至關重要的作用。路透社的報導簡單介紹近年幾個更改選區劃分的案例,解釋重新劃分的選區怎樣影響最終的黨派結果。
https://graphics.reuters.com/USA-COURT-GERRYMANDERING/010091701PF/index.html
圖表怎樣誤導觀眾?
左邊為實際地圖,右邊為按人口扭曲的變形地圖(Cartogram)。左上角為典型的大選結果地圖(為考慮不同州的人口密度);右上角通過縮放州的大小使各州面積與選舉票數成正比來表示選舉結果。左下角為更為細分的縣級圖;右下角為根據各州人口調整後的結果地圖。
可以看到,對地圖進行不同的處理,產生的視覺效果也有很大的不同。
http://www-personal.umich.edu/~mejn/election/2016/
下面是一個「川普如何使用柱狀圖誤導觀眾」的案例。圖像中的亮色區域為川普使用的結果圖片,作者根據比例補全完整的柱狀圖,可以看到,在很多張圖片中,川普團隊為了突出結果的差異性,使用截圖,從而誤導觀眾。但搞笑的是,在一部分柱狀圖中,川普本來獲得更多的優勢,反倒被弱化了。
https://www.washingtonpost.com/graphics/politics/2016-election/trump-charts/
美國選舉地圖
動態展示了 1960 到 2016 年美國選舉地圖,可以看到 50 年來紅藍兩黨的變化,地圖精確到縣。
https://vanderbei.princeton.edu/JAVA/election2016/
川普的推特
紐約時報統計川普自 2017 年的共 11000 條推文,對推文內容進行統計分析。他最常發推文的主題是什麼?根據統計,川普共發過 5889 條抨擊他人的推文,其中 4469 條 針對民主黨、調查機構和新聞媒體,851 條針對少數群體。
https://www.nytimes.com/interactive/2019/11/02/us/politics/trump-twitter-presidency.html
Podesta Emails
2016 年 3 月,民主黨候選人希拉蕊美國總統競選主席 John Podesta 的個人電子郵件造成數據洩露。WikiLeaks 隨後獲得了部分 Podesta 電子郵件,並于于 2016 年10 月 和 11 月發布了20,000頁電子郵件。這場信息洩漏被認為在一定程度上導致了希拉蕊在選舉中的失敗。
Podesta Emails 是一個 2016 年大選中的關鍵事件,使一些支持者離開了希拉蕊。現在,麻省理工學院的 ClintonCircle 項目已經無法訪問,但是還是可以通過其它方式搜索到一些摘要。
2016 年 6 月 1 日 - 11 月 8 日 Google Trend 趨勢 來源:https://fivethirtyeight.com/features/wikileaks-hillary-clinton/
相關連結:
https://web.archive.org/web/20161107065550/https://clinton.media.mit.edu/
數據源wikileak: https://web.archive.org/web/20161107184300/https://wikileaks.org/
Co sponsorship
所有網絡都是使用 Fruchterman-Reingold 力導向算法繪製的有向圖。通過同一法案發起人和共同發起者作為中間聯繫,連接不同的議員。其中每個點代表一名參議院/眾議員議員,民主黨以藍色顯示,共和黨以紅色顯示,獨立人以綠色顯示,其他人以灰色顯示。
議員之間邊的權重計算,使用了 Gross,Kirkland 和 Shalizi 提出的 "relative weighted propensity to cosponsor" (WPC) ,即根據每個議案支持人數做的加權平均。 眾議院的圖表僅展示 WPC ≥ 0.45 時的關係,參議院的圖表僅在 WPC ≥ 0.15 時的關係。
可以從圖表的疏密程度看出美國兩黨間關係的變化。
Co sponsorship of bills showing the trend of two parties political polarisation
https://f.briatte.org/parlviz/congress/plots.html
#4. 民調資源
—
民調,根據維基百科的介紹:
是一種了解公眾對某些政治、經濟、社會問題與政策的意見和態度,由專業民調公司、媒體或是政府單位進行的調查方法,其目的在於通過網絡、電話、或書面等媒介對大量樣本的問卷調查抽樣,來嘗試在統計學上較為客觀、精確地推論社會輿論或民意動向。
最早的民調可以追溯到 1824 年的總統選舉,哈裡斯堡賓州人報(The Harrisburg Pennsylvanian)詢問路過的行人要投票給哪位候選人。
民意調查涉及多個方面:問題涉及、樣本選擇、抽樣數量、對誤差的解釋等。由於各家民調機構的設計和解讀有所不同,這也導致結果會有區別。除了具體的民調設計會影響結果,民調機構的政治傾向和背景也是影響結果的重要因素。
民調類型:
•普通民調
•匯總型民調
匯總型民調機構
三個大的機構會定期公布各種民調的平均值,採用的方法都是匯總各州和聯邦範圍的各種民調結果,但選取的數據源和計算方法會有一些區別,導致結果也不會不同。感興趣具體計算方法的朋友可以去官網研究。
最近三大機構也實時公布有關美國大選的各項民意調查結果。
Pollster
2006 年成立的一家民意調查匯總站,由 HuffPost 運營。
調查方法解釋:https://elections.huffingtonpost.com/pollster/faq
傾向
•其背後的Huffingtonpost 本身政治左傾
•Pollster現在是 Verizon Media 的一部分
https://elections.huffingtonpost.com/pollster
Real Clear Politics
RealClearPolitics 於2000年由 Tom Bevan 和 John McIntyre 創立。如今,RealClearPolitics 已從發展成為一家綜合性媒體公司– RealClear Media Group,並提供包含情報、軍事、調查性新聞等內容。其中最著名的依然是民調相關的內容。
連結:https://www.realclearpolitics.com/epolls/other/president_trump_job_approval-6179.html
計算
通過收集各種民調計算 RCP Average。
連結:https://www.realclearpolitics.com/epolls/2020/president/us/general_election_trump_vs_biden-6247.html
傾向
•「媒體偏向分析」網站查詢,民調 Real Clear Politics 的傾向偏右。
•網站創始人之一 McIntyre 發表過右傾的言論和看法(十幾年前的事情)
•在2008年美國總統大選期間,《華爾街日報》多次將RealClearPolitics稱為「無黨派」。紐約時報在其報導中也稱該網站為「無黨派」。
來源:https://en.wikipedia.org/wiki/RealClearPolitics
偏向分析查詢網站:https://mediabiasfactcheck.com/real-clear-politics/
FiveThirtyEight
FiveThirtyEight 是一個專注於民意測驗分析,政治,經濟學和體育的網站。其現任主編為 Nate Silver,其因在 2008 年和 2012 的選舉預測為人熟知。2013年7月,ESPN 收購了FiveThirtyEight;2018年被 ABC News 收購。
FiveThirtyEight 啟動「不贊成」川普的等級跟蹤。根據官方對於數字的來源解釋:
我們使用能找到的所有民意調查(只要我們認為它們是真實的科學調查)。同時我們使用了根據民意測驗等級對民意測驗加權的公式,該等級基於民意測驗者自1998年以來預測選舉的歷史準確性以及一對易于衡量的方法論檢驗。
傾向
•根據媒體傾向核查:輕微左傾
•母公司 ABC News 政治傾向左傾
https://projects.fivethirtyeight.com/trump-approval-ratings/
方法解釋連結:https://fivethirtyeight.com/features/how-were-tracking-donald-trumps-approval-ratings/
參考連結:https://www.dw.com/zh/%E4%B8%93%E8%AE%BF%E5%A6%82%E4%BD%95%E7%9C%8B%E6%87%82%E7%BE%8E%E5%9B%BD%E5%A4%A7%E9%80%89%E6%B0%91%E8%B0%83/a-19550518
CREDIT
—
•寫作:@包小包
•編輯:@服老思
•排版:bee
完
—
數據科學 | 數字廣告 | 未來主義
原標題:《數據周報之美國大選》
閱讀原文