介绍
该建模项目的目标是利用公共卫生、人口统计和历史数据预测 2024 年大选的结果。这种独特的方法依赖于预测指标,这些指标可以代表某个群体对民主党的公众支持率。在美国,我们面临着二元选择,民主党或共和党,我们的选举取决于每个州的选举人票。因此,预测的响应指标只是一个州内的胜利幅度。
由于选举团制度的存在,预测选举结果本质上就是预测少数几个州的结果。大多数州都有可靠的历史,表明某一党派会以较大的优势获胜,而少数州则没有。数据和模型的准确性取决于它们能否准确预测这些州的结果。由于最近全国选举的样本量较小,而且近期数据点在模型中非常重要,因此它无法对获胜优势较小的州做出高精度的预测。因此,该模型的成功将取决于它能否发现哪些摇摆州可能比目前民意调查结果显示对民主党(或共和党)的支持率更高。
背景和假设
在过去两次总统选举周期中,我们看到民调结果大败。2016 年,几乎所有主要民调和媒体都未能发现民主党和独立人士的公众支持程度,而正是这种支持程度导致特朗普在关键摇摆州和铁锈地带获胜。2020 年,民调机构再次低估了特朗普在关键州的支持率。自那以后,人们对媒体调查和获取真相的能力的信任进一步减弱。
本分析旨在找到能够更准确地反映公众政治偏好的预测指标,而不受民意调查行业偏见的影响。由于新冠疫情的高度两极化性质,以及对新冠疫苗支持率的明确界线,公众对每年“新”版新冠疫苗的接受度与对民主党的支持度高度相关。由于每年都有一种新的新冠疫苗,因此持续的接受度被认为表明民主党的投票忠诚度。其他指标,如国内移民率和邮寄选票请求,与过去四年民主党的支持率密切相关。
此外,来自公共卫生来源的人口数据已被用作控制或预测变量,包括死亡率、出生率和心理健康。一些人口和人口动态与更倾向于共和党的州有关,另一些与更倾向于民主党的州有关,这些关系在近代历史上一直保持不变。其他指标,如净移民率,也有很强的关联,但这些指标是最近才出现的,而且受到了新冠疫情的影响,在此期间,许多封锁的蓝州出现净损失,而开放的红州则出现净收益。现在每年一次的新冠疫苗的受欢迎程度正在逐年下降,数据已被调整为衡量相对受欢迎程度,总体接种率高于平均水平的州反映出民主党支持率更高。
总体而言,该分析旨在结合长期趋势和近期趋势,以估计民主党目前的支持率。由于该模型必须使用选举前几个月(新冠疫苗)和几周(缺席选票请求)提供的数据进行训练,因此无法检测到任何最后一刻的变化。
正如乔治·博克斯所说,“所有模型都是错误的,但有些模型是有用的。”我希望通过这种分析,可以发现传统选举民意调查中可能不存在的信号。除了预测(主要是出于好玩),我还加入了一些摇摆州的分析,我认为这些分析可能会揭示过去四年发生的关键转变。
方法
由于可解释性和解释性在选举背景下至关重要,因此我坚持使用简单的模型。广义线性建模、逻辑回归和随机森林模型均基于 2020-2022 年的数据进行训练。结果或响应是民主党获胜的幅度。对于逻辑模型,预测的响应是该州的二元胜利或失败。由于每个模型都有自己的优点和缺点,以及自己的错误率,因此最终的胜利或失败分类将由多数票决定。我已将我的代码和数据上传到 github上,欢迎任何人批评、纠正或提供反馈。
限制
由于我决定使用各州的 Covid-19 疫苗接种率作为预测指标,这限制了可以收集的时间线和数据。因此,我预计该模型将偏向民主党。在 50 个州中,有 XNUMX 个州属于误差范围。这五个州都被视为摇摆州。出于分类目的,只有明显超出我的模型误差范围的州才会被归类为该党的胜利。误差范围内的州将被归类为胜负难料。
讨论
因为在美国,选举是二元选择,所以分析只关注民主党与共和党之间的对决,无法发现对立党派选民对候选人支持的变化。这揭示了该模型的一个核心假设,即这次选举仍然主要关乎党派忠诚度而非个人候选人。
对于民主党候选人卡玛拉·哈里斯,我相信这一假设是正确的,因为她不是通过初选期间的普选当选的,竞选活动的大部分内容都是为一个直到最近才被人们普遍忽视、排斥甚至嘲笑的女性塑造一个精心塑造的形象。我们可以看到,在过去的几个月里,辩论、暗杀企图和其他重大时刻根本没有对民意调查趋势产生任何重大影响。
对于唐纳德·特朗普,我不认为这种假设成立。特朗普的知名形象占据主导地位且无处不在。从他 2017 年至 2021 年的总统任期以及他与诉讼、暗杀企图和媒体痴迷的持续斗争来看,特朗普的胜利更多地说明了他自己而不是共和党。民主党是一台机器,共和党只是在领导人多年内斗和分裂之后才勉强巩固了对特朗普的支持。
由于该模型使用了 2020 年总统大选和 2022 年参议院选举的数据,因此它被训练为模拟政党支持率,因此存在固有的弱点。最近的民意调查结果对特朗普有利,但主要摇摆州的选举结果不分胜负。坚持我的方法和本次练习的意图,不包括任何这些数据。
摇摆州分析
选举结果将由少数几个州决定。目前,亚利桑那州、内华达州、威斯康星州、密歇根州、北卡罗来纳州、乔治亚州和宾夕法尼亚州的激烈竞争足以让选举结果朝着有利于任何一方的方向发展。在这些州中,模型将密歇根州和宾夕法尼亚州归类为稳操胜券的民主党州。其余州都在模型的误差范围内,因此被归类为胜负难料。
为了让读者直观地了解该分析的工作原理,这里对一些通常被认为是摇摆州的预测因素进行了细分。
国内移民率:2019-2023 年*
总体而言,净移民率与民主党的胜率呈负相关。在过去四年中,许多蓝州的人口不断减少,而红州的人口则不断减少。 各州都获得了。对于这些摇摆州,一些州在州长和州政府方面是“红色”,另一些州是“蓝色”。总体而言,宾夕法尼亚州和密歇根州是过去 2 年仅有的两个移民率呈负增长的州。
邮寄选票请求
有些州,如加利福尼亚州、科罗拉多州和内华达州,是“全邮寄”州。这意味着默认情况下,每位登记选民都会收到一张纸质选票。除犹他州(可能还有内华达州)外,几乎所有这些州都是蓝州,而且是坚定的蓝州。内华达州是唯一一个全邮寄的摇摆州,你可以看到它的请求保持平稳。除亚利桑那州外,其他大多数州的总体趋势是邮寄选票请求减少。
年度新冠疫苗接种情况**
由于模型使用年度新冠疫苗接种量作为 强预测 民主党支持率有所下降,但总体受欢迎程度正在下降,该模型使用相对评分来比较一年内各州之间的差异。除威斯康星州外,其余各州在 19 年**、2021 年和 2022 年的新冠疫苗接种率略低于平均水平。
*国内移民率与上一年持平。
**由于新冠疫苗直到 19 年才上市,因此 2021 年的数据与 2021 年选举结果数据配对。对于 2020 年和 2022 年,数据反映了当年新版本的接种情况。
为了了解预测因子对模型的重要性,下图根据每个指标对模型预测的影响程度对其进行了排名。如您所见,新冠疫苗接种率排在“先前民主党获胜”的下方。
成果
该模型预测哈里斯将在民主党稳操胜券的州赢得 260 张选举人票。如果宾夕法尼亚州和密歇根州确实有竞争,那么其中只有 226 张选举人票是民主党稳操胜券的。
该模型显示,特朗普将安全地赢得共和党将稳赢的州的 219 张选举人票。
摇摆州威斯康星州、乔治亚州、北卡罗来纳州、内华达州和亚利桑那州均有选举人票,共计 59 张选举人票。如果宾夕法尼亚州和密歇根州也加入其中,则共有 93 张选举人票。
哈里斯的胜利之路
哈里斯的胜选之路看起来最轻松。凭借更高的起始选举人票,“稳操胜券”后,她可以拿下几个摇摆州。模型显示宾夕法尼亚州和密歇根州是她的胜选州,如果她真的赢了,她只需要亚利桑那州、北卡罗来纳州、威斯康星州或佐治亚州中的任何一个州就能锁定胜局。如果她赢得宾夕法尼亚州或密歇根州中的一个州,那么她需要用 1-2 个额外的摇摆州来弥补损失。
特朗普的胜利之路
以“任何事情都有可能发生”的心态看待特朗普的道路很重要。他在前两次选举中的表现都超出了预期。大多数信息守门人、主流专家和选举民意调查员过去都犯了错误。
在赢得 219 票的情况下,特朗普必须拿下亚利桑那州、乔治亚州、北卡罗来纳州、威斯康星州和内华达州等所有摇摆州。如果特朗普赢得宾夕法尼亚州和/或密歇根州,那么他的竞选之路就会变得轻松,这意味着他仍然需要拿下剩余摇摆州中的 2-3 个。
查看下面的仪表板。互动查看两位候选人如何通过赢得摇摆州而获得胜利,并查看按州衡量的预测散点图。
基于模型的个人预测
我对北卡罗来纳州和佐治亚州有更多直觉,因为我在那里待过一段时间,我认为这两个州会支持特朗普。我对亚利桑那州、内华达州或威斯康星州没有这种直觉。所以对此持保留态度。但根据我的模型,宾夕法尼亚州和密歇根州会支持哈里斯,我相信她至少会拿下 2-3 个摇摆州。我希望我错了。
参考文献:
麻省理工学院选举实验室 https://electionlab.mit.edu/data#data
美国事实 https://usafacts.org/economy/
佛罗里达大学选举实验室 https://election.lab.ufl.edu/voter-turnout/
2022 年 XNUMX 月选举的投票和登记 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
疾病预防控制中心 https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
疾病预防控制中心 https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
五三十八 https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
KFF 疫苗监测仪 https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
佛罗里达大学选举实验室 https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
国家卫生统计中心 https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm 疾病预防控制中心 https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Census.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.html疾病预防控制中心 https://www.cdc.gov/covidvaxview/interactive/adults.html
国家卫生统计中心 https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
人口普查-贫困 https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
人口普查 - 各州人口变化 https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
美国大选项目 https://electproject.github.io/
转载自作者 亚组
发表于 知识共享署名4.0国际许可
如需转载,请将规范链接设置回原始链接 褐石研究所 文章和作者。