赤褐色砂石 » 布朗斯通学院期刊 » 合理性而非科学主导了 Covid 大流行的公共讨论
合理性不科学

合理性而非科学主导了 Covid 大流行的公共讨论

分享 | 打印 | 电子邮件

“坦率地说,对我的攻击是对 科学” ~ Anthony Fauci,9 年 2021 月 XNUMX 日 (MSNBC)。

荒谬.

一方面,Fauci 博士在整个 Covid-19 大流行期间没有准确报告科学问题。 另一方面,科学的基本辩证法是争论、质疑和辩论。 没有辩论,科学只不过是宣传。 

然而,有人可能会问,近三年来,如果不向国际公众展示技术材料,怎么可能让人们普遍理解这些问题是“科学的”,而实际上它们并非如此? 我断言,在大流行期间通过传统媒体向这些公众提供的信息在很大程度上是合理的,而不是科学,美国和国际公众以及大多数医生和科学家自己都无法分辨区别。 然而,差异是根本而深刻的。

科学从理论、假设开始,这些理论、假设具有可检验的经验结果。 然而,这些理论不是科学; 他们 激励 科学。 当个人进行实验或观察对理论的影响或分支产生影响时,科学就会出现。 这些发现倾向于支持或反驳这些理论,然后对这些理论进行修改或更新以适应新的观察结果,或者如果有令人信服的证据表明它们无法描述自然则将其丢弃。 然后重复该循环。 科学 是为了获得证实或反驳理论的证据而进行的经验或观察工作。

一般而言,理论往往是描述自然如何运作的特定事物的似是而非的陈述。 合理性在旁观者的眼中,因为对于技术知识渊博的专家来说似乎合理的东西对于外行人来说可能并不合理。 例如——也许过于简单化了——日心说在尼古拉·哥白尼 (Nicolaus Copernicus) 于 1543 年发表他的理论之前是不可信的,并且在之后的相当长一段时间里它也不是特别可信,直到约翰内斯·开普勒 (Johannes Kepler) 了解到第谷·布拉赫 (Tycho Brahe) 所做的天文测量建议将哥白尼的圆形轨道改进为椭圆形,以及数学规则似乎支配着行星沿这些椭圆的运动——但这些数学规则的原因,即使它们很好地描述了这些运动,直到艾萨克·牛顿在 1687 年假设存在一个普遍的引力场之前都是不合理的质量之间的力,以及控制引力大小的质量比例、平方反比距离定律,并观察到许多与该理论一致并支持该理论的定量现象。

对于今天的我们来说,我们几乎不考虑椭圆日心太阳系轨道的合理性,因为跨越 335 年的观测数据与该理论高度一致。 但是我们可能会拒绝认为光同时以粒子和波的形式传播是合理的,并且对光进行测量,我们作为观察者所做的,决定了我们看到的是粒子行为还是波行为,我们可以选择观察任何一种粒子或波浪,但不能同时出现。 自然不一定是合理的。

但同样,似是而非的理论很容易让人相信,这就是问题所在。 这就是我们在近三年的 Covid-19 大流行中所得到的。 但事实上,我们被灌输的是合理性而不是科学的时间要长得多。

货物崇拜科学

在 1960 年代和 1970 年代,声称可以用意念弯曲勺子,或声称研究无法证实、无法复制的“超感官知觉”的江湖骗子非常流行。 对“科学”可以建立什么的奇怪信念达到了这样的水平,以至于诺贝尔物理学奖获得者理查德费曼发表了 1974 年加州理工学院的毕业典礼演讲(Feynman,1974)哀叹这种非理性的信念。 他的言论并非针对普通大众,而是针对即将毕业的加州理工学院学生,其中许多人注定要成为学术科学家。

在他的演讲中,费曼描述了二战后南海岛民如何模仿战争期间驻扎在那里的引导飞机降落补给品的美国士兵。 岛上居民使用当地材料,重现了他们目睹的美国大兵的形态和行为,但没有补给。

在我们的上下文中,费曼的观点是,除非一个理论有客观的经验证据支持它,否则它仍然只是一个理论,无论它对每个接受它的人来说看起来多么合理。 岛民们忽略了一个关键事实,即他们不了解供应系统是如何工作的,尽管他们对供应系统的复制是多么合理。 费曼觉得有必要警告即将毕业的加州理工学院学生合理性和科学之间的差异,这表明他们在学院教育中没有充分了解这种差异。 当作者在那几年读本科时并没有明确教授它,但不知何故,我们被期望“通过渗透”学会它。

循证医学

今天也许没有比“循证医学”(循证医学)。 这个词是戈登·盖亚特 (Gordon Guyatt) 于 1990 年创造的,此前他的第一次尝试“科学医学”未能在前一年获得认可。 1991 年,作为一名大学流行病学家,我被使用 EBM 这个术语时的傲慢和无知所侮辱,好像医学证据在某种程度上是“不科学的”,直到宣布了一门具有新证据规则的新学科。 我并不是唯一一个批评 EBM 的人(Sackett 等人,1996 年),尽管大部分负面反应似乎是基于叙述控制的丧失,而不是基于对没有“EBM”的情况下医学研究实际取得的成就的客观审查。

西方医学知识积累了数千年。 在希伯来圣经(出埃及记 21:19)中,“当两方争吵,一方打另一方时……受害者将被彻底治愈” [我的翻译] 这意味着存在具有各种医学知识的人并且某种程度的疗效继承。 公元前五四世纪的希波克拉底提出,疾病的发展可能不是随机的,而是与环境暴露或某些行为有关。 在那个时代,有很多今天我们认为是良好医疗实践的反例。 尽管如此,考虑医学知识的合理证据是一个开始。

James Lind(1716-1794)提倡通过食用柑橘来预防坏血病。 这种治疗方法在古人中广为人知,尤其是英国军事外科医生约翰·伍德尔 (John Woodall, 1570-1643) 早些时候曾推荐过——但伍德尔被忽视了。 林德获得了荣誉,因为他在 1747 年对 12 名坏血病患者进行了一项小型但成功的非随机对照试验,将橙子和柠檬与其他物质进行比较。

在 1800 年代,Edward Jenner 将牛痘用作天花疫苗,通过在其他动物身上进行培养,并在暴发时普遍使用,因此到 1905 年最高法院审理 雅各布森诉马萨诸塞州, 首席大法官可以断言,医疗当局同意天花疫苗接种是普遍接受的程序。 医学期刊也在 1800 年代开始定期出版。 例如, Lancet 于 1824 年开始出版。积累的医学知识开始得到更普遍和更广泛的分享和辩论。

快进到 1900 年代。 1914-15 年,Joseph Goldberger (1915) 进行了一项非随机饮食干预试验,得出的结论是糙皮病是由饮食中缺乏烟酸引起的。 在 1920 年代,开发了白喉、百日咳、肺结核和破伤风疫苗。 提取胰岛素。 开发了维生素,包括用于预防佝偻病的维生素 D。 在 1930 年代,抗生素开始被有效地创造和使用。 1940 年代,对乙酰氨基酚和化学疗法相继问世,结合雌激素开始用于治疗更年期潮热。 在 1950 年代和 1960 年代,有效的新药物、疫苗和医疗设备的数量呈指数级增长。 全部没有 EBM。

1996 年,为了回应对 EBM 的批评,David Sackett 等人。 (1996) 试图解释其总体原则。 Sackett 断言 EBM 遵循“优秀的医生使用个人临床专业知识和最佳可用外部证据”。 这是一种止痛剂似是而非的暗示,但这两个组成部分基本上都是错误的,或者至少是误导性的。 通过根据个别医生应该做什么来表述这个定义,Sackett 暗示个别从业者应该使用他们自己的临床观察和经验。 然而,一个人临床经验的一般证据代表性可能较弱。 就像其他形式的证据一样,临床证据需要系统地收集、审查和分析,形成临床推理的综合,从而提供科学医学证据的临床成分。

证据推理的一个更大的失败是 Sackett 的声明,即人们应该使用“最好的可用外部证据”而不是 所有 有效的外部证据。 关于什么构成“最佳”证据的判断是高度主观的,不一定会产生在数量上最准确和精确的总体结果(Hartling 等人,2013 年;Bae,2016 年)。 奥斯汀·布拉德福德·希尔爵士 (Sir Austin Bradford Hill, 1965) 在阐述证据因果推理的现在规范的“方面”时,并未包括构成“最佳”证据的方面,他也没有建议应根据“研究质量”对研究进行衡量或分类” 甚至某些类型的研究设计在本质上可能比其他类型更好。 在里面 科学证据参考手册, Margaret Berger (2011) 明确指出,“……许多最受尊敬和最负盛名的科学机构(例如国际癌症研究机构 (IARC)、医学研究所、国家研究委员会和国家研究所对于环境健康科学)考虑所有相关的可用科学证据,作为一个整体,以确定关于因果主张的哪个结论或假设最能得到证据主体的支持。” 这正是希尔的方法。 50 多年来,他的因果推理方面得到了非常广泛的应用,从观察到因果关系进行推理,无论是在科学领域还是在法律领域。 EBM 以主观挑选“最佳”证据为前提是一种看似合理但不科学的方法。

随着时间的推移,选择性地考虑“最佳”证据的 EBM 方法似乎已被“简化”,首先是将随机对照试验 (RCT) 置于所有研究设计金字塔的顶端,作为所谓的“黄金标准”设计,后来,作为断言的唯一一种可以信任的研究类型,可以获得无偏的影响估计。 所有其他形式的经验证据都“可能存在偏见”,因此不可靠。 正如我将在下面展示的那样,这是一种似是而非的自负。

但这似乎是现代医学教育中常规教授的,以至于大多数医生只考虑 RCT 证据而忽略所有其他形式的经验证据。 这位作者与一位未受过医学教育的电视评论员就此进行了口头辩论,这似乎是合理的(Whelan,2020 年):如果随机分配受试者,任何差异一定是治疗引起的,其他类型的研究就不能相信了吗? 很明显,是的; 是的,不。

谁会从对 RCT 证据的单一、过分关注中受益? 如果随机对照试验要在流行病学上有效且在统计上充分,则进行随机对照试验的成本非常高。 它们可能耗资数百万或数千万美元,这在很大程度上限制了它们对推广医疗产品的公司的吸引力,这些产品可能带来的利润远高于这些成本。 从历史上看,在监管过程中对 RCT 证据的制药控制和操纵极大地提高了将产品通过监管批准推向市场的能力,而这样做的动机至今仍在继续。

这个问题得到了国会的认可,国会通过了 1997 年食品和药物管理局现代化法案 (FDAMA),该法案于 2000 年建立了 ClinicalTrials.gov 用于注册在研究性新药申请下进行的所有临床试验的网站,以检查实验药物对患有严重或危及生命的患者的有效性(国家医学图书馆,2021 年)。 由于临床试验中涉及利益冲突的相关原因,ProPublica“Dollars for Docs”网站(Tigas 等人,2019 年)涵盖了 2009-2018 年间制药公司向医生支付的费用以及 OpenPayments 网站(医疗保险和医疗补助服务中心, 2022) 涵盖了从 2013 年到 2021 年的支付情况,并且可以公开搜索。 创建这些信息系统是因为随机化自动使研究结果准确无偏的“合理性”被认为不足以应对研究欺诈和不适当的研究者利益冲突动机。

尽管这些改革或限制医学研究腐败的尝试有所帮助,但以 EBM 为幌子的错误陈述仍然存在。 最糟糕的例子之一是发表在 新英格兰医学杂志 13 年 2020 月 19 日,在 Covid-2020 大流行开始时,四位与制药公司有密切联系的英国著名医学统计学家发表了题为“随机化的魔力与真实世界证据的神话”的演讲(柯林斯等人., 2020)。 它可能写于 XNUMX 年 XNUMX 月,当时大多数人还不知道大流行病即将来临。 这篇论文声称随机化会自动产生强有力的研究,并且所有非随机化研究都是证据垃圾。 在阅读它的时候,我觉得它是对我的整个学科——流行病学——的长篇大论。 我立即被它冒犯了,但后来我明白了作者的严重利益冲突。 表示只有高度负担不起的随机对照试验证据才适合监管批准,这为制药公司提供了一种工具,可以保护其昂贵、高利润的专利产品免受有效且廉价的标签外批准的仿制药的竞争,而这些仿制药的制造商无法负担得起大规模随机对照试验。

随机

那么,我一直在暗示的随机化缺陷是什么,需要更深入的检查才能了解 RCT 研究与其他研究设计的相对有效性? 问题在于理解 混杂. 混杂是一种流行病学情况,其中暴露与结果之间的关系不是由于暴露,而是至少部分是由于第三个因素(混杂)。 混杂因素以某种方式与暴露相关,但不是暴露的结果。

在这种情况下,表面上的暴露-结果关系实际上是由于混杂因素-结果关系。 例如,一项关于饮酒和癌症风险的研究可能会被吸烟史混淆,吸烟史与饮酒相关(并且不是由饮酒引起),但确实会增加癌症风险。 酒精和癌症风险的简单分析(忽略吸烟)会显示出一种关系。 然而,一旦吸烟的影响得到控制或调整,酒精与癌症风险的关系就会减弱或消失。

随机化的目的,即平衡治疗组和对照组之间的一切,是为了消除潜在的混淆。 有没有其他方法可以消除潜在的混淆? 是:测量有问题的因素并在统计分析中对其进行调整或控制。 因此很明显,随机化恰好具有非随机化研究无法获得的一个可能的好处:控制 un测量的混杂因素。 如果对感兴趣的结果没有完全了解生物学、医学或流行病学关系,则可能无法测量所有相关因素,并且其中一些未测量的因素仍然可能混淆感兴趣的关联。

因此,随机化, 理论上, 消除了未测量因素的潜在混淆,作为对观察到的关联的解释。 这就是合理性论证。 但问题在于随机化在现实中的效果如何,以及随机化究竟需要平衡谁。 临床试验对所有参与受试者进行随机化以确定治疗组分配。 如果在研究结果事件中个体构成整个研究的一个子集,那么这些结果的人也需要在他们潜在的混杂因素中进行平衡。 例如,如果治疗组中的所有死亡病例都是男性,而安慰剂组中的所有死亡病例都是女性,那么性别可能会混淆治疗效果。 

问题是,RCT 研究基本上从未明确证明其结果受试者的充分随机化,而且他们声称对整个治疗组进行随机化的结果几乎总是在科学上无关紧要。 出现这个问题的原因可能是进行 RCT 研究的个人以及审阅他们论文的审稿人和期刊编辑没有充分了解流行病学原理。

在大多数 RCT 出版物中,研究人员提供了一个草率的治疗组和安慰剂组(作为列)与各种测量因素(作为行)的初始描述表。 也就是说,按性别、年龄组、种族/民族等划分的治疗和安慰剂受试者的百分比分布。这些表中的第三列通常是治疗和安慰剂受试者之间在每个测量因素上的频率差异的 p 值统计。 粗略地说,这个统计数据估计了这样一个概率,即治疗组和安慰剂组之间如此大的频率差异可能是偶然发生的。 鉴于受试者完全是偶然地被分配到他们的治疗组,随机化机会过程的统计检查是同义反复和无关紧要的。 在一些随机对照试验中,某些因素可能看起来比随机化允许的机会更极端,这只是因为已经检查了行中的多个因素的分布差异,在这种情况下,必须调用多重比较的统计控制。

RCT 描述表第三列需要的不是 p 值,而是特定行因子混杂程度的度量。 混淆不是通过它如何发生来衡量的,而是通过它有多糟糕来衡量的. 根据我作为职业流行病学家的经验,混杂的最佳单一衡量标准是治疗结果关系幅度的百分比变化,与不调整混杂因素相比。 因此,例如,如果针对性别进行调整后,治疗将死亡率降低 25%(相对风险 = 0.75),但如果不进行调整则将死亡率降低 50%,那么性别混淆的幅度将为 (0.75 – 0.50)/0.75 = 33 %。 流行病学家通常认为这种调整的变化超过 10% 意味着存在混杂,需要加以控制。

正如我所观察到的,大多数 RCT 出版物都没有提供其整体治疗组的混杂估计量,也从未提供其结果受试者的混杂估计量。 因此,对于论文描述表中给出的所有因素,无法判断结果受试者是否已充分随机化。 但是 RCT 研究潜在的致命缺陷,使它们并不比非随机研究更好,在某些情况下更糟的是,随机化只有在大量受试者被随机化时才有效(Deaton 和 Cartwright,2018),这特别适用于结果科目,而不仅仅是总的研究。 

考虑抛硬币十次。 它可能很容易偶然出现至少 34 个正面和 7 个反面,反​​之亦然 (3%)。 然而,这种差异的大小,2.33/2.33 = 70,就可能的混杂而言可能相当大。 另一方面,在 100 次翻转中出现 000078 次或更多次正面朝上的相同 50 幅度的情况很少见,p=.10。 为了使随机化起作用,治疗组和安慰剂组都需要有相当数量的结果事件,比如每组 XNUMX 个或更多。 这是随机对照试验研究未说出口的潜在主要缺陷,这使得它们的合理性论证毫无用处,因为随机对照试验研究通常被设计为具有足够的统计功效,如果治疗按预期起作用,但没有设计为具有足够的结果,以发现其主要结果的统计显着性将潜在混杂减​​少到 XNUMX% 以下的受试者说。

辉瑞 BNT162b2 mRNA Covid-19 疫苗首次公布的功效随机对照试验结果(Polack 等人,2020 年)中可以看到这个问题的一个重要例子。 这项研究被认为足够大(43,548 名随机参与者)并且足够重要(Covid-19),因为它假定的 RCT 合理性,它确保在“著名”杂志上发表 新英格兰医学杂志. 该研究的主要结果是在第二剂疫苗或安慰剂注射后至少 19 天出现 Covid-162。 然而,虽然它在安慰剂受试者中观察到 XNUMX 个病例,足以进行良好的随机化,但它在疫苗受试者中只发现了 XNUMX 个病例,随机化还远远不足以控制混杂。 

根据一般流行病学经验,如此大的估计相对风险(大约 162/8 = 20)不太可能完全是由于混杂,但相对风险的准确性或其隐含有效性((20 – 1)/ 20 = 95 %) 存疑。 考虑到研究结果的弱点,因为样本量不足以确保随机化对治疗组和安慰剂组的结果受试者有效,因此观察到这种使用中的疫苗在降低感染风险方面没有如此有效并不令人惊讶。

这种流行病学的“潜入杂草”阐明了为什么在试验的每个治疗组中只有少于 50 个结果受试者的 RCT 研究几乎没有声称可以避免由未测量的因素造成的可能混淆。 但这也清楚地表明了为什么这样的审判可能是 更坏 与相同暴露和结果的非随机对照试验相比。 在非随机试验中,研究人员知道许多因素可能作为混杂因素影响结果的发生,因此他们测量他们认为相关的一切,以便随后在统计分析中调整和控制这些因素。 

然而,在随机对照试验中,研究人员通常认为随机化是成功的,因此进行未经调整的统计分析,提供可能混淆的结果。 当你看到随机对照试验因为有数以万计的参与者而被标榜为“大型”研究时,请看过去,看看试验治疗组中主要结果事件的数量。 具有少量主要结果事件的试验是无用的,不应发表,更不用说作为公共卫生或政策考虑的依据了。

经验证据

阅读完上述所有内容后,您可能会认为这些关于随机试验与非随机试验的争论非常有道理,但支持它们的经验证据又如何呢? 为此,Cochrane 图书馆系统评价数据库进行了非常彻底的分析(Anglemyer 等人,2014 年)。 本研究全面搜索了 1990 年 2013 月至 14 年 XNUMX 月期间的七个电子出版物数据库,以确定所有系统评价论文,这些论文将“[随机]试验中测试的干预措施的功效或有效性的定量效应量估计与观察研究中测试的干预措施进行了比较”。 ” 实际上是对荟萃分析的荟萃分析,该分析包括 XNUMX 篇综述论文中总结的数千项单独研究比较。 

底线:随机对照试验与其相应的非随机试验结果之间的平均差异仅为 8%(95% 置信限度,-4% 至 22%,无统计学意义)。 总而言之,这一知识体系——经验知识以及基于流行病学原理的知识——表明,与所谓的“合理性”相反,随机试验没有自动排名为医学证据的黄金标准或唯一可接受的形式医学证据,并且每项研究都需要批判性和客观地检查其自身的优点和缺点,以及这些优点和缺点对得出的结论有多大影响。

其他合理性

在 Covid-19 大流行期间,许多其他科学证据断言被用来证明公共卫生政策的合理性,包括大流行紧急状态本身的宣布。 其中许多的背后是一个看似合理但错误的原则,即公共卫生大流行病管理的目标是尽量减少感染 SARS-CoV-2 病毒的人数。 

该政策看似显而易见,但作为一揽子政策是错误的。 需要尽量减少的是大流行病的有害后果。 如果感染导致大多数人出现不愉快或烦人的症状,但没有严重或长期的问题(如 SARS-CoV-2 的普遍情况,尤其是在 Omicron 时代),那么公众健康就没有明显的好处干预和限制侵犯这些人的自然或经济权利并对他们自己造成伤害。 

包括美国在内的西方社会在没有宣布大流行紧急情况的情况下对每年的呼吸道感染浪潮泰然处之,尽管它们每年产生数百万感染者,因为感染的后果在医学上通常被认为是轻微的,甚至允许数万人死亡每年。 

在 Covid-19 大流行的头几个月确定,不同年龄段的感染死亡率风险相差超过 1,000 倍,并且没有糖尿病、肥胖症、心脏病、肾病等慢性疾病的人,癌症病史等,死亡风险可以忽略不计,住院风险也很低。 那时,可以直接定义平均受益于公共卫生干预措施的高风险人群和能够成功渡过感染而没有明显或长期问题的低风险人群的类别。 因此,一种不区分风险类别的强迫性、放之四海而皆准的大流行病管理计划从一开始就是不合理和压迫性的。

因此,为减少感染传播而采取的看似合理的措施,即使是有效的,也没有起到良好的大流行管理作用。 然而,这些措施从一开始就没有科学证据证明是合理的。 六英尺社交距离规则是疾病预防控制中心的任意编造(Dangor,2021)。 声称戴口罩的好处很少区分对佩戴者的潜在好处——对戴口罩者来说,戴口罩是个人选择是否接受更多理论上的风险——与对旁观者的好处,即所谓的“源头控制”,其中公众健康方面的考虑可能适用。 基于口罩的呼吸道病毒源头控制研究表明,在减少感染传播方面没有明显的好处(Alexander,2021 年;Alexander,2022 年;Burns,2022 年),这些研究没有致命缺陷。

正如澳大利亚人口数据所表明的那样(Worldometer,2020),西方国家从未使用过一般人口封锁,除了推迟不可避免的事情(Meunier,2022)之外,没有其他任何效果。 在对控制大流行性流感的公共卫生措施的最终讨论中(Inglesby 等人,2006),作者指出,“没有任何历史观察或科学研究支持通过隔离可能感染的人群长时间隔离以减缓流感的传播。 世界卫生组织 (WHO) 的一个写作小组在查阅文献并考虑当代国际经验后得出结论:“强制隔离和检疫检疫是无效和不切实际的。” ……大规模检疫的负面后果如此极端(将病人强制关在井里;完全限制大量人口的流动;难以为检疫区内的人们提供关键物资、药品和食物),以至于这种缓解措施应从认真考虑中删除措施。”

关于旅行限制,Inglesby 等人。 (2006) 指出,“旅行限制,例如关闭机场和在边境筛查旅客,历来都是无效的。 世界卫生组织写作小组得出的结论是,“在过去的大流行病中,对在国际边界入境的旅客进行筛查和隔离并没有实质性地延缓病毒的传播……而且在现代时代可能效果更差。”关于学校停课(Inglesby 等人, 2006 年):“在以往的流感流行中,学校停课对患病率的影响是复杂的。 以色列的一项研究报告称,教师罢工 2 周后呼吸道感染有所减少,但这种减少仅在一天内很明显。 另一方面,当学校在 1918 年芝加哥大流行期间放寒假时,“学生中出现的流感病例……比学校开学时还要多。”

这一讨论清楚地表明,这些基于其有效性的合理性论据而被认为会干扰病毒传播的行为在管理大流行方面被误导了,并且没有科学证据证明其在减少传播方面的有效性。 他们的大规模推广证明了 Covid-19 时代公共卫生政策的失败。

合理性与糟糕的科学

可以接受的论点是,各种公共卫生政策以及向公众提供的信息并没有得到合理性的支持,而是得到了伪装成真正科学的糟糕或有致命缺陷的科学的支持。 例如,在其内部的非同行评审期刊中, 发病率和死亡率周报, CDC 发表了许多疫苗有效性分析。 这些报告描述了横断面研究,但对它们进行了分析,就好像它们是病例对照研究一样,系统地使用估计的比值比参数而不是相对风险来计算疫苗有效性。 当研究结果不常见时,比如少于 10% 的研究对象,则比值比可以接近相对风险,但否则,比值比往往会被高估。 然而,在横断面研究中,可以直接计算相对风险,并可以通过相对风险回归(Wacholder,1986)针对潜在的混杂因素进行调整,类似于在病例对照研究中使用逻辑回归。

一个代表性的例子是对第三剂 Covid-19 疫苗有效性的研究(Tenforde 等人,2022 年)。 在这项研究中,“……IVY 网络招募了 4,094 名年龄≥18 岁的成年人”,并在排除相关受试者后,“纳入了 2,952 名住院患者(1,385 名病例患者和 1,567 名非 COVID-19 对照者)。” 横断面研究——通过设计——确定受试者总数,而病例和对照的数量,以及暴露和未暴露的数量,发生在研究者干预之外,即,通过任何自然过程作为所检查的医学、生物学和流行病学机制的基础。 通过选择受试者总数,Tenforde 等人。 根据定义,研究是横断面设计。 这项研究报告说,在没有免疫功能低下的情况下,疫苗的有效性为 82%。 这一估计反映了调整后的比值比 1 – 0.82 = 0.18。 然而,接种疫苗的病例患者比例为 31%,未接种疫苗的患者比例为 70%,这两种情况都不足以允许使用比值比近似值来计算疫苗有效性。 根据研究报告表 3 中的数字,我计算出未经调整的相对风险为 0.45,近似调整后的相对风险为 0.43,得出真正的疫苗有效性为 1 – 0.43 = 57%,这与 82% 有很大差异且差得多论文中提出。

在不同的背景下,在我发表了一篇关于使用羟氯喹(HCQ)用于早期门诊 Covid-19 治疗的总结性评论文章后(Risch,2020),发表了一些临床试验论文,试图证明 HCQ 是无效的. 这些所谓的“反驳”中的第一个是在住院患者中进行的,他们的疾病在病理生理学和治疗方面与早期门诊疾病几乎完全不同(Park 等人,2020)。 我在审查中提到的重要结果、住院风险和死亡率在这些著作中被分散注意力,因为关注的是主观和次要的结果,例如病毒检测阳性的持续时间或住院时间的长短。

随后,门诊使用 HCQ 的 RCT 开始发表。 一个典型的例子是 Caleb Skipper 等人。 (2020)。 该试验的主要终点是 14 天内自我报告的总体症状严重程度的变化。 这一主观终点对大流行的重要性不大,特别是考虑到该研究小组研究的受试者能够适度判断他们是在试验的 HCQ 组还是安慰剂组(Rajasingham 等人,2021 年),因此自我-报告的结果并非对药物治疗完全视而不见。 从他们的统计分析中,作者恰当地得出结论:“羟氯喹并未显着降低早期轻度 COVID-19 门诊患者的症状严重程度。” 然而,一般媒体将这项研究报道为表明“羟氯喹不起作用”。 例如,珍·克里斯滕森 (2020) 在 CNN健康 关于这项研究,“根据周四发表在医学杂志上的一项研究,抗疟药羟氯喹对在感染早期接受治疗的具有轻度 Covid-19 症状的非住院患者没有益处 内科医学年鉴设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“ 

但事实上,Skipper 研究确实报告了两个重要的结果,即住院风险和死亡率:使用安慰剂时,10 人住院,1 人死亡; 使用 HCQ,4 人住院,1 人死亡。 这些数字显示住院风险降低了 60%,尽管在统计学上不显着 (p=0.11),但与门诊患者使用 HCQ 的住院风险的所有其他研究完全一致(Risch,2021)。 尽管如此,这些少量的结果事件还不足以使随机化平衡任何因素,并且在此基础上该研究基本上是无用的。 但它在非专业文献中仍然被误解为表明 HCQ 在门诊使用中没有任何好处。

结论

在 Covid-19 大流行期间,还发生了许多其他似是而非的科学哗众取宠或糟糕科学的事例。 从撤回的 Surgisphere 论文中可以看出,只要结论符合政府政策,医学期刊就会例行公事地不加批判地发表这种胡说八道。 NSC、FDA、CDC、NIH、WHO、Wellcome Trust、AMA、医学专业委员会、州和地方公共卫生机构、跨国制药公司和世界各地的其他组织已在最高级别发布了这些虚假知识违反了他们对公众的责任或故意选择不理解假科学。 

美国参议院最近第三次投票结束 Covid-19 紧急状态,但拜登总统表示他将否决该措施,因为“担心”再次发生 案件编号. 将近一年前,我和我的同事们争论说大流行病紧急情况已经结束(Risch 等人,2022 年),但在“紧急情况”的掩护下,虚假地依赖病例数来证明压制人权的行为有增无减。

传统媒体和许多社交媒体的大规模审查阻止了大多数公众对这种糟糕和虚假科学的讨论。 审查制度是不可抗拒的工具,因为有效的科学本质上会自我保护。 直到公众开始理解合理性和科学之间的区别,以及为大规模生产看起来像科学但实际上不是的科学“产品”所做的努力有多大,这一过程将继续,寻求专制权力的领导人将继续依赖它为了虚假的理由。

参考资料

亚历山大,PE(2021 年,20 月 XNUMX 日)。 超过 150 篇关于口罩无效和危害的比较研究和文章. 布朗斯通学院。 https://brownstone.org/articles/more-than-150-comparative-studies-and-articles-on-mask-ineffectiveness-and-harms/

亚历山大,PE(2022 年,3 月 XNUMX 日)。 CDC 拒绝将修复程序发布到其口罩研究中. 布朗斯通学院。 https://brownstone.org/articles/cdc-refuses-to-post-the-fix-to-its-mask-study/

Anglemyer, A.、Horvath, HT、Bero, L. (2014)。 与随机试验中评估的结果相比,通过观察性研究设计评估的医疗结果(综述)。 Cochrane 系统评价数据库,4,文章 MR000034。 https://doi.org/10.1002/14651858.MR000034.pub2

裴,J.-M。 (2016)。 营养流行病学观察性研究系统评价质量评估的建议。 流行病学和健康, 38, 文章 e2016014。 https://doi.org/10.4178/epih.e2016014

马萨诸塞州伯杰 (2011)。 专家证词的可采性。 在国家研究委员会,科学证据参考手册第三版开发委员会, 科学证据参考手册,第三版(第 11-36 页)。 国家科学院出版社。 https://nap.nationalacademies.org/catalog/13163/reference-manual-on-scientific-evidence-third-edition

E. 伯恩斯(2022 年,10 月 XNUMX 日)。 另一天,另一项可怕的面具研究。 让我们来看看关于口罩的最新低质量科学的幕后黑手. 子堆栈。 https://emilyburns.substack.com/p/another-day-another-terrible-mask

医疗保险和医疗补助服务中心。 (2022 年 XNUMX 月)。 搜索未结付款. 美国卫生与公共服务部医疗保险和医疗补助服务中心。 https://openpaymentsdata.cms.gov/

J. 克里斯滕森(2020 年,16 月 XNUMX 日)。 新研究发现,羟氯喹也无助于未住院的 Covid-19 患者. 美国有线电视新闻网健康。 https://www.cnn.com/2020/07/16/health/hydroxychloroquine-doesnt-work-hospitalized-patients/

Collins, R.、Bowman, L.、Landray, M. 和 Peto, R. (2020)。 随机化的魔力与真实世界证据的神话。 新英格兰医学杂志382(7),674 678。 https://www.nejm.org/doi/10.1056/NEJMsb1901642

Dangor, G.(2021 年,19 月 XNUMX 日)。 前 FDA 专员说,CDC 的六英尺社交距离规则是“武断的”。 福布斯 https://www.forbes.com/sites/graisondangor/2021/09/19/cdcs-six-foot-social-distancing-rule-was-arbitrary-says-former-fda-commissioner/

Deaton, A., & Cartwright, N. (2018)。 理解和误解随机对照试验。 社会科学与医学,210,2-21。 https://doi.org/10.1016/j.socscimed.2017.12.005

费曼,RP (1974)。 货物崇拜科学。 工程与科学37(7),10 13。 https://resolver.caltech.edu/CaltechES:37.7.CargoCult

Goldberger, J.、Waring, CH 和 Willets, DG (1915)。 糙皮病的预防:机构囚犯的饮食测试。 公共卫生报告, 30(43),3117-3131。 https://www.jstor.org/stable/4572932

Hartling, L.、Milne, A.、Hamm, MP、Vandermeer, B.、Ansari, M.、Tsertsvadze, A.、Dryden, DM (2013)。 对纽卡斯尔渥太华量表的测试表明,个别评论者之间的可靠性较低。 临床流行病学杂志,66,982-993。 https://doi.org/10.1016/j.jclinepi.2013.03.003

AB 希尔 (1965)。 环境与疾病:关联或因果关系。 英国皇家医学会会刊58(5),295 300。 https://doi.org/10.1177/003591576505800503

Inglesby, TV, Nuzzo, JB, O'Toole, T., Henderson, DA (2006)。 控制大流行性流感的疾病缓解措施。 生物安全和生物恐怖主义:生物防御战略、实践和科学,4(4):366-375。 https://doi.org/10.1089/bsp.2006.4.366

T. Meunier(2020 年,1 月 XNUMX 日)。 西欧国家的全面封锁政策对 COVID-19 疫情没有明显影响。 medRxiv。 https://doi.org/10.1101/2020.04.24.20078717

微软全国广播公司。 (2021 年 9 月 XNUMX 日)。 福奇回应共和党人的攻击 [视频]。 YouTube。 https://www.youtube.com/watch?v=z-tfZr8Iv0s

国家医学图书馆(2021 年 XNUMX 月)。 临床试验.gov。 历史、政策和法律. 美国卫生与公众服务部、国立卫生研究院、国家医学图书馆。 https://clinicaltrials.gov/ct2/about-site/history

Park, JJH、Decloedt, EH、Rayner, CR、Cotton, M.、Mills, EJ (2020)。 COVID 19 疾病阶段的临床试验:复杂且经常被误解。 柳叶刀全球健康, 8(10), e1249-e1250。 https://doi.org/10.1016/S2214-109X(20)30365-X

Polack, FP, Thomas, SJ, Kitchin, N., Absalon, J., Gurtman, A., Lockhart, S., Perez, JL, Pérez Marc, G., Moreira, ED, Zerbini, C., Bailey, R ., Swanson, KA, Roychoudhury, S., Koury, K., Li, P., Kalina, WV, Cooper, D., Frenck, RW, Jr., Hammitt, LL, …, Gruber, WC (2020)。 BNT162b2 mRNA Covid-19 疫苗的安全性和有效性。 新英格兰医学杂志383(27),2603 2615。 https://www.nejm.org/doi/full/10.1056/nejmoa2034577

Rajasingham, R., Bangdiwala, AS, Nicol, MR, Skipper, CP, Pastick, KA, Axelrod, ML, Pullen, MF, Nascene, AA, Williams, DA, Engen, NW, Okafor, EC, Rini, BI, Mayer , IA, McDonald, EG, Lee, TC, Li P., MacKenzie, LJ, Balko, JM, Dunlop, SJ, …, Lofgren, SM (2021)。 羟氯喹作为医护人员 2019 年冠状病毒病 (COVID-19) 的暴露前预防:一项随机试验。 临床传染病, 72(11), e835-e843。 https://doi.org/10.1093/cid/ciaa1571

里施,医管局 (2020)。 应立即加强对有症状、高危 COVID-19 患者的早期门诊治疗,这是应对大流行危机的关键。 美国流行病学杂志189(11),1218 1226。 https://doi.org/10.1093/aje/kwaa093

Risch, HA(2021 年,17 月 XNUMX 日)。 羟氯喹在高危 COVID-19 门诊患者早期治疗中的疗效和安全性证据. EarlyCovidCare.org, https://earlycovidcare.org/wp-content/uploads/2021/09/Evidence-Brief-Risch-v6.pdf

Risch, H.、Bhattacharya, J.、Alexander, PE(2022 年,23 月 XNUMX 日)。 紧急情况必须立即结束. 布朗斯通学院。 https://brownstone.org/articles/the-emergency-must-be-ended-now/

Sackett, DL、Rosenberg、WMC、Gray、JAM、Haynes, RB 和 Richardson, WS (1996)。 循证医学:它是什么,它不是什么。 BMJ, 312, 第 71 条。 https://doi.org/10.1136/bmj.312.7023.71

Skipper, CP, Pastick, KA, Engen, NW, Bangdiwala, AS, Abassi, M., Lofgren, SM, Williams, DA, Okafor, EC, Pullen, MF, Nicol, MR, Nascene, AA, Hullsiek, KH, Cheng , MP, Luke, D., Lother, SA, MacKenzie, LJ, Drobot, G., Kelly, LE, Schwartz, IS, …, Boulware, DR (2020)。 早期 COVID-19 非住院成人中的羟氯喹:一项随机试验。 内科医学年鉴173(8),623 631。 https://doi.org/10.7326/M20-4207

Tenforde, MW, Patel, MM, Gaglani, M., Ginde, AA, Douin, DJ, Talbot, HK, Casey, JD, Mohr, NM, Zepeski, A., McNeal, T., Ghamande, S., Gibbs, KW, Files, DC, Hager, DN, Shehu, A., Prekker, ME, Erickson, HL, Gong, MN, Mohamed, A., …, Self, WH (2022)。 发病率和死亡率周报,71(4), 118-124。 https://www.cdc.gov/mmwr/volumes/71/wr/mm7104a2.htm

Tigas, M.、Jones, RG、Ornstein, C. 和 Groeger, L.(2019 年,17 月 XNUMX 日)。 文档美元。 行业资金如何到达您的医生手中。 ProPublica。 https://projects.propublica.org/docdollars/

Wacholder, S. (1986)。 GLIM 中的二项式回归:估计风险比和风险差异。 美国流行病学杂志123(1),174 184。 https://doi.org/10.1093/oxfordjournals.aje.a114212

Whelan, R.(2020 年 3 月 XNUMX 日)。 2020-08-03 – CNN COVID 采访耶鲁大学流行病学家 Harvey Risch [视频]。 YouTube。 https://www.youtube.com/watch?v=gGO6Ke81bUQ

世界计。 (2022 年 15 月 XNUMX 日)。 澳大利亚冠状病毒病例总数. 世界计。 https://www.worldometers.info/coronavirus/country/australia/



发表于 知识共享署名4.0国际许可
如需转载,请将规范链接设置回原始链接 褐石研究所 文章和作者。

作者

  • 哈维·里施

    哈维·里施(Harvey Risch)是布朗斯通研究所的高级学者,是耶鲁大学公共卫生学院和耶鲁大学医学院的医师和流行病学名誉教授。 他的主要研究兴趣是癌症病因学、预防和早期诊断以及流行病学方法。

    查看所有文章

今天捐赠

你们对布朗斯通学院的财政支持将用于支持作家、律师、科学家、经济学家和其他在我们这个时代的动荡中受到职业清洗和流离失所的勇敢人士。 您可以通过他们正在进行的工作帮助查明真相。

订阅 Brownstone 以获取更多新闻


商店褐石

随时了解 Brownstone Institute 的最新动态