如何识别新闻中的误导性统计数据

如何识别新闻中的误导性统计数据

“一项实用研究发现,人们的性取向可以通过手指的长度来判断”是最近的一条标题,该文章基于埃塞克斯大学备受尊敬的研究人员在《性行为档案》上发表的一项同行评议研究,该杂志是人类性行为领域的领先学术出版物。

但以我这个统计专家的眼光来看,这完全是一派胡言。

就在新闻消费者似乎开始变得聪明起来——记得询问科学是否“经过同行评审”,样本量是否足够大,或者谁资助了这项研究——的时候,一个出乎意料的故事出现了。在这种情况下,一个快速的新闻以置信区间的形式出现,这是一个统计学主题,任何外行人都不应该费力去理解一篇新闻文章。

但不幸的是,对于那些讨厌数字的人来说,如果你不想被那些夸大其词、夸大其词或毫无价值的研究所欺骗,我们必须讨论一些统计原则,即使所有的“合法研究”框都被勾选,这些原则仍然可能让你犯错。

好吃吗?Leo/Flickr,CC BY-NC-ND

我的真正风险是什么?

我读过的最令人沮丧的标题之一是“八年研究发现,大量食用炸薯条的人死亡风险‘增加一倍’。”“呃,”我大声说道,一边喝着一杯红酒,面前摆着一大篮金黄的炸薯条。真的吗?

是的,根据《美国临床营养学杂志》发表的一项同行评议研究,这是真的。吃炸薯条确实会使你的死亡风险增加一倍。但是,吃多少炸薯条,而且,我原来的死亡风险是多少?

研究表明,如果你每周吃三次或三次以上的炸薯条,你的死亡风险将增加一倍。那么让我们以这项研究中的普通人为例:一个 60 岁的男人。无论他吃多少炸薯条,他的死亡风险是多少?百分之一。这意味着如果你把 100 名 60 岁的男人排成一排,其中至少有一人会在明年死亡,仅仅因为他是一名 60 岁的男人。

现在,如果这 100 人一生中每周至少吃三次炸土豆,那么他们的死亡风险就会翻倍。但是 1% 翻倍意味着什么?2%。因此,一年中,这 100 人中死亡的将不是一个人,而是两个人。而且他们一生中每周可以吃三次或更多次炸土豆——这听起来像是我愿意承担的风险。

这是一个统计概念,称为相对风险。如果患上某种疾病的几率是十亿分之一,那么即使你患病的风险增加四倍,你的风险仍然只有十亿分之四。这是不会发生的。

因此,下次您看到风险增加或减少时,您应该问的第一个问题是“与原始风险相比,风险是增加还是减少?”

另外,这些人是不是和我一样,一边吃炸土豆,一边喝着一杯葡萄酒或一品脱啤酒?罪魁祸首可能是其他东西?

睡前吃奶酪等于被床单缠住而死?

婴儿箱已成为政府资助送给新父母的流行礼物,旨在为新生儿提供一个安全的睡眠场所。该倡议源于 20 世纪 30 年代末芬兰发起的一项旨在降低婴儿睡眠相关死亡率的活动。纸箱里有一些必需品:一些尿布、婴儿湿巾、连体衣、乳垫等。

新生儿到来前的芬兰“孕妇礼包”内容。Visa Kopu/Flickr,CC BY-NC-ND

芬兰的婴儿死亡率随着这些婴儿箱的引入而迅速下降,该国目前是世界上婴儿死亡率最低的国家之一。因此,可以合理地假设这些婴儿箱导致婴儿死亡率下降。

但你猜还有什么变化?产前护理。为了有资格领取婴儿箱,妇女必须在怀孕的前四个月开始到卫生诊所就诊。

1944 年,31% 的芬兰母亲接受了产前教育。1945 年,这一比例跃升至 86%。婴儿箱并不是婴儿死亡率变化的原因,而是教育和早期健康检查。

这是相关性不等于因果性的典型案例。婴儿箱的引入和婴儿死亡率的下降是相关的,但两者之间并不是因果关系。

然而,这个小事实并没有阻止婴儿用品公司如雨后春笋般涌现,以 449.99 美元的价格出售诸如“婴儿用品套装:芬兰原版”之类的产品。美国各州还利用税收向新妈妈们发放一个版本。

因此,下次您看到某种联系或关联时(例如,吃奶酪与被床单缠住而死亡有关),您应该问“还有什么原因导致这种情况发生?”

当误差幅度大于效果时

美国劳工统计局最新数据显示,全国失业率从 8 月份的 3.9% 下降到 9 月份的 3.7%。在编制这些数据时,劳工统计局显然不会到处询问每个人是否有工作。它只会询问一小部分人,然后将该群体的失业率推广到整个美国。

这意味着官方给出的失业率在任何特定时间都是一个估计值——一个不错的猜测,但终归是猜测。这种“正负误差”由统计学家称为置信区间的东西来定义。

数据实际上表明,全国失业人数似乎减少了 270,000 人,但置信区间的误差幅度为正负 263,000。宣布一个像 270,000 这样的单一数字更容易。但抽样总是有误差的,将单一估计值视为一个范围更为准确。在这种情况下,统计学家认为实际失业人数下降了大约 7,000 人(最低)和 533,000 人(最高)。

这与手指长度定义性研究中发生的问题相同——与这些估计相关的正负误差可以完全否定结果的任何确定性。

置信区间让我们的生活变得混乱的最明显例子就是民意调查。民意调查员会抽取人口样本,询问该样本将投票给谁,然后从中推断出整个人口在选举日会做什么。当竞选势均力敌时,他们对样本的民意调查的正负误差会抵消任何关于谁将获胜的真实信息,从而使竞选“难分胜负”。

因此,下次您看到关于整个人群的数字时,由于不可能询问每个人或测试每个受试者,因此您应该询问正负误差。

了解统计误导的这三个方面是否意味着你永远不会被愚弄?不会。但它们肯定会有所帮助。

利伯蒂·维特特 (Liberty Vittert) 是华盛顿大学统计学客座助理教授。本文最初发表于 The Conversation。

<<:  别担心,闭上眼睛看到的那些奇怪图案是真实的

>>:  美国宇航局的两艘航天器在一周内死亡——其中有联系

推荐阅读

不要冲动购物。使用系统来购买适合您的物品。

在做决定时,世界上有两种人:最大化者和满足者。最大化者力求做出尽可能好的决定,而满足者则希望做出让自...

为了隐藏起来,这些甲虫像珠宝一样闪闪发光

9900 万年前,世界看起来截然不同。那是白垩纪中期。恐龙成群结队地在地球上漫游。古代食肉鸟类正在尝...

《大吾惠:救赎之橙》评论:感人的故事和迷人的角色

大吾惠:救赎之橙——感人的故事及其吸引力电视动画《惠的大吾:救赎的橙子》于2023年9月30日至20...

减少疼痛的最佳睡姿

美国成年人饱受痛苦折磨。美国疾病控制与预防中心 2018 年对其自身调查数据的分析估计,每天有 50...

如何在家给宠物洗澡、梳理和修剪毛发

随着兽医诊所和宠物美容服务机构的关闭,人们开始看到他们心爱的贵宾犬和宠物涂鸦犬变成了小棉球,而他们的...

《女神异闻录3剧场版#3 Falling Down》评论:深化故事和角色发展

『女神异闻录3剧场版#3 Falling Down』挑战深渊与成长的故事《女神异闻录3剧场版第3回 ...

自然选择无法解释这种虫子的奇怪角

角蝉( Membracidae )在大多数方面都没有什么特别之处。除了南极洲以外,这种蝉( Cica...

地球需要你清理狗屎

漫步在任何公园、人行道或小径上,你肯定会看到(或更糟的是,踩到)一堆热气腾腾的狗屎。狗屎铲法律在许多...

“太阳已被吃掉”:日食简史

在人类历史的大部分时间里,宇宙事件并不被理解为简单的物理学结果——相反,它们是来自神的信息或关于未来...

利用“虚拟发电厂”保证电力供应

苏珊·肯尼迪将她的黑色宝马车开进加州索诺玛县的一家酿酒厂。她下车,大步走过不锈钢发酵桶,停在一块混凝...

《幻境篇》的魅力与评价:奇幻的新领域

《幻境碎片》——描绘奇幻世界的短篇小说概述《幻之碎片》是 1995 年在 NHK-BS 播出的 15...

《三丁目里的塔玛,认识我的塔玛吗?》的魅力与评价

《三丁目里的塔玛,认识我的塔玛吗?》的魅力与评价《三丁目之球,认识我的球吗?》是1993年开播的9集...

《噬血狂袭》特别OVA“消失的圣枪”评论:再次确认系列魅力

《噬血狂袭特别篇OVA:消失的圣枪》的号召力与评价《噬血狂袭》系列是根据人气轻小说改编的动画,融合了...

要举起詹姆斯的大桃子,需要的海鸥数量比罗尔德·达尔所说的要多得多

啊,物理学:将世界上最伟大的谜团变成冷酷无情的事实。即使是深受喜爱的儿童故事中的谜团。英国莱斯特大学...

最后,一种在计算机和手机之间运行应用程序的简单方法

麻省理工学院的计算机科学家团队可能刚刚解决了数字时代最令人烦恼的问题之一,而这个问题主要设备制造商似...