如何识别新闻中的误导性统计数据

如何识别新闻中的误导性统计数据

“一项实用研究发现,人们的性取向可以通过手指的长度来判断”是最近的一条标题,该文章基于埃塞克斯大学备受尊敬的研究人员在《性行为档案》上发表的一项同行评议研究,该杂志是人类性行为领域的领先学术出版物。

但以我这个统计专家的眼光来看,这完全是一派胡言。

就在新闻消费者似乎开始变得聪明起来——记得询问科学是否“经过同行评审”,样本量是否足够大,或者谁资助了这项研究——的时候,一个出乎意料的故事出现了。在这种情况下,一个快速的新闻以置信区间的形式出现,这是一个统计学主题,任何外行人都不应该费力去理解一篇新闻文章。

但不幸的是,对于那些讨厌数字的人来说,如果你不想被那些夸大其词、夸大其词或毫无价值的研究所欺骗,我们必须讨论一些统计原则,即使所有的“合法研究”框都被勾选,这些原则仍然可能让你犯错。

好吃吗?Leo/Flickr,CC BY-NC-ND

我的真正风险是什么?

我读过的最令人沮丧的标题之一是“八年研究发现,大量食用炸薯条的人死亡风险‘增加一倍’。”“呃,”我大声说道,一边喝着一杯红酒,面前摆着一大篮金黄的炸薯条。真的吗?

是的,根据《美国临床营养学杂志》发表的一项同行评议研究,这是真的。吃炸薯条确实会使你的死亡风险增加一倍。但是,吃多少炸薯条,而且,我原来的死亡风险是多少?

研究表明,如果你每周吃三次或三次以上的炸薯条,你的死亡风险将增加一倍。那么让我们以这项研究中的普通人为例:一个 60 岁的男人。无论他吃多少炸薯条,他的死亡风险是多少?百分之一。这意味着如果你把 100 名 60 岁的男人排成一排,其中至少有一人会在明年死亡,仅仅因为他是一名 60 岁的男人。

现在,如果这 100 人一生中每周至少吃三次炸土豆,那么他们的死亡风险就会翻倍。但是 1% 翻倍意味着什么?2%。因此,一年中,这 100 人中死亡的将不是一个人,而是两个人。而且他们一生中每周可以吃三次或更多次炸土豆——这听起来像是我愿意承担的风险。

这是一个统计概念,称为相对风险。如果患上某种疾病的几率是十亿分之一,那么即使你患病的风险增加四倍,你的风险仍然只有十亿分之四。这是不会发生的。

因此,下次您看到风险增加或减少时,您应该问的第一个问题是“与原始风险相比,风险是增加还是减少?”

另外,这些人是不是和我一样,一边吃炸土豆,一边喝着一杯葡萄酒或一品脱啤酒?罪魁祸首可能是其他东西?

睡前吃奶酪等于被床单缠住而死?

婴儿箱已成为政府资助送给新父母的流行礼物,旨在为新生儿提供一个安全的睡眠场所。该倡议源于 20 世纪 30 年代末芬兰发起的一项旨在降低婴儿睡眠相关死亡率的活动。纸箱里有一些必需品:一些尿布、婴儿湿巾、连体衣、乳垫等。

新生儿到来前的芬兰“孕妇礼包”内容。Visa Kopu/Flickr,CC BY-NC-ND

芬兰的婴儿死亡率随着这些婴儿箱的引入而迅速下降,该国目前是世界上婴儿死亡率最低的国家之一。因此,可以合理地假设这些婴儿箱导致婴儿死亡率下降。

但你猜还有什么变化?产前护理。为了有资格领取婴儿箱,妇女必须在怀孕的前四个月开始到卫生诊所就诊。

1944 年,31% 的芬兰母亲接受了产前教育。1945 年,这一比例跃升至 86%。婴儿箱并不是婴儿死亡率变化的原因,而是教育和早期健康检查。

这是相关性不等于因果性的典型案例。婴儿箱的引入和婴儿死亡率的下降是相关的,但两者之间并不是因果关系。

然而,这个小事实并没有阻止婴儿用品公司如雨后春笋般涌现,以 449.99 美元的价格出售诸如“婴儿用品套装:芬兰原版”之类的产品。美国各州还利用税收向新妈妈们发放一个版本。

因此,下次您看到某种联系或关联时(例如,吃奶酪与被床单缠住而死亡有关),您应该问“还有什么原因导致这种情况发生?”

当误差幅度大于效果时

美国劳工统计局最新数据显示,全国失业率从 8 月份的 3.9% 下降到 9 月份的 3.7%。在编制这些数据时,劳工统计局显然不会到处询问每个人是否有工作。它只会询问一小部分人,然后将该群体的失业率推广到整个美国。

这意味着官方给出的失业率在任何特定时间都是一个估计值——一个不错的猜测,但终归是猜测。这种“正负误差”由统计学家称为置信区间的东西来定义。

数据实际上表明,全国失业人数似乎减少了 270,000 人,但置信区间的误差幅度为正负 263,000。宣布一个像 270,000 这样的单一数字更容易。但抽样总是有误差的,将单一估计值视为一个范围更为准确。在这种情况下,统计学家认为实际失业人数下降了大约 7,000 人(最低)和 533,000 人(最高)。

这与手指长度定义性研究中发生的问题相同——与这些估计相关的正负误差可以完全否定结果的任何确定性。

置信区间让我们的生活变得混乱的最明显例子就是民意调查。民意调查员会抽取人口样本,询问该样本将投票给谁,然后从中推断出整个人口在选举日会做什么。当竞选势均力敌时,他们对样本的民意调查的正负误差会抵消任何关于谁将获胜的真实信息,从而使竞选“难分胜负”。

因此,下次您看到关于整个人群的数字时,由于不可能询问每个人或测试每个受试者,因此您应该询问正负误差。

了解统计误导的这三个方面是否意味着你永远不会被愚弄?不会。但它们肯定会有所帮助。

利伯蒂·维特特 (Liberty Vittert) 是华盛顿大学统计学客座助理教授。本文最初发表于 The Conversation。

<<:  别担心,闭上眼睛看到的那些奇怪图案是真实的

>>:  美国宇航局的两艘航天器在一周内死亡——其中有联系

推荐阅读

五万亿块塑料漂浮在你附近的海洋中 [互动]

12 月,由 12 家研究机构组成的联盟公布了全球海洋塑料污染的首批数据。据他们计算,目前近 30...

舒适的针织毛衣可以帮助机器人“感受”接触

某些机器人确实可以感知寒冷的温度,但感受寒冷又是另一回事。然而,现在世界已经拥有了机器人毛衣。公平地...

在亚马逊闪购期间,这款原价 189 美元的冷压榨汁机仅售 65 美元

这款冷压榨汁机原本售价 129 美元,但亚马逊目前推出了 50% 折扣优惠券,您只需在产品页面上勾选...

无需购买昂贵的大型工具,即可制作自己的刨刀来刨平木材

木工中最重要的技能之一是学会正确地铣削木材。如果您没有铣削工具或正在使用超宽的木板,您不必放弃,而且...

海贼王梦幻足球王! - 彻底分析最终的比赛

“海贼王梦幻足球王!” - 一场激烈的战斗在梦想与冒险的战场上展开“ONE PIECE:梦之足球王!...

为什么我们喧嚣的太阳在17世纪末相对平静

从地球上看,太阳似乎很稳定,白天的蓝天亮度几乎相同。然而,近距离看,太阳却更加动荡,到处都是太阳黑子...

如何打开损坏的计算机文件

无法正常打开文件是您可能遇到的最令人沮丧的技术问题之一。但您不应该放弃并立即删除它们。大多数情况下,...

《我的母亲是天鹅的那一天》:对这部动人经典动画版的想法和评论

《母亲是天鹅的那一天》:深度解读 NHK 经典动画1990 年 12 月在 NHK 教育电视台(现为...

霜震到底是什么?

外面冷吗?半夜听到巨响了吗?别打电话给捉鬼敢死队——这可能只是一场霜冻地震。虽然这听起来像黏土动画中...

古生物学家解决了数十年来蛇颈龙皮肤纹理之谜

鳞片状还是光滑状?这一直是古生物学家对蛇颈龙的疑问之一。虽然专家们知道蛇颈龙的饮食、体型和一般栖息地...

电子人 009:第 1 集评论

机器人009 - 1966年电影吸引力与评论介绍1966年7月21日上映的《人造人009》是东映第一...

好消息:你并不像你想象的那么令人厌恶

你知道你的白衬衫在穿过和洗过几次后会变得多么肮脏吗?你漂亮的白毛巾突然变得像奶油一样?令人欣慰的消息...

这种“疯狂的野兽”与我们见过的任何哺乳动物都不一样

这个世界已经充满了各种古怪的动物,从巨型杀人蜂到怪异的深海生物。但与之相比,一些在遥远的过去在地球上...

《丛林皇帝》的号召力与评价:电视剧第一集回顾

丛林皇帝:手冢治虫的野心及其影响介绍《森林大帝》于 1965 年 10 月 6 日至 1966 年 ...

美国宇航局希望利用人工智能研究不明空中现象

此帖子已更新。美国宇航局委托的一份新独立研究报告建议利用美国宇航局的专业知识和公众信任以及人工智能来...