虽然这个人工智能不是医生,但它的医疗诊断非常准确

虽然这个人工智能不是医生,但它的医疗诊断非常准确

在过去十年的大部分时间里,各种研究小组一直在研究 AI 医生的想法。去年 12 月下旬,来自 Google 和 DeepMind 的计算机科学家推出了自己的 AI 临床医生版本,该版本可以使用名为 PaLM 的大型语言模型,根据患者的症状诊断患者的病情。

根据该团队发表的预印本论文,他们的模型在包含美国医师执照考试问题的基准测试中得分为 67.6%,他们声称这比之前最先进的软件高出 17%。其中一个版本的表现与人类临床医生的水平相似。但是,这种算法和其他类似的算法都存在很多问题。

以下是关于该模型的一些简要事实:该模型是在包含 3,000 多个常见医疗问题的数据集以及另外六个现有的开放医疗问题和答案数据集(包括医疗检查和医学研究文献)上进行训练的。在测试阶段,研究人员将两个版本的人工智能的答案与人类临床医生进行了比较,并评估了这些答案的准确性、真实性、相关性、有用性、与当前科学共识的一致性、安全性和偏见性。

谷歌 Chrome 软件工程师 Adriana Porter Felt 并未参与该论文的撰写,她在 Twitter 上指出,该模型的版本能够以与人类临床医生类似的方式回答医疗问题,这得益于“指令提示调整”这一附加功能,这是一个费力且无法扩展的人工过程。这包括以特定方式仔细调整问题的措辞,以使人工智能能够检索正确的信息。

[相关:谷歌正在对其健康信息服务方式进行重大更新]

研究人员甚至在论文中写道,他们的模型“表现令人鼓舞,但仍然不如临床医生”,并且该模型的“对[医学背景的]理解、知识回忆和医学推理随着模型规模和指令提示调整而提高”。例如,与人类相比,每个版本的人工智能都会以更高的比率遗漏重要信息并在其答案中包含不正确或不适当的内容。

语言模型在解析复杂度和数量更多的信息方面越来越好。它们似乎可以很好地完成需要科学知识和推理的任务。包括 SciBERT 和 PubMedBERT 在内的几个小型模型已经突破了语言模型的界限,可以理解充满行话和专业术语的文本。

但在生物医学和科学领域,有复杂的因素在起作用,还有许多未知数。如果人工智能错了,谁来为医疗事故负责?当算法的大部分工作都像黑匣子一样时,错误源头能追溯到哪里吗?此外,这些算法(程序员给计算机的数学指令)并不完善,需要完整和正确的训练数据,而这些数据并不总是适用于不同人群的各种情况。另外,购买和组织健康数据的成本可能很高。

在标准化的多项选择测试中正确回答问题并不能体现出你的智力。如果计算机面对的是真实的临床病例,它的分析能力可能会不足。因此,尽管这些测试在纸面上看起来令人印象深刻,但大多数人工智能尚未准备好部署。以 IBM 的 Watson AI 健康项目为例。即使投入了数百万美元,它仍然存在许多问题,而且在规模上不够实用或灵活(它最终崩溃并被分拆出售)。

谷歌和 DeepMind 确实意识到了这项技术的局限性。他们在论文中写道,要使该模型真正发挥作用,仍有几个领域需要开发和改进,例如将响应建立在权威、最新的医学来源的基础上,以及检测不确定性并有效地向人类临床医生或患者传达不确定性的能力。

<<:  太平洋上的新雷达站将使美军能够监视地平线

>>:  梅赛德斯-奔驰承诺在全美安装 2,500 个电动汽车快速充电器

推荐阅读

美国宇航局的新视野号将在新年前夜观察一个非常神秘的太空球

2015 年,美国宇航局的新视野号航天器引起了轰动,这架钢琴大小的小型航天器终于完成了长达九年的旅程...

全面回顾 Oishinbo 的终极与超级长寿烹饪对决!

《美味煎饼:极致与极品长寿料理对决!》的魅力与评价“美味煎饼:终极与极品长寿烹饪对决!!”是 19...

见见 SpaceX 的首位月球游客前泽友作

迄今为止,只有 24 人曾绕月飞行。前三人在 1968 年圣诞夜成功登月,距今已有近 50 年。最后...

哆啦 A 梦的惊心动魄的机车竞赛!电影印象与评论

《多啦 A 梦:刺激的机车爆跑!》的号召力与评价《多啦 A 梦:刺激的机车大爆炸!》是一部于2000...

升级版福特野马 Mach-E 让电动汽车驾驶变得更有趣

“这辆车改变了我的生活,”专业漂移赛车手沃恩·吉廷 (Vaughn Gittin Jr.) 感叹道。...

索尼终于正式发布了 PlayStation 4

我们在发布会上只看到了 PS4,但据我们所知,它与 PS3(以及 Xbox One)类似——可能稍微...

蜂拥农场机器人 Prospero 想向你展示农业的未来

无论是由工业化农业机构还是小型独立农民经营,农业的核心都是产量。每英亩的产量决定了一年的成败,从宏观...

全面回顾忍者服部君的忍者忍者日记!

《忍者服部君:忍者忍法图鉴日记》——藤子不二雄A大作搬上大荧幕《忍者服部君:忍者忍者 Enikki...

Oura Ring 是我们最喜欢的智能戒指,亚马逊黑色星期五前最高可优惠 100 美元

智能戒指充分利用了健身可穿戴设备的优点,并将其变成直接从珠宝店购买的时尚配饰。Oura Ring G...

对《玲珑实验》深刻世界观与感染力的思考与评价

《玲音实验》:超越现实与网络界限的心理动画杰作■ 公共媒体电视动画系列■ 原创媒体动漫原创■ 播出时...

走进该国最好的传统弓箭制造商之一的工作室

这个故事最初刊登在《田野与溪流》杂志上。读完文章后,可以查看完整的照片集。 15 年前,詹姆斯“大吉...

卡片战斗!!先锋神装第二季:深入探究该系列的第二部分

《卡片战斗!!先锋神装第二季》的魅力与评价《卡片战斗!!先锋神灵第2季》是一部电视动画,将于2024...

在亚马逊 Prime Day 期间以今年最低价购买 Jackery 太阳能发电机

Jackery 在我们的太阳能发电机和便携式电站产品测试中经常名列前茅。目前,许多最受欢迎的型号在亚...

全面评测《STAND BY ME 哆啦 A 梦2》3DCG版!

《STAND BY ME 多啦 A 梦2》的魅力与评价《STAND BY ME 哆啦 A 梦2》是...

学生设计帮助蝙蝠对抗白鼻综合症

凯文·基尔不想故意感染蝙蝠。他是加州大学戴维斯分校的兽医病理学家,研究白鼻综合症,这种疾病正在美国各...