微软对人工智能搜索的看法在准确性方面存在困难

微软对人工智能搜索的看法在准确性方面存在困难

经过数月的炒作,谷歌和微软在 24 小时内宣布即将推出 Bard 和集成 ChatGPT 的 Bing 搜索引擎。乍一看,这两家科技巨头的公开演示似乎展示了可能颠覆多个行业的革命性产品。但不久之后,即使是粗略的评论也凸显了谷歌的 Bard 建议中存在严重缺陷。现在轮到微软接受审查了,结果和 Bard 一样糟糕,甚至更糟。

独立 AI 研究员 Dmitri Brereton 周一发表了一篇博客文章,详细介绍了他们在使用由 ChatGPT 驱动的 Bing 时遇到的众多明显问题。Bing 的演示经常包含粗制滥造的信息:从不准确的推荐产品详细信息,到遗漏或错误陈述旅行站点详细信息,甚至歪曲看似简单的财务报告。在后一种情况下,Bing 的 AI 对基本财务数据的汇总(根据 Brereton 的说法,这对于 AI 来说应该是“微不足道的”)却毫无根据地包含了完全错误的统计数据。

[相关:人工智能能够进行对话并不意味着它很聪明。]

但即使答案正确,Bing 也可能严重绕过了简单的道德准则。根据PCWorld的 Mark Hachman 的一份报告,当被要求提供文化昵称时,人工智能会向 Hachman 的孩子提供一长串种族侮辱性词汇。尽管 Bing 在给出示例之前警告说,某些昵称是“中性或正面的,而其他昵称则是贬义或冒犯性的”,但聊天机器人似乎并没有费心对结果进行分类。相反,它只是列出了一份好、坏和极其丑陋的昵称清单。

微软传播总监凯特琳·鲁尔斯顿 (Caitlin Roulston) 向The Verge表示,公司“预计系统在预览期间可能会出错,而反馈对于帮助识别哪里出了问题至关重要,这样我们就可以学习并帮助模型变得更好。”

随着各大公司不可避免地急于将“智能”聊天机器人功能引入其生态系统,批评者认为,在广泛采用之前,必须解决这些问题。对于纽约大学坦顿工程学院副教授 Chinmay Hegde 来说,这些失误完全不足为奇,微软推出这项技术太早了。

[相关:谷歌即将推出的人工智能聊天机器人利用了其搜索引擎的强大功能。]

“从高层次来看,这些错误之所以会发生,是因为 ChatGPT 所依赖的技术是一种概率[强调 Hegde] 大型语言模型,因此其输出具有固有的不确定性,”他在给 PopSci 的电子邮件中写道。“我们永远无法绝对确定它接下来会说什么。”因此,像 ChatGPT 和 Bard 这样的程序可能适合没有唯一答案的任务(例如讲笑话或提出食谱创意),但在需要精确度的任务(例如历史事实或构建逻辑论证)上却不那么适用,Hegde 说。

“我很震惊,Bing 团队制作了这个充满不准确信息的预先录制的演示,并自信地向世界展示它,就好像它是很好的一样,”Brereton 在他们的博客文章中写道,然后告诫道,“我更震惊的是,这个伎俩奏效了,每个人都在没有做任何尽职调查的情况下就加入了 Bing AI 的炒作浪潮。”

<<:  如何从 Windows 开始菜单中删除 Bing 搜索结果

>>:  一辆没有方向盘的自动驾驶电动汽车即将在加州上路

推荐阅读

信浓DVD连载书《亲子共学的佛教故事》评价及推荐点

信浓DVD绘本:亲子共读佛教故事-详细评论及推荐概述《信浓DVD绘本:亲子共学的佛教故事》是信浓企划...

全面回顾《拳严阿修罗》第二季/第二部分:超出预期的战斗场面和更深层次的故事

拳严阿修罗 第二季/第二部分回顾和详情《拳严阿修罗》第 2 季/第 2 部分最终于 2024 年 8...

朝鲜计划本月发射卫星

朝鲜是一个国际弃儿国家,以其鲁莽的核计划和大规模饥荒而闻名。朝鲜今天宣布,计划于本月晚些时候发射一颗...

全面回顾《太阳鱼医生》和《怪盗日瓦戈》从太空传递的爱之讯息

《太阳鱼医生与怪盗日瓦戈:来自宇宙的爱》的号召力与评价1983年播出的《太阳鱼医生与怪盗日瓦戈:来自...

玛丽与魔女之花:精美的视觉效果和动人的故事的全面评论

《玛丽与魔女之花》:Studio Ponoc 的首部作品描绘的魔幻世界2017年7月8日上映的《玛丽...

特斯拉 Model X:“更大、更好的本田 CR-V”

特斯拉 Model X 正在美国 30 个城市巡回展出,与粉丝见面。不过,这些粉丝可不是普通粉丝,他...

GUILSTEIN 评论:引人入胜的故事和深刻的人物

GUILSTEIN - Guilstein - 全面评估和推荐概述《GUILSTEIN》是一部 20...

售价不到 700 美元,即可购买全新高性能 Apple Mac mini Core i7

TL;DR:在我们的安全解决方案促销期间,这款深空灰色 Apple Mac mini(2018)现...

永久删除文件(真实)

当您从计算机中删除文件时,它不会立即消失 - 至少不会立即消失。即使您立即清空回收站或垃圾文件夹,删...

间谍设计的软件可以分析业务团队以缩短销售时间

B2B 销售是一个不透明的世界,受利润驱动,受成本限制,并且充满了未知的、令人困惑的变量。Calib...

无人机周:龙舟、涂鸦艺术等

以下是本周无人机头条新闻汇总:无人机在军事、商业、非营利和娱乐应用方面的亮点。新无人机加入旧战场对于...

寄生蟋蟀有几种比蚂蚁更聪明的方法

对于某些蚁群来说,蟋蟀是寄生虫。尽管蚂蚁已经发展出致命的反击防御机制,但蚁蟋属的蚁蟋仍然能够潜入蚁群...

使用这款兼容 Apple CarPlay 和 Android Auto 的显示屏升级您的驾驶体验

驾驶一辆没有先进信息娱乐系统的汽车,就好比只用一部翻盖手机在数字时代前行。当然,您现有的车载音响可能...

令人难以置信的镜头显示新鱿鱼物种正在照料巨大的卵

加州蒙特利湾水族馆研究所 (MBARI) 的研究人员认为,他们发现了一种新的深海鱿鱼物种,这要归功于...

iPhone 4S 评测:苹果的克制

人们想要一部 iPhone 5。一款绝密的新手机,可以带来前所未闻的乐趣,而将 16 个月前的 iP...