ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户,但至少有一个迹象表明其存在局限性。尽管人工智能能力强大,但它却不会讲笑话。 更具体地说,它们讲不了多少笑话,更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样,两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道,ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论,它的喜剧曲目很可能是在训练阶段学习和记忆的,而不是在运行中产生的。 [相关:大型科技公司最新的人工智能末日警告可能只是同样的炒作。] 据研究人员称,ChatGPT 的所有回答在语法上都是正确的,而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”,而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”(复数)。正如Ars Technica最近指出的那样,即使是人工智能相对较少的独特生成数量,也是将其已经记住的笑话部分混合在一起的结果。更重要的是,它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的:“为什么这个人把钱放进搅拌机里?他想让时间飞逝。” 有趣的是,ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣,即使是经典的“反笑话”设置,例如“为什么小鸡要过马路?为了到达另一边。 ”然而,进一步的压力测试表明,这种能力存在于其先前的训练和记忆中。例如,当被问及小鸡“反笑话”的细微变化时,人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系:
[相关:不,人工智能聊天机器人(仍然)不具备感知能力。] Jentzch 和 Kersting 写道,这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后,研究人员得出结论,ChatGPT 到目前为止只学会了“一种特定的笑话模式,而不是能够真正地搞笑”,但它对笑话的生成、解释和识别关注的是笑话的含义和内容,而不是表面特征。与之前的大型语言模型相比,ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。 Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶,理由是存在安全性和滥用问题。当被要求解释这一难题时,OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”,“戏谑地讽刺了 AI 研究面临的挑战”。 很好,ChatGPT-4。 |
如果黑洞吞噬了一颗行星,而周围没有人听到,它还会发出声音吗?几十年来,物理学家和天文学家一直在尝试通...
一种受蝠鲼启发的新型水下机器人打破了游泳速度最快的软体机器人的世界纪录。该机器人由北卡罗来纳州立大学...
《死亡公爵与他的女仆》第一季的号召力与评价《死神公爵与他的女仆》是改编自井上同名漫画的电视动画,于2...
动物王国中确实不乏有趣的求偶和交配仪式。从三叶虫“比武”以赢得配偶到长颈鹿重要的尿液嗅探仪式,求偶是...
中国军用无人机行业已是全球规模最大的行业之一,在 2016 年珠海航展上,该行业得到了全面展示。此次...
《大江户日本桥》——大家之歌的历史魅力与评价《江户日本桥》是一部时长两分钟的短篇动画片,于 196...
虽然洛杉矶道奇队第八次赢得世界大赛冠军并不是因为“魔法泥”,但棒球的“魔法泥”却是一个传说。每个美国...
蚊子毁掉户外美丽的夏夜比噪音投诉或变质的土豆沙拉更快。Thermacell 的智能驱蚊设备依靠可充电...
据《华盛顿邮报》周二报道,美国八大药房供应商在面临传票请求时向执法部门分享了客户的处方记录。这一消息...
除非您是电子产品评论员,否则您现在还无法拿到新 iPhone——但如果您使用的是 iPhone 5、...
因航班延误几个小时而被困在机场是一件很糟糕的事情,但目前两名 NASA 宇航员的情况更糟。目前,他们...
战国夜血 - 战国夜血概述《战国夜血》是 2017 年播出的一部电视动画系列,改编自 Otomate...
圣路易斯——在一个不起眼的地下实验室里,穿着牛仔裤的工程师们手里拿着蓝图,用梯子在未完工的地板上爬来...
美国无线运营商计划于 7 月 1 日提升 5G 服务强度,但扩大覆盖范围可能会付出代价。正如美国交通...
Neko Ramen 〜我的酱油口味〜评论和详细信息概述《猫拉面~我的酱油味~》是根据孙西健二的人气...