ChatGPT 等生成语言程序可能已经利用其类似人类的响应欺骗了一些用户,但至少有一个迹象表明其存在局限性。尽管人工智能能力强大,但它却不会讲笑话。 更具体地说,它们讲不了多少笑话,更不用说发挥创意了。这一滑稽的评价来自德国航空航天中心和达姆施塔特工业大学软件技术研究所的两位研究人员 Sophie Jentzsch 和 Kristian Kersting。正如他们在新研究中详述的那样,两人最近要求 OpenAI 的 ChatGPT3.5 连续讲 1,008 次笑话。据报道,ChatGPT 随后在 90% 以上的时间内提供了 25 个笑话设置中的 1 个的变体。这让 Jentzch 和 Kersting 得出结论,它的喜剧曲目很可能是在训练阶段学习和记忆的,而不是在运行中产生的。 [相关:大型科技公司最新的人工智能末日警告可能只是同样的炒作。] 据研究人员称,ChatGPT 的所有回答在语法上都是正确的,而且几乎所有回答都只包含一个笑话。改变提示的措辞“没有任何明显的效果”,而 ChatGPT 的多个笑话回答只是来自被特别要求讲“笑话”(复数)。正如Ars Technica最近指出的那样,即使是人工智能相对较少的独特生成数量,也是将其已经记住的笑话部分混合在一起的结果。更重要的是,它们并不总是经得起逻辑的推敲。它编造的一个笑话是这样的:“为什么这个人把钱放进搅拌机里?他想让时间飞逝。” 有趣的是,ChatGPT-3.5 通常可以正确地分析出是什么让某个笑话变得有趣,即使是经典的“反笑话”设置,例如“为什么小鸡要过马路?为了到达另一边。 ”然而,进一步的压力测试表明,这种能力存在于其先前的训练和记忆中。例如,当被问及小鸡“反笑话”的细微变化时,人工智能会尝试根据提示内容而不是其先前的喜剧知识建立逻辑联系:
[相关:不,人工智能聊天机器人(仍然)不具备感知能力。] Jentzch 和 Kersting 写道,这样的回应表明 ChatGPT 有时会尝试“将一种已认可的推理方案应用于不适合的情况”。在经过一系列的笑话请求和分析后,研究人员得出结论,ChatGPT 到目前为止只学会了“一种特定的笑话模式,而不是能够真正地搞笑”,但它对笑话的生成、解释和识别关注的是笑话的含义和内容,而不是表面特征。与之前的大型语言模型相比,ChatGPT-3.5 可以被认为是人工智能对幽默的一般理解的“巨大飞跃”。 Jentzch 和 Kersting 的许多疑问都可以通过研究 OpenAI 的方法和用于训练其程序的数据集来澄清——OpenAI 和许多其他 AI 技术公司对此守口如瓶,理由是存在安全性和滥用问题。当被要求解释这一难题时,OpenAI 最新的 ChatGPT 版本本身称这种情况是“荒谬的”,“戏谑地讽刺了 AI 研究面临的挑战”。 很好,ChatGPT-4。 |
拼图是一种古老的智力测试方式,而且已经有相当长一段时间了。除了拼图提供的智力刺激之外,坐下来尝试解决...
粘菌素是一种在 20 世纪 40 年代末发现的抗生素,但它并不是什么好药。使用粘菌素会带来一系列令人...
《宇航员之歌》:NHK 经典歌曲在动画中重现2003年12月在NHK教育电视台(现NHK电子电视台)...
没有什么比你现在是一个非数字原生代父母的 IT 部门更能表达“恭喜你,你已经成年了!”的残酷现实了。...
在动物进化中,一个经典却有争议的观点认为体型越大越好。体型较大的动物只需在体型上胜过竞争对手,就能在...
《Red Photon Zillion:Diva Nocturne》的吸引力与评价《Red Phot...
《白圣斗士与黑祭司》:纯白与漆黑交织的感人剧情2023年夏天,动画《白之圣斗士与黑之僧侣》俘获了众多...
您可能已经习惯了这样的想法:一部手机通过一副耳机播放音乐、播客或有声读物,但那是过去 — 这是未来。...
自从草原上的一位居民首次将泥巴拍在伤口上以驱赶苍蝇和感染以来,我们脆弱的身体就一直依赖创造性的干预手...
从各方面来看,ISIS 都在打一场必败之战。2014 年,这个极端暴力的伪国家在伊拉克和叙利亚取得了...
大神和他的七个伙伴——这部充满激情的浪漫喜剧的魅力和全貌■作品概要《怪神与七人伙伴》是根据冲田将树的...
6 月份,Unplugged Performance 发布了这家电动汽车改装公司的最新项目——重型 ...
.hack//Roots - Dot Hack Roots - 全面评测推荐概述.hack//Roo...
“向日葵!” - 女忍者的梦想与青春的故事“向日葵!”是2006年开始播出的电视动画,原作是原创动画...
超级娃娃莉卡酱 陷入困境的莉卡酱!娃娃骑士的奇迹 - 电影评论和详情影片概述超级娃娃莉卡酱:莉卡酱陷...