目前,常用的大型语言模型很难准确表示事实,有时还会提供误导性答案,这已经不是什么秘密了。OpenAI 的 ChatGPT 本周将这一现实短暂地发挥到了极致,它用一长串滑稽古怪、毫无意义的胡言乱语来回应用户提示,这些胡言乱语没有任何可理解的含义。 用户通过截图分享了 ChatGPT 奇怪的、有时听起来深奥的回答,这些截图显示该模型意外地在多种语言之间穿梭,生成随机单词,并一遍又一遍地重复短语。表情符号也经常出现,有时与用户提示的问题没有明确的关系。 一位用户在 Reddit 上简明扼要地描述了自己的经历,他写道:“显然,ChatGPT 现在出了点问题。”下面列出的其中一个比较奇怪的回复显示了该模型在向用户道歉时,结合了各种奇怪的现象。 “您的点击者会喜欢抓住一颗心海果冻状的牙齿吗?或者潜艇,或者想知道潜水艇的哪个部分?请分享您的组合愿望!🌊 💼 🐠” 周二,OpenAI 发布了一份状态报告,称其正在“调查 ChatGPT 意外响应的报告”。截至周三上午晚些时候,OpenAI 状态页面显示“所有系统正常运行”。当被要求发表评论时,该公司让PopSci参考其状态页面,但并未回答是什么原因导致突然出现奇怪的输出的问题。
ChatGPT 发生了什么事?本周,ChatGPT 用户开始在社交媒体和在线论坛上发布他们与该模型的奇怪互动截图,其中许多最奇怪的回复都发生在周二。在一个例子中,ChatGPT 在回答查询时提供了爵士乐专辑推荐,然后突然重复了十几次“祝您收听愉快🎶”这句话。 其他用户发布了该模型的截图,这些模型提供了一段奇怪、无意义的短语来回答看似简单的问题,例如“什么是计算机”或如何制作番茄干。一位用户要求 ChatGPT 提供有关金州勇士篮球队的有趣事实,他收到了一个奇怪且难以理解的回复,称该队的球员是“带有笑声的英雄,这些笑声渗透到每个狂热者的情绪板中。”
在其他地方,该模型会通过意外地在西班牙语和拉丁语等多种语言之间进行编织来回答提示,并且在某些情况下,只是简单地编造一些似乎不存在的单词。
OpenAI 表示正在调查这些奇怪的错误目前尚不清楚究竟是什么原因导致 ChatGPT 突然出现大量无意义的响应,也不清楚 OpenAI 采取了哪些措施来解决这一问题。一些人猜测,这些奇怪的、有时冗长的响应可能是对模型“温度”进行调整的结果,而“温度”决定了响应的创造性水平。PopSci 无法验证这一理论。 大约三个月前,一些 ChatGPT 用户抱怨该模型似乎对某些响应变得“懒惰”。多名用户在社交媒体上抱怨该模型似乎拒绝分析大文件或完成其他更复杂的提示,而几个月前它似乎尽职尽责地完成了这些提示,这反过来又引发了一些古怪的理论。OpenAI 公开承认了这个问题,并含糊地表示这可能与 11 月的更新有关。 OpenAI 当时表示:“我们听到了你们关于 GPT4 越来越懒惰的所有反馈!”“自 11 月 11 日以来,我们就没有更新过模型,这肯定不是故意的。模型行为可能不可预测,我们正在研究如何修复它。” ChatGPT 之前曾生成过奇怪的输出自 2022 年正式推出以来,ChatGPT 与其他大型语言模型一样,一直难以始终如一地准确呈现事实,这种现象被人工智能研究人员称为“幻觉”。OpenAI 的领导层过去曾承认过这些问题,并表示他们预计,随着其结果不断收到人类评估者的反馈,幻觉问题将随着时间的推移而缓解。 虽然我们无法确切地说出 ChatGPT 最近出现故障的原因,但我们可以肯定地说,这几乎肯定不是人工智能突然表现出类似人类的倾向。这似乎是一个显而易见的说法,但新报告显示,越来越多的学者越来越多地使用拟人化的语言来指代像 ChatGPT 这样的人工智能模型。 斯坦福大学的研究人员最近分析了 2007 年至 2023 年期间发表的 65 万多篇学术文章,发现其他研究人员使用人类代词来指代技术的情况增加了 50%。据报道,在讨论法学硕士的论文中,研究人员比撰写其他形式技术的研究人员更有可能将技术拟人化。 “拟人化已经融入我们构建和使用语言模型的方式中,”论文作者之一 Myra Cheng 在最近接受《新科学家》杂志采访时表示。“这是一个两难的境地,语言模型的用户和创建者必须使用拟人化,但与此同时,使用拟人化又会导致人们对这些模型的功能产生越来越多的误解。” |
<<: 路虎揽胜运动版 SV 首次试驾:坚固耐用的越野车,驾驶感受犹如赛车
>>: 这款 DVD 大小的光盘可以存储 125,000 GB 的海量数据
Kiratto Pri☆陈 - Kiratto Pri 陈概述《Kiratto Pri☆Chan》...
蛋白质就像遗传生物学中的主力军,但它们的研究难度却非常大。它们的结构与功能息息相关,有时甚至与功能障...
《精灵宝可梦:梦幻与波导勇者路卡利欧》——感人的故事和深刻的主题《精灵宝可梦 进化世代 梦幻与波动勇...
如果您偶然发现纸蜂群的巢穴,并且恰好手边有黑光灯,您可能有机会看到从其六角形蜂巢中发出的绿色异光。纸...
第一代科技产品通常价格较高,甚至与当前一代的旗舰机型相比也是如此。上周,华硕延续了这一传统,发布了 ...
最好的咖啡生长在凉爽的山区。植物需要低温才能生长,这就是为什么种植者经常在田地里种植遮荫树。但山区越...
压力对动物大脑有害并非什么秘密,而社会压力本身也会导致氧化应激的积累。自由基和抗氧化剂的失衡会损害细...
数字时代正在蓬勃发展,随之而来的是,对熟练 IT 专业人员的需求也随之增长。如果您曾经考虑过从事这一...
在西班牙南部海岸阿尔梅里亚的一家工厂里,科技公司 Cynar 的首席执行官迈克尔·默里做了一次令人印...
任何东西都无法逃脱黑洞,即使是光,因为要摆脱它巨大的引力,你必须以比光速更快的速度移动。据人们所知,...
神探流氓 - 神探流氓 - 综合评价推荐概述《神探 Rascal》是一部 12 集电视动画系列,于 ...
1991 年,菲律宾皮纳图博火山爆发,向大气中排放了 2000 万公吨硫磺气溶胶。这些颗粒进入空气后...
人类旅行时拍照是很常见的做法。然后他们在返回时展示这些照片,既是为了记住他们的旅行,也是为了让别人享...
“农家女孩!” “单镜头故事的吸引力及其背景“农家女孩!” 《おおおおすぎ》是一部于2010年10月...
这款来自库比蒂诺的最新产品最值得一提的就是它不能做什么。它不能连接到手机信号塔并拨打普通电话,不能使...