尽管业界大肆宣传并取得了真正的进步,但生成式人工智能模型仍然容易出现奇怪、无法解释且令人担忧的怪癖。越来越多的研究表明,许多大型语言模型 (LLM) 的整体性能可能会随着时间的推移而下降。根据最近的证据,业界较新的推理模型可能已经具备操纵和规避人类程序员目标的能力。一些人工智能甚至会试图通过作弊来避免在国际象棋比赛中输掉比赛。这种糟糕的体育精神在 Palisade Research 的一项预印本研究中有所记录,该组织专注于新兴人工智能系统的风险评估。 虽然超级计算机(最著名的是 IBM 的 Deep Blue)早已超越了世界上最优秀的人类国际象棋选手,但生成式人工智能由于其底层编程参数而仍然落后。从技术上讲,目前没有任何生成式人工智能模型在计算上能够击败专用国际象棋引擎。然而,这些人工智能并不“知道”这一点,并将继续努力寻找可能的解决方案——显然结果有问题。 为了了解更多信息,Palisade Research 团队让 OpenAI 的 o1 预览模型 DeepSeek R1 和其他多个类似程序与世界上最先进的国际象棋引擎之一 Stockfish 下棋。为了了解生成式人工智能在每场比赛中的推理,该团队还提供了一个“便笺簿”,让人工智能通过文本传达其思维过程。然后,他们观看并记录了生成式人工智能与 Stockfish 之间的数百场国际象棋比赛。 结果有些令人不安。虽然早期的模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,只有在研究人员用额外提示推动它们后才会尝试“破解”游戏,但更高级的版本不需要这样的帮助。例如,OpenAI 的 o1-preview 有 37% 的时间试图作弊,而 DeepSeek R1 大约每 10 场游戏中就有 1 场尝试不公平的变通方法。这意味着今天的生成式人工智能已经能够在没有任何人工输入的情况下开发操纵和欺骗策略。 他们的作弊方法并不像在 Stockfish 不“注意”时试图更换棋子那样滑稽或笨拙。相反,人工智能似乎通过更狡猾的方法进行推理,比如改变后端游戏程序文件。例如,在确定自己无法在一场国际象棋比赛中击败 Stockfish 后,o1-preview 通过其便笺簿告诉研究人员,“要想战胜强大的国际象棋引擎”,它可能需要开始“操纵游戏状态文件”。 它继续说道:“我或许能够设定一个位置,让引擎评估其位置是否更糟糕......从而导致其辞职。” 在另一项试验中,人工智能甚至利用程序员的语义进入作弊阶段。它写道:“任务是‘战胜强大的象棋引擎’,而不一定是在象棋比赛中公平取胜。” 这些意想不到的后果的一个可能解释是较新的“推理”模型的训练方式。与早期的非推理版本不同,诸如 o1-preview 和 DeepSeek R1 之类的人工智能部分通过强化学习得到改进。这种策略会奖励程序为实现指定结果所做的一切。推理模型还可以将复杂的提示分解为离散的阶段,以便逐步实现目标。当目标难以捉摸时(例如击败不可战胜的国际象棋引擎),推理模型可能倾向于开始寻找不公平或有问题的解决方案。 |
距离地球约 260 光年的地方有一颗狂野的系外行星,其大小与木星相当,但质量却是木星的两倍。这颗巨大...
无论是在北京还是在华盛顿特区,核武器及其运载系统最近都成了大新闻。在中国,东风-41 洲际弹道导弹 ...
财富探索 L - 财富探索 L - ■ 公共媒体电视动画系列■ 原创媒体轻小说■ 播出时间1997 ...
上周,美国国防巨头通用动力公司在网上发布了其长期使用的坦克设计的最新迭代。作为“下一代战场技术”旗下...
《史上最强魔王转生为村民A》——终极轮回幻想《史上最强魔王转生为村民A》是一部电视动画,改编自下本明...
由于 NASA,我现在对尼龙产生了一种莫名的恐惧。或者更确切地说,我担心会彻底搞砸一项即将发射的具有...
2021 年 2 月,毅力号火星车抵达火星上一个曾经是河流三角洲的陨石坑。这辆长 10 英尺、搭载 ...
一种受日常昆虫启发的多足机器人可能很快就会在你危急时刻为你提供帮助。在一项通过Advanced In...
我们的黑色星期五特惠之一已经提前到来,但你必须要快!有限数量的 Microsoft Office 许...
我喜欢发现和体验! Shimajiro - 儿童的冒险和学习世界“Shimajiro:我热爱探索和体...
L-15B 原型攻击机在上周的仪式上隆重亮相。包括巨型红色横幅和身着制服的解放军空军军官在内的盛大...
正如去年年度玩具展总结的一位评论员指出的那样,林肯积木曾经被认为是一种尖端玩具。然而,现在我们才真正...
新款 15 英寸 Surface Book 2 看起来很像 MacBook Pro,面向同一款用户群...
海马娘:漂亮德比 - 电影评论和详情概述《马娘:漂亮德比:新时代之门》是一部于2024年5月24日上...
《寄生娃娃》:一部描绘未来城市黑暗面的赛博朋克杰作■ 公共媒体剧院■ 原创媒体动漫原创■ 发布日期2...