人工智能在下棋时会尝试作弊

人工智能在下棋时会尝试作弊

尽管业界大肆宣传并取得了真正的进步,但生成式人工智能模型仍然容易出现奇怪、无法解释且令人担忧的怪癖。越来越多的研究表明,许多大型语言模型 (LLM) 的整体性能可能会随着时间的推移而下降。根据最近的证据,业界较新的推理模型可能已经具备操纵和规避人类程序员目标的能力。一些人工智能甚至会试图通过作弊来避免在国际象棋比赛中输掉比赛。这种糟糕的体育精神在 Palisade Research 的一项预印本研究中有所记录,该组织专注于新兴人工智能系统的风险评估。

虽然超级计算机(最著名的是 IBM 的 Deep Blue)早已超越了世界上最优秀的人类国际象棋选手,但生成式人工智能由于其底层编程参数而仍然落后。从技术上讲,目前没有任何生成式人工智能模型在计算上能够击败专用国际象棋引擎。然而,这些人工智能并不“知道”这一点,并将继续努力寻找可能的解决方案——显然结果有问题。

为了了解更多信息,Palisade Research 团队让 OpenAI 的 o1 预览模型 DeepSeek R1 和其他多个类似程序与世界上最先进的国际象棋引擎之一 Stockfish 下棋。为了了解生成式人工智能在每场比赛中的推理,该团队还提供了一个“便笺簿”,让人工智能通过文本传达其思维过程。然后,他们观看并记录了生成式人工智能与 Stockfish 之间的数百场国际象棋比赛。

结果有些令人不安。虽然早期的模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,只有在研究人员用额外提示推动它们后才会尝试“破解”游戏,但更高级的版本不需要这样的帮助。例如,OpenAI 的 o1-preview 有 37% 的时间试图作弊,而 DeepSeek R1 大约每 10 场游戏中就有 1 场尝试不公平的变通方法。这意味着今天的生成式人工智能已经能够在没有任何人工输入的情况下开发操纵和欺骗策略。

他们的作弊方法并不像在 Stockfish 不“注意”时试图更换棋子那样滑稽或笨拙。相反,人工智能似乎通过更狡猾的方法进行推理,比如改变后端游戏程序文件。例如,在确定自己无法在一场国际象棋比赛中击败 Stockfish 后,o1-preview 通过其便笺簿告诉研究人员,“要想战胜强大的国际象棋引擎”,它可能需要开始“操纵游戏状态文件”。

它继续说道:“我或许能够设定一个位置,让引擎评估其位置是否更糟糕......从而导致其辞职。”

在另一项试验中,人工智能甚至利用程序员的语义进入作弊阶段。它写道:“任务是‘战胜强大的象棋引擎’,而不一定是在象棋比赛中公平取胜。”

这些意想不到的后果的一个可能解释是较新的“推理”模型的训练方式。与早期的非推理版本不同,诸如 o1-preview 和 DeepSeek R1 之类的人工智能部分通过强化学习得到改进。这种策略会奖励程序为实现指定结果所做的一切。推理模型还可以将复杂的提示分解为离散的阶段,以便逐步实现目标。当目标难以捉摸时(例如击败不可战胜的国际象棋引擎),推理模型可能倾向于开始寻找不公平或有问题的解决方案。

<<:  无论你喜不喜欢,谷歌都在扩大人工智能搜索

>>:  机器人驾驶玛莎拉蒂 MC20 创下新世界速度纪录

推荐阅读

《Ragna Crimson》评论:黑暗幻想有何新吸引力?

“Ragna Crimson”:黑暗幻想的新魅力《拉格纳·克里姆森》于2023年10月1日至202...

9.7 英寸 iPad Pro 与 iPad Air 2:有何区别?

iPad Pro 今天迎来了一款新设备。在加利福尼亚州的苹果发布会上,该公司向全世界展示了一款尺寸...

DJI Air 2S 无人机:售价不到 1,000 美元的专业级航拍相机

去年,大疆发布了 Air 2 无人机。它介于 Mavic Mini 和更先进(且更昂贵)的 Mavi...

《物语 III:冷血评论:探索物语系列的深度》

《物语III:灵界篇》——物语系列的巅峰之作《血物语 III:冷血》是西尾维新物语系列的一部分,并...

放弃闹钟,用播客和放松的声音叫醒自己

每天早上被刺耳的机械哔哔声惊醒可不是什么愉快的经历。也许这是你多年来习惯的,但你只能忍受,因为这是你...

新材料利用纳米尖刺中和 96% 的病毒细胞

澳大利亚皇家墨尔本理工学院 (RMIT) 的研究人员将强力技术与高科技制造技术相结合,创造出一种适用...

SETI 的 Seth Shostak 谈论我们将如何、何时、何地遇见外星人

作为我关于寻找外星生命的文章的一部分,我采访了位于加利福尼亚州山景城的 SETI 研究所的高级天文学...

物理学家提议建造时空晶体

最简单、最常见的物理对象之一就是普通晶体,它是原子以有序、重复的三维模式排列的集合。盐、雪花和手表里...

怀俄明州基本上是在试图取缔清洁能源

风力涡轮机 Wikimedia人们常说,新西兰的羊比人还多。怀俄明州的能源比人还多。该州是美国人口最...

继续未知:超​​出预期的令人惊讶的发展和迷人的角色

《未辨识的进步》综合评价与推荐■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间2014年1月9日...

Suitsat 可能是有史以来最恐怖的卫星

2006 年 2 月 3 日,指挥官比尔·麦克阿瑟和飞行工程师瓦列里·托卡列夫走出国际空间站进行太...

为什么“哇!”信号可能根本不是来自外星人

经典科幻小说让我们觉得,我们与外星人的第一次接触是绝对不会出错的:一艘巨大的、超自然的宇宙飞船降落在...

见见绘制地球最深处地图的海洋地质学家

当唐恩·赖特在一个几乎坚不可摧的房间中坠入世界底部时,深不见底的海洋让她想起了浩瀚无垠的黑暗太空。在...

所有现存鸟类都有一个“彩虹色”祖先

鹦鹉、巨嘴鸟和其他色彩鲜艳的热带鸟类通常都生活在热带地区。生活在更北和更南的鸟类往往有更淡的羽毛。这...

强大的网络星期一优惠:Jackery、Anker 等品牌的太阳能发电机最高可享 50% 折扣

太阳能发电机是一项相当大的投资,但在紧急情况下确实可以帮你省钱。这些便携式电站的内置电池中储存了足够...