国际象棋通常被视为终极智力挑战:8×8 棋盘上有 32 个棋子,几乎有无限可能的走法。有些国际象棋引擎每秒可以计算数百万步,但传统方法是“蛮力”比赛。蛮力是黑客攻击(显然也是计算机国际象棋模拟)中的一种方法,意思是运行问题的所有可能性,直到程序找到最佳解决方案。 但马修·莱希望让会下棋的计算机更聪明。在伦敦帝国理工学院攻读硕士学位期间,莱训练人工神经网络达到国际象棋大师的水平,比 97.8% 的锦标赛选手都高。他将自己的软件称为 Giraffe。 经过 72 小时的训练,长颈鹿在 46% 的时间内找到了最佳走法。长颈鹿选择的走法在 70% 的时间内都位于前 3 步走法中。Lai 说,之前在国际象棋中尝试机器学习的案例,如 Knightcap,需要程序员设计“模式识别器”,即单独的函数来学习诸如用兵保护国王或同时拥有两种颜色的主教的重要性等走法。机器学习算法会观察已经定义的走法,并了解它们的强度。长颈鹿会自动发现这些模式,因此它可以学习程序员甚至都不会考虑的走法。 赖在详细介绍长颈鹿的论文中写道:“长颈鹿的优势不在于它的眼光能够看得很远,而在于它能够准确评估棘手的位置,并理解人类直观的复杂位置概念。” 赖教授利用 1.75 亿个数据点训练他的人工神经网络,该网络通过不断测试推测解决方案的有效性来模仿人类的学习方式。他从人类和其他计算机的游戏中获取了 500 万个初始合法棋盘配置,然后对每个棋盘多次应用随机合法走法。学习过程包括计算机自己下棋,然后根据下一步走法计算它是否会赢。 未经任何训练,Giraffe 在标准化国际象棋引擎测试中得分约为 6,000 分(满分 15,000 分)。经过 72 小时的训练,其得分最高达到 9,700 分。它学会了。 Giraffe 仅次于一款名为 Stockfish 5 的引擎,该引擎自 2008 年开始创建和调试(最初基于 2004 年的 Glaurung 国际象棋引擎构建)。Lai 写道,Giraffe 能够与“精心手工设计的具有数百个参数的庞然大物”抗衡,这对于它的年轻人来说非常了不起,测试套件甚至可能低估了他的程序。 “由于该测试套件非常出名,因此至少有部分引擎可能专门针对该测试套件进行了调整,”Lai 在他的论文中写道。“由于 Giraffe 通过自我对弈发现了所有评估特征,因此它很可能知道一些尚未被人类研究过的模式,因此未将其纳入测试套件。” 下一步是让 Giraffe 更加高效。Lai 建议使用 Giraffe 训练小型网络以提高速度,并使用另一个神经网络进行时间管理。 |
>>: Apple Watch 上的 Airstrip 应用可能会改变我们治疗慢性病的方式
谈到气候变化,未来就是现在;现在(仅仅)谈论未来的潜在影响已经没有意义了,因为根据政府监督的一组科学...
在这个人们比以往任何时候都更愿意放弃有线电视、玩电子游戏的世界里,巨大的电视大小的电脑显示器确实有其...
每年,我们都会从拥有伟大创意的聪明人那里了解新公司。他们来自世界的每个角落,为我们提供很酷的创新,供...
犬王的魅力与名声■ 公共媒体剧院■ 原创媒体小说■ 发布日期2022 年 5 月 28 日■流通公司...
白头鹰看起来棒极了。哎呀,所有的鹰看起来都棒极了。这就是为什么它们成为一个很好的国家象征的原因——它...
这是二月的一个阳光明媚的早晨,你打开电视看当地的天气预报。气象预报说气温为 30 华氏度,这似乎不算...
锁链编年史:哈克塞塔斯之光:源自游戏的盛大冒险《锁链编年史:哈克塞塔斯之光》是一部改编自世嘉原创智能...
谷歌地图和苹果地图都旨在帮助您尽可能高效、安全地从 A 到达 B,为此,他们利用众包数据来记录可能妨...
无论您是否决定在今年一月健身,肌肉月都会教您一些关于伸展、收缩、举重、撕裂、增肌等方面的知识。理论上...
“好人有好报”这句话是真的吗?不幸的是,对于我们当中所有心软的人来说,残暴的行为可能是人类和黑猩猩...
冰岛的黑沙、智利的白雪皑皑的山峰和纳米比亚的焦橙色沙丘:2024 年索尼世界摄影奖的自然风景图片记录...
电影《不幸生物百科全书》的号召力与评价2022年7月8日上映的电影《不幸生物百科全书》是根据高桥书店...
听我说——在决定将宝贵的资金花在哪里时,以下是节省宝贵时间的最佳方法。我查看了亚马逊 10 月促销(...
在当今竞争激烈的电商市场中,如何吸引并维系客户,已成为每个商家面临的重要问题。而定制产品服务,以其独...
《鬼闻金》——回顾昭和时代经典动画1958年8月上映的《鬼见き》是一部在日本昭和动画史上留下印记的作...