观看两个微型人工智能机器人踢足球

观看两个微型人工智能机器人踢足球

Google DeepMind 现在能够训练微型现成的机器人在足球场上一决高下。在今天发表在《科学机器人》杂志上的一篇新论文中,研究人员详细介绍了他们最近的努力,即调整一种称为深度强化学习 (deep RL) 的机器学习子集,以教双足机器人进行这项运动的简化版本。该团队指出,虽然过去类似的实验创造了极其敏捷的四足机器人(参见:波士顿动力 Spot),但对两足人形机器的研究却少得多。但机器人运球、防守和射门的新镜头展示了深度强化学习对人形机器的指导有多么出色。

虽然谷歌 DeepMind 的最终目的是用于气候预报和材料工程等大型任务,但它也可以在国际象棋、围棋甚至星际争霸 II等游戏中完全击败人类竞争对手。但所有这些战略动作都不需要复杂的身体运动和协调。因此,虽然 DeepMind 可以研究模拟足球运动,但它还无法将其转化为实际的运动场——但这种情况正在迅速改变。

为了制作微型梅西,工程师们首先在计算机模拟中开发并训练了两项深度强化学习技能——从地面站起的能力和如何在与未经训练的对手的比赛中进球。然后,他们通过结合这些技能,将系统虚拟训练成一对一的完整足球比赛,然后将他们随机配对给经过部分训练的复制体。

[相关:谷歌 DeepMind 的人工智能预测优于“黄金标准”模型。]

研究人员在论文介绍中写道:“因此,在第二阶段,代理学会了结合先前学到的技能,将其细化为完整的足球任务,并预测和预期对手的行为。”后来又指出,“在比赛过程中,代理在所有这些行为之间流畅地转换。”

得益于深度强化学习框架,由 DeepMind 驱动的代理很快就学会了改进现有的能力,包括如何踢足球、射足球、盖帽,甚至用身体作为盾牌来保卫自己的球门免受对手的攻击。

在一系列一对一比赛中,使用深度强化学习训练的机器人,两名机械运动员行走、转身、踢腿和直立的速度都比工程师仅向他们提供脚本技能基线时的速度要快。这些改进也并非微不足道——与非自适应脚本基线相比,机器人行走速度提高了 181%,转身速度提高了 302%,踢腿速度提高了 34%,跌倒后站起来所需的时间减少了 63%。此外,经过深度强化学习训练的机器人还表现出了新的、突发的行为,比如用脚旋转和旋转。否则,预先编写这样的动作将极具挑战性。

图片来源:Google DeepMind

在 DeepMind 驱动的机器人进入 RoboCup 之前,还有一些工作要做。在这些初始测试中,研究人员完全依赖基于模拟的深度强化学习训练,然后再将这些信息转移到物理机器人上。未来,工程师们希望将虚拟和实时强化训练结合起来,用于他们的机器人。他们还希望扩大机器人的规模,但这需要更多的实验和微调。

该团队认为,将类似的深度强化学习方法应用于足球以及许多其他任务,可以进一步改善双足机器人的运动和实时适应能力。不过,目前你不太可能需要担心 DeepMind 人形机器人会出现在全尺寸足球场上——或者出现在劳动力市场上。同时,考虑到它们的持续改进,做好准备揭发它们可能并不是一个坏主意。

<<:  互联网提供商最终被迫披露“营养”标签上的所有隐藏费用

>>:  被时间遗忘的“Captain Power”革命性玩具技术

推荐阅读

快速访问 iPhone 信息应用中的重要对话

短信非常方便,但如果您经常向无数人和数十个群聊发送短信,那么在需要时很难找到特定的对话。 Apple...

北极刚刚拿到了2016年气候“成绩单”——结果不及格

北极一旦失灵,我们所有人都会蒙受损失。美国国家海洋和大气管理局 (NOAA) 于周二发布了年度“北极...

冰川战士盖斯拉格:全面回顾史诗般的冒险和动人的故事

冰川战士盖斯拉格 - 冰川战士盖斯拉格概述《冰河战士Gaislugger》是一部于 1977 年播出...

档案馆:汽车安全提示

虽然这个封面很吓人,但我们不会撒谎,它相当准确地描述了我们在糟糕的一天对车辆的感受。汽车保养并不是每...

我们询问了读者为什么喜欢三星 Galaxy Note

没人想到,5.3 英寸的三星 Galaxy Note 会成为笑话。许多电子产品评论家讨厌大屏幕手机。...

Ring ni Kakero 1:日美对决的详细评论和评分

《Ring ni Kakero 1:日美战争》的完整故事和吸引力《Ring ni Kakero 1:...

爱丽丝侦探社第二季的魅力与评价:新的谜团与人物的深化

《爱丽丝侦探社》第二季的号召力与评价《爱丽丝侦探社》是1996年至1997年播出的电视动画,其独特的...

由于具有母系基因,这种鸟可以诱骗其他鸟照顾它的蛋

“寄生虫”这个标签可能会让人联想到钩虫、水蛭或蜱虫。然而,非洲杜鹃雀却是一种不同的寄生虫。这些鸟喜欢...

本尼迪克特·康伯巴奇如何变成龙 [视频]

抱歉,您的浏览器不支持 HTML5 视频。您可以尝试直接查看 gif:https://gfycat....

本周我们了解到的最奇怪的事情:致命的失眠症、最漂亮的便便和紧急养蜂人

本周你学到的最奇怪的事情是什么?好吧,不管是什么,我们保证如果你听 PopSci 的最新播客,你会得...

如何检查你的计算机是否随着时间的推移而变慢

即使是最强大的计算机也不能永远使用下去——否则我们仍然在使用几十年前的个人电脑。但试图确定笔记本电脑...

全面评测《三国志[上]英雄的黎明》!经典动漫的魅力究竟是什么?

《三国演义(上)英雄的黎明》——历史与戏剧的融合《三国演义[前篇]英雄的黎明》于1992年1月25...

每次詹姆斯韦伯太空望远镜呈现新的天象时都会收到提醒

詹姆斯·韦伯太空望远镜 (JWST) 已经让我们看到了迄今为​​止发现的最遥远的星系,它还有大约 2...

某位老人的VRMMO活动记录:评价中老年玩家的新冒险

《某位老人的VRMMO活动纪实》——跨越现实与虚拟界限的冒险《某位老人的VRMMO活动记录》于202...

实验室老鼠可能正在进行自己的实验

人们早就知道,老鼠可以通过训练完成简单的任务,换取奖励。用一口食物贿赂饥饿的老鼠,或用一滴水贿赂口渴...