谷歌正在训练机器人通过乒乓球与人类互动

谷歌正在训练机器人通过乒乓球与人类互动

昨天,谷歌研究院公布了两个正在研究的乒乓球机器人新项目。谷歌机器人团队训练机器人手臂与其他人进行 300 多次对打,并以“业余选手”的精准度接发球。考虑到有些人打乒乓球的水平很差,这听起来可能并不令人印象深刻,但同样的技术可以用来训练机器人执行其他需要人机密切互动的“动态、高加速度任务”。

乒乓球是一项让机器人学习的有趣任务,因为它具有两个互补的特性:它需要在固定且可预测的环境中进行结构化游戏,同时需要快速而精确的动作。机器人用来做决定的学习算法必须努力工作才能变得优秀,但乒乓球桌的局限性限制了它必须应对的世界。打乒乓球是一项需要双方参与的任务,这确实很有帮助:机器人可以与另一个机器人(或模拟)或真人一起训练。所有这些都使其成为探索人机交互和强化学习技术(机器人从实践中学习)的绝佳设置。

Google 工程师使用同一个机器人设计了两个不同的项目。Iterative-Sim2Real 将于今年晚些时候在 CoRL 上展出,而 GoalsEye 将于下周在 IROS 上展出。Iterative-Sim2Real 是一个训练机器人与人类进行 300 次合作对打的程序,而 GoalsEye 则允许它将发球回击到桌子上的特定目标点,精度堪比业余人类。

Iterative-Sim2Real 试图解决“先有鸡还是先有蛋”的问题,即教机器模仿人类的行为。研究团队解释说,如果你一开始没有一个好的机器人策略(一套机器人规则),那么你就无法收集关于人们如何与机器人互动的高质量数据。但是,如果没有人类行为模型,你就无法制定机器人策略。一种替代解决方案是在现实世界中专门训练机器人。然而,这个过程“通常很慢,成本高昂,并且会带来安全相关的挑战,当涉及到人类时,这些挑战会进一步加剧。”换句话说,这需要很长时间,而且人们可能会被机械臂挥舞乒乓球拍弄伤。

Iterative-Sim2Real 通过使用非常简单的人类行为模型作为起点,然后使用模拟和现实世界中的人类来训练机器人,从而避免了这个问题。每次迭代之后,人类行为模型和机器人策略都会得到改进。使用五名人类受试者,使用 Iterative-Sim2Real 训练的机器人表现优于另一种称为模拟到真实加微调的方法。它以少于五次击球结束的回合明显减少,平均回合长度增加了 9%。

另一方面,GoalsEye 着手解决一组不同的训练问题,并教机器人将球回任意位置,例如“左后角”或“右侧球网上方”。模仿学习(机器人根据人类表现数据制定比赛策略)在高速环境中很难进行。影响人类击打乒乓球的变量太多,这使得机器人几乎不可能跟踪学习所需的一切。强化学习通常适用于这些情况,但速度可能很慢,采样效率低下——尤其是在开始时。(换句话说,需要大量重复才能制定出相当有限的比赛策略。)

GoalsEye 试图使用初始的“小型、结构弱、非目标化数据集”来克服这两组问题,该数据集使机器人能够学习击打乒乓球时发生的基本情况,然后允许它自我练习,教会它精确地将球击到特定点。在经过最初的 2,480 次演示训练后,机器人只有 9% 的时间能够将球击回 30 厘米(约 1 英尺)以内。但在自我练习了约 13,500 次击球后,它的准确率达到 43%。

虽然教机器人玩游戏似乎微不足道,但研究团队认为,用乒乓球解决这类训练问题具有潜在的实际应用价值。Iterative-Sim2Real 允许机器人通过与人类的互动进行学习,而 GoalsEye 则展示了机器人如何从非结构化数据中学习,并在“精确、动态的环境中”自我练习。最坏的情况是:如果谷歌的大目标没有实现,至少他们可以制造一个机器人乒乓球教练。

<<:  精确计时需要时间和激光

>>:  这种适用于太空的太阳能电池板可以像折纸一样折叠

推荐阅读

微生物可以帮助我们在火星上制造火箭燃料

携带足够的燃料前往火星既困难又昂贵,携带回程燃料更是难上加难,但微生物可以消除这种需要。单单人类从火...

气候专家评估我国创纪录热浪的影响

为了纪念世界气象日,有必要仔细研究一下迄今为止我们经历的极不寻常的冬季和春季。《琼斯母亲》对这些专家...

DALL-E 的最新绝招:拓展绘画的边界

Open AI 是 AI 文本转图像生成器 DALL-E 2 的开发商,他们刚刚宣布了该应用的一项新...

《KURAU幻影记忆》评论:超越幻想与现实界限的杰作动画

“KURAU 幻影记忆”:未来与 Linux 的故事《KURAU Phantom Memory》是一...

混蛋!!黑暗的毁灭之神——彻底剖析终极重金属幻想

混蛋!!黑暗破坏神 - 深度评论与推荐《BASTARD!!黑暗破坏神》于 1992 年以 OVA 形...

超级计算机耗时 40 分钟创建 1 秒大脑活动的超详细模型

未来学家们一直在谈论计算机变得像人脑一样强大和多功能的那一天。最近的一次模拟表明,这一天并不一定会到...

《梦神》的诉求与评价:大家之歌的新可能性

梦神:NHK短篇动画中描绘的梦幻世界2007年8月在NHK教育电视台(现NHK E-Tele)播出的...

问答:运动诱发性高潮的惊人现象

根据印第安纳大学性学研究人员的一项新研究,女性在运动时达到性高潮是一种真实现象。据研究人员所知,这是...

美国噪音水平地图

如果你正在寻找一个安静的度假胜地,你可能会听从一些非常古老的建议,前往西部。这张地图显示了美国本土最...

黑客现在可能用 5 种方法杀死你

_单击即可启动图库。_互联网上充斥着这样的消息:现在,机器人可以劫持飞机。紧随其后的是国防部宣布将某...

大家的歌版《44只猫》的魅力与评价

44 只猫 - 44 只猫概述《44只猫》是一部时长只有两分钟的短篇动画作品,于 1969 年 4 ...

Apple 终于为(部分)MacBook 用户提供上门维修服务

苹果最近才开始提供上门产品维修支持,尽管有很多警告,但昨天标志着消费者可用服务的显著扩展——理论上是...

爸爸爱妈妈:全面回顾一部描绘家庭关系和爱情的动人动漫杰作

《爸爸爱妈妈》——回顾大家的经典歌曲《爸爸爱妈妈》是1962年在NHK教育电视台(现NHK E-Te...

如何使用人工智能免费转录文本

早在人工智能被用于生成视频和编写程序之前,它就被用于理解口语并采取行动。人工智能就是你能够与 Ale...

为什么我们还没有驾驶氢动力汽车?电动汽车获胜是有原因的。

氢燃料电池汽车不仅仅是科幻小说或超前研发实验的素材。丰田 Mirai 和现代 Nexo 等氢燃料汽车...