为什么研究人员要教人工智能玩 Minecraft

为什么研究人员要教人工智能玩 Minecraft

核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。

为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。

[相关:这只敏捷的机器狗使用摄像机代替感官。]

《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。

通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。

[相关:让汽车进行通信的人工智能可能会减少交通拥堵。]

尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。

OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。

我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。

<<:  使用 MacOS 的快捷方式应用可以轻松自动执行 5 项任务

>>:  中国抗议活动期间,Twitter 被 NSFW 垃圾邮件淹没

推荐阅读

档案馆:科普美容秘诀

尽管《大众科学》的读者群主要由男性组成,但老一辈的读者对美容院还是很了解。尤其是从 20 世纪 20...

研究人员推出一款思维控制无人机

明尼苏达大学的研究人员今天展示了一款仅靠意念就能控制的无人机,而这还不是最酷的。该项目发表在《神经工...

美国联邦通信委员会即将经历一场重大变革,这可能会极大地影响互联网

1 月 20 日,即乔·拜登总统就职典礼当天,阿吉特·派辞去了联邦通信委员会主席一职。派的离职发生在...

Alexa,你为什么损失了这么多钱?

据《商业内幕》报道,亚马逊语音助手 Alexa 今年预计将亏损 100 亿美元。Alexa 所搭载的...

中国新型弹道导弹潜艇或将改变其核战争前景

中国最新型核弹道导弹潜艇“晋”094A型的最新照片暗示,该潜艇将有很大改进——体型更大,舰帆后部“驼...

山谷钟声:重新评价每个人动人的歌声

《谷中钟声》——动画重现昭和经典1964年12月在NHK教育电视台(现NHK电子电视台)播出的《谷中...

前空军军官声称不明飞行物造访基地并篡改核武器

真相就在眼前,昨天,一群退役空军军官聚集在华盛顿特区的国家新闻俱乐部,召集媒体和少数支持者,试图揭露...

蜘蛛胶的进化速度可能比蜘蛛本身还快

对于蜘蛛来说,吐丝是生存的保证。如果蜘蛛吐不出足够好的丝来捕捉昆虫,它们就很难甚至不可能获得足够的食...

奥托·温森如何带领人类进入平流层

1783 年,约瑟夫-米歇尔和雅克-埃蒂安·蒙哥尔菲将一只绵羊、一只鸭子和一只公鸡放在热气球的空篮里...

为什么我们不能在飓风袭击我们之前阻止它?

飓风桑迪造成了数十亿美元的损失和大量人员伤亡。我们提前几天就预见到了“弗兰肯风暴”的到来。我们可以将...

通过这款配对游戏解读神秘的声音

我们知道您现在待在家里很无聊——我们也是。这里有一些谜题和智力题,您可以亲自或通过视频聊天挑战您的家...

海洋变暖与贝类中危险的神经毒素有关

一种神秘的、可能致命的神经毒素通过贝类毒害人类,现在已被证实与海水变暖有关。新发现可以帮助渔业预测其...

通用汽车的新电池化学成分?它已应用于雪佛兰 Volt

通用汽车昨天召开电话会议,宣布从阿贡国家实验室获得一种新型高能电池电极化学成分的许可,会议中出现了一...

我玩了《星球大战前线》测试版,多次死亡

今天,星球大战之年又一个篇章拉开帷幕,Dice 的《星球大战:前线》公测版正式发布。测试版更像是一个...

这个南太平洋岛屿可以帮助我们了解真菌是如何进化的

20 世纪 90 年代末,真菌学家 Matteo Garbelotto 抓着一根绳子,爬上长满茂密潮...