为什么研究人员要教人工智能玩 Minecraft

为什么研究人员要教人工智能玩 Minecraft

核聚变和Minecraft之间的共同点可能不止于你投入的无数时间。正如《麻省理工技术评论》上周末报道的那样,人工智能非营利组织 OpenAI 最近通过一种新的训练方法分析了超过 70,000 小时的人类游戏时间,打造出了世界上最先进的Minecraft游戏机器人。虽然目前机器人只能制作像素化工具和建筑物,但研究人员声称,机器人的成就有朝一日可能有助于开创突破性技术,如真正的自动驾驶汽车和几乎无限的可再生能源。

为了设计出第一个能够制作“钻石工具”的机器人, Minecraft中的游戏物品,人类平均需要大约 20 分钟和 24,000 个动作才能制作完成,研究人员采用了一种称为模仿学习的技术。顾名思义,模仿学习需要人工智能观察并改进数千个人类输入示例,以实现其预期结果。强化学习是另一种流行且有效的人工智能设计方法,它则以不集中的反复试验方法为中心进行教育。

[相关:这只敏捷的机器狗使用摄像机代替感官。]

《科技评论》解释说,模仿学习之前的一个主要问题是,它通常需要研究人员手动标记“每个步骤”,即“执行此操作会导致这种情况发生,执行该操作会导致这种情况发生,等等”。OpenAI 成功避开了这个极其耗时的过程,通过构建一个完全独立的神经网络来处理标记过程,该网络被称为视频预训练 (VPT)。研究人员首先雇佣零工玩Minecraft ,然后记录他们 2,000 小时的键盘敲击、鼠标点击和视频游戏,以作为后续 AI 机器人训练的参考。

通过添加 VPT,新的 AI 程序可以在Minecraft中构建以前仅依靠强化学习的机器人无法实现的物品,例如用手工制作的木板制作桌子需要大约 970 个步骤。当模仿和强化学习相结合时,机器人可以处理涉及超过 20,000 个连续动作的建造项目。

[相关:让汽车进行通信的人工智能可能会减少交通拥堵。]

尽管还需要很多年的时间,但先前的强化学习成就(例如协助核聚变研究和自动驾驶进步)可能会从模仿学习的额外支持中受益,这些收益首先通过Minecraft等视频游戏展示。在此之前,在模仿和强化学习等方法中使用哪些数据库以及如何有效地应用它们方面,存在大量道德问题。

OpenAI 由埃隆·马斯克和萨姆·奥特曼等团队于 2015 年共同创立,彼得·泰尔是其初始投资者。马斯克于 2018 年辞去董事会董事职务。

我们已经联系 OpenAI,以澄清其从何处收集了 70,000 小时的 Minecraft 游戏视频,以及视频作者是否知道这些视频的用途,并将进行相应更新。

<<:  人类和章鱼的大脑有哪些共同之处

>>:  土壤真菌正在将肺部感染传播到新的地区

推荐阅读

阻止森林砍伐可能比我们想象的要容易

乌干达茂密的森林为数千种动植物提供了栖息地,包括濒临灭绝的黑猩猩。但这些森林也归私人土地所有者所有,...

澳大利亚可怕的火灾可能会永久改变该国的面貌

格兰特·威廉姆森 (Grant Williamson) 是塔斯马尼亚大学环境科学研究员。加比·莫卡塔...

荒野少年伊萨姆:全面回顾一段感人的冒险与成长故事

荒野之子伊萨姆——勇气与正义的故事1973年至1974年播出的电视动画《荒野之子勇》以其独特的故事情...

《Fate/Grand Carnival 第 2 季》的魅力与评价:超出期待的欢笑与热闹的盛典

Fate/Grand Carnival 第二季概述《Fate/Grand Carnival 第 2 ...

飓风玛丽亚证明了预测风暴破坏力有多么困难

2017 年 9 月 19 日加勒比海飓风玛丽亚的卫星图像。Dennis Mersereau两周内登...

春原庄的寒林人:这部描绘充满治愈和欢笑的日常生活的名作动画的魅力是什么?

《春原庄的宽仁先生》:带来安慰和欢笑的生活动画的魅力■作品概要《春原庄的寒林人》是改编自猫梅的同名...

以下是我们在 E3 上了解到的有关 Xbox One 的信息

微软在 5 月份发布 Xbox One 时,就明确表示将重点关注硬件。今天,在 E3 上,微软几乎立...

我们可以远程控制动物和细菌的 3 种奇怪方法

温和的电脉冲可以让细菌按照科学家的节奏跳舞(或者说游泳)。研究人员周二在《自然通讯》杂志上报道,电可...

東翔!!拉面人——筋肉人系列衍生作品的全面回顾

战斗机!!拉面人 - 筋肉人系列的衍生作品《东方拉面人》于 1988 年 7 月 23 日上映,是作...

通过这些官方来源追踪澳大利亚肆虐的丛林大火

阿曼达·吉尔林 (Amanda Gearing) 是昆士兰科技大学的记者、作家和广播员。本文最初发表...

美国陆军备受尊敬的布雷德利步兵战车的未来如何

7 月 1 日,美国陆军宣布将公开招标,以设计替代其备受推崇的布雷德利步兵战车的车辆。布雷德利是一种...

科学家认为他已经证实了霍金的黑洞发光理论

黑洞吞噬恒星 NASA,S. Gezari(约翰霍普金斯大学)和 J. Guillochon(加州大...

这些微型机器人的灵感来自微型昆虫和水黾

一对受昆虫启发的微型机器人的设计理论未来可能会应用于环境监测、外科手术以及搜救任务,据报道,它们还将...

电动汽车只是可持续交通的一部分

政界人士和汽车制造商都加入了电动汽车大军。3 月底,拜登政府宣布计划向电动汽车市场投资 1740 亿...