在任何科学领域,好的研究都是可以复制的。如果其他人可以模仿你的实验并得到相同的结果,那么这预示着研究结果的有效性。如果其他人可以调整你的研究以获得更好的结果,那么这对社区来说将更加有益。 这些想法是 OpenAI Gym 背后的驱动力,OpenAI Gym 是一个人工智能研究的新平台。OpenAI 于今年早些时候宣布成立,是埃隆·马斯克、Y Combinator 的山姆·奥特曼和前谷歌员工伊利亚·苏茨克弗的创意。该合作承诺开展雄心勃勃的人工智能 (AI) 研究,同时发布和开源几乎所有他们所做的工作。该平台希望成为某些类型的 AI 算法的基准,以及人们分享其结果的平台。 然而,有趣的是,OpenAI Gym 不会根据谁能成为得分最高的算法来设立排行榜。相反,它将专注于推广具有良好泛化能力的算法——这意味着它们在完成其他类似任务时具有多功能性。许多人工智能研究人员认为,泛化是人类智能的最大障碍。目前,能够识别猫图像的算法无法理解语音,因为它们以不同的方式处理数据。泛化意味着算法知道如何像人类一样处理这两种情况。 OpenAI 团队平台不一定适合进行小幅改进的迭代工作。他们想要的是能够改变我们对算法思考方式的项目。 OpenAI Gym 的提交文档称:“这不仅仅是为了最大化得分,而是为了找到能够很好地推广的解决方案。涉及特定任务的硬编码或没有揭示学习算法有趣特征的解决方案不太可能通过审查。” OpenAI Gym 平台专注于强化学习,这是人工智能的一种形式,其核心是完成任务。如果算法表现良好,就会得到奖励。如果失败,则没有奖励——然后它会尝试其他方法。强化学习已被证明在机器人和视频游戏中效果特别好。这与 Google Deepmind 用来击败 Atari 游戏的人工智能技术相同。 事实上,Atari 环境将成为该网站的一个选项,此外还有模拟机器人和其他棋盘游戏。甚至连如今声名狼藉的中国古代棋盘游戏围棋也将在该网站上占有一席之地。 其理念是,研究人员构建算法,然后将其置于各种环境(测试算法的虚拟空间)中。然后,他们可以看到算法在客观测试中的表现,做出调整,甚至发布基准供社区其他成员查看。该平台与各种开源人工智能框架兼容,例如 Google 的 TensorFlow 和蒙特利尔大学的 Theano。 OpenAI Gym 目前处于公开测试阶段,研究人员可以开始提交他们的算法。 |
超新星爆炸后,气体和尘埃会残留。观察这些恒星爆炸是天文学家测量宇宙膨胀的一种方式。另一种残留物可能提...
人类的知识有多大? Pete Sucheski没有人能够一直知道所有事情——但我们人类确实喜欢假装自...
黑杰克:一位天才外科医生的故事和号召手冢治虫的代表作《怪医黑杰克》于2004年至2006年作为电视动...
数周以来对马来西亚航空公司 370 航班的搜寻表明,目前用于寻找失事飞机的工具急需更新。当飞机坠毁在...
《朗格马克斯:论语 MAX》:讲述儿童正义与友谊的故事《Longomax 论语 MAX》是一部动画系...
《Kanojo mo Kanojo》第二季评论和详细信息《彼女彼女》是一部改编自 Hiroyuki ...
2019 年 4 月 15 日,巴黎圣母院发生大火,全世界的目光都集中在这一新闻上。这场灾难损坏了大...
麒麟浪漫剧场《巴黎的伊莎贝尔》——深情与优美音乐的融合麒麟古典浪漫剧场的《巴黎的伊莎贝尔》是 197...
“一个不了解情况的转校生闯了进来。 《不明状况的转校生闯进来了》是一部电视动画,改编自川村拓哉的同...
为了在降低成本的同时最大限度地发挥效用,工程师们正在创造性地设计他们潜在的机器人货物。随着政府和私营...
如果您受够了蓝牙配件电池耗尽或连接断开的问题,请停止手头的工作,前往 Drop 的发烧友和机械键盘社...
我们正处于火箭的黄金时代,SpaceX、Blue Origin 和 Virgin Galactic ...
11 月 18 日,新泽西州上空开始出现神秘无人机的报道。不久之后,其他多个州的居民也声称看到了类...
安徒生的故事 - 安徒生的故事■ 公共媒体剧院■ 原创媒体童话故事■ 发布日期1968 年 3 月 ...
使用 Microsoft Windows 11 Pro 更新您的 Windows 操作系统,目前价格...