通过 GIPHY 以动词“移除”为例。作为人类,您了解该词的不同用法,并且您知道从视觉上看,场景会因移除的内容不同而有所不同。从大块物体中取出蜂窝状碎片与从田地中拉出防水布或从智能手机上取下屏幕保护膜看起来不同。但您明白了:在所有这些例子中,都有一些东西被移除了。 但是,计算机和人工智能系统需要学会这些动作是什么样子的。为了实现这一目标,IBM 最近发布了一个大型新数据集,其中包含三秒钟的视频片段,旨在通过向研究人员提供动作动词(如“瞄准”、“俯冲”和“除草”)的视觉示例,帮助研究人员训练他们的机器学习系统。探索它(上面的汽车视频和下面的蜜蜂视频来自数据集并演示了“移除”)可以让你了解机器学习中香肠制作过程的奇妙之处。在“眨眼”下,观众可以看到乔恩·哈姆 (Jon Hamm) 扮演的唐·德雷珀 (Don Draper) 眨眼的片段,以及辛普森一家的片段;还有更多这样的片段。在此处查看数据集的一部分 - 总共有 300 多个动词和一百万个视频。 通过 GIPHY 教会计算机理解视频中的动作比让它们理解图像更难。IBM-MIT 联合实验室的研究员 Dan Gutfreund 表示:“视频更难,因为与物体识别相比,我们处理的问题在复杂性方面要高出一步。因为物体就是物体;热狗就是热狗。”与此同时,理解动词“opening”也很棘手,他说,因为狗张嘴或人开门看起来会有所不同。 该数据集并不是研究人员为帮助机器理解图像或视频而创建的第一个数据集。一个名为 ImageNet 的数据集在教计算机学习识别图片方面发挥了重要作用,其他视频数据集也已经存在:一个叫做 Kinetics,另一个专注于体育运动,还有一个来自中佛罗里达大学,包含“篮球扣篮”等动作。 但古特弗伦德表示,他们的新数据集的优势之一是它专注于他所谓的“原子动作”。这些动作包括从“攻击”到“打哈欠”等基本动作。古特弗伦德表示,将事物分解为原子动作比专注于更复杂的动作(如展示某人换轮胎或系领带)更有利于机器学习。 最后,他说他希望这个数据集能够帮助计算机模型能够像人类一样轻松地理解简单的动作。 |
>>: Facebook Messenger Kids 可能不会毁了你的孩子
灰姑娘的故事 - 灰姑娘物语 - ■ 公共媒体电视动画系列■ 原创媒体童话故事■ 播出时间1996 ...
你今天感觉怎么样?麻省理工学院计算机科学与人工智能实验室 (CSAIL) 的研究人员在下个月即将举行...
众所周知,Microsoft Office 在许多行业中被广泛使用,但也许很少有行业比银行和金融业从...
此帖子已更新。它最初于 2020 年 4 月 10 日发布。在此处关注 PopSci 的所有COVI...
当它们的同类不攻击船只和海豚或监视它们成年的大儿子时,一些虎鲸群也会攻击可怕的大白鲨。众所周知,这些...
马娘 Pretty Derby ROAD TO THE TOP [剧场版] 综合评论与推荐概述《马娘...
ChatGPT 和 Google Bard 等人工智能聊天机器人现在已经达到了可以撰写电子邮件、论文...
《凯罗凯罗凯罗比的三剑客》全面点评与推荐概述《克洛克洛克洛比的三剑客》是一部动画电影,于1991年7...
可重复使用的产品,尤其是厨房用品,通常被吹捧为减少使用物品的一种方式,因为这些物品只使用过一两次就会...
《Kirarin☆Revolution》的魅力与全貌《Kirarin☆Revolution》是一部人...
乘坐小型水上飞机从温哥华飞往不列颠哥伦比亚省维多利亚大约需要 30 分钟。这段短暂的旅程大部分时间都...
库辛岛听起来就像是旅游局白手起家建造的。岛上有 84 英亩的土地,栖息着几十种生物,从蓝鸽到亚达伯拉...
《魔王与勇者》:改变战乱时代的勇者与魔王的故事《魔王勇者》是根据东乃麻衣的轻小说改编的电视动画,于2...
《世界上最伟大的初恋》:一部以出版业为背景的现实爱情故事《世界一初恋》是 2011 年播出的电视动画...
2023 年消费电子展 (CES) 上展示的许多产品都凸显了流媒体电视节目和电影的持续流行。预计到 ...