Meta 刚刚发布了一款可帮助计算机“看到”图像中物体的工具

Meta 刚刚发布了一款可帮助计算机“看到”图像中物体的工具

在本周的一篇博客文章中,Meta AI 宣布发布一款新的 AI 工具,该工具可以识别图像中的哪些像素属于哪个对象。Segment Anything 模型 (SAM) 执行一项称为“分割”的任务,这是计算机视觉的基础,即计算机和机器人用来“查看”和理解周围世界的过程。除了新的 AI 模型外,Meta 还向外部研究人员开放了其训练数据集。

史蒂芬·平克 (Steven Pinker) 在 1994 年出版的《语言本能》一书中写道:“35 年的人工智能研究的主要教训是,难题很容易解决,容易的问题很难解决。”这个被称为莫拉维克悖论的悖论在 30 多年后仍然成立。像 GPT-4 这样的大型语言模型能够在几秒钟内生成读起来像人类写的文本,而机器人很难捡起形状奇特的积木——这项任务看似很简单,孩子们在一岁之前就为了好玩而做。

分割属于这种看似简单但技术上很难的类别。你可以看看你的桌子,立刻分辨出什么是电脑,什么是智能手机,什么是一堆纸,什么是揉成一团的纸巾。但对于处理 2D 图像的计算机来说(因为即使视频也只是一系列 2D 图像),一切都只是一堆具有不同值的像素。桌面在哪里结束,纸巾在哪里开始?

Meta 的新 SAM AI 试图以通用方式解决此问题,而不是使用专门设计用于识别某样事物(如面部或枪支)的模型。研究人员表示,“SAM 已经学会了什么是物体的一般概念,它可以为任何图像或视频中的任何物体生成蒙版,甚至包括训练期间未遇到的物体和图像类型。”换句话说,它不仅可以识别已学会识别的物体,还可以猜测不同的物体是什么。SAM 不需要展示数百张不同的揉皱纸巾来区分一张纸巾和你的办公桌,它对事物的一般感知就足够了。

[相关:Facebook 作为 Meta 的首批举措之一:教机器人触摸和感受]

您现在就可以在浏览器中使用自己的图像尝试 SAM。SAM 可以为您选中的任何对象生成蒙版,方法是用鼠标光标单击该对象或在它周围画一个框。它还可以为图像中检测到的每个对象创建蒙版。据研究人员称,SAM 还可以接受文本提示,例如:选择“猫”,但该功能尚未向公众发布。它在分割我们在PopSci上测试的图像方面做得相当不错。

Segment Anything 工具工作原理的可视化。Meta AI

虽然在网上很容易找到大量图像和视频,但高质量的分割数据却小众得多。为了让 SAM 达到这一点,Meta 必须开发一个新的训练数据库:Segment Anything 1-Billion 掩码数据集 (SA-1B)。它包含大约 1100 万张授权图像和超过 11 亿个分割掩码,“质量高、多样性强,在某些情况下甚至可与之前小得多、完全手动注释的数据集中的掩码相媲美”。为了“使分割民主化”,Meta 正在将其发布给其他研究人员。

新 AI 工具的一些行业应用。Meta AI

Meta 对其分割程序有着宏伟的计划。可靠的通用计算机视觉仍然是人工智能和机器人技术中尚未解决的问题——但它具有很大的潜力。Meta 表示,SAM 有朝一日可以识别通过增强现实 (AR) 眼镜看到的日常物品。该公司的另一个名为 Ego4D 的项目也计划通过不同的视角解决类似的问题。这两个项目有朝一日都可能成为一种工具,让用户可以按照说明和分步食谱进行操作,或者在狗碗上为伴侣留下虚拟便条。

更合理的解释是,SAM 在工业和研究领域也有很多潜在用途。Meta 建议用它来帮助农民统计奶牛数量,或者帮助生物学家在显微镜下追踪细胞——可能性无穷无尽。

<<:  “TikTok禁令”是TikTok之外的法律噩梦

>>:  量子计算机目前还不能传送物体

推荐阅读

罕见的亚特兰蒂斯号航天飞机内部最后视图

五个月前,亚特兰蒂斯号航天飞机刚刚完成 NASA 30 年航天飞机计划的最后一次飞行任务,现在正准备...

陆上防卫队魔酱——魅力人物与故事深度的全面评价

陆防军 Mao-chan - 评论与推荐概述《陆上防卫队魔酱》是根据赤松健原作漫画改编的电视动画,于...

《VitaminX Addiction Act.1》评论:极具吸引力的故事和迷人的人物

VitaminX Addiction Act.1 - VitaminX Addiction Act ...

明尼苏达州 3 号输油管道威胁北美仅有的本土谷物之一

美国有大约 19 万英里的输油管道,将石油输送到全国各地。最近有争议的输油管道之一是 Enbridg...

《超级机器人大战OG The Inspector》的魅力与评价:探索机器人动画的新可能性

超级机器人大战 OG 督察 - 深度评测和综合指南介绍《超级机器人大战OG 监察官》是一部改编自SR...

美国宇航局新卫星或将帮助预防类似卡特里娜飓风的灾难

近 10 年前,卡特里娜飓风摧毁了墨西哥湾沿岸。在经过墨西哥湾温暖的水域时,这场风暴意外地从 3 级...

《Happy Fuku》:一篇深入探讨大家歌曲的感动和治愈力量的评论

“幸福福”~大家之歌的魅力与背景《幸福福》是一部时长2分钟的短篇动画片,于2007年12月在NHK教...

蝶恋花~少年信长~评论:享受这部战国时代的青春剧

蝴蝶 - 少年信长 - 回顾和细节■ 公共媒体电视动画系列■ 原创媒体动漫原创■ 播出时间2019年...

爸爸的球衣号码:大家的歌声中的情感与评价

爸爸的球衣号码——Tousanosebango概述《爸爸的制服号码》是1996年4月在NHK教育电视...

消失已久的尼罗河分支或许可以解释内陆金字塔

尼罗河一段早已消失的河道或许能解开古埃及一些最著名金字塔背后的谜团。研究人员称,包括吉萨金字塔在内的...

从长远来看,乐于分享的幼儿园儿童可能会取得成功

几十年来,研究人员和家长们一直在思考,孩子的哪些特质能带来幸福、成功的生活,哪些特质会让孩子走上更黑...

空军正在投资数百万美元打造下一代协和式飞机

自从协和式飞机于 2003 年停止超音速飞行以来,人们就不可能预订超音速客机的机票了。总部位于科罗拉...

《Pankiss!2D》的魅力与评价:动漫迷必读的评论

“Pankiss!2D”——动画短片的新可能《Pankiss!2D》是2015年在BS11播出的24...

《BemBem Hunter 小天狗天丸》的魅力与评价:值得一看的动画

Bembem Hunter Kotengu Tenmaru - 回顾怀旧怪物动画1983 年播出的电...

中国将首个空间站舱发射入轨

当地时间晚上 9 点 16 分(即美国东部时间上午 9 点 16 分),中国成功利用长征二号 F 运...