Meta 刚刚发布了一款可帮助计算机“看到”图像中物体的工具

Meta 刚刚发布了一款可帮助计算机“看到”图像中物体的工具

在本周的一篇博客文章中,Meta AI 宣布发布一款新的 AI 工具,该工具可以识别图像中的哪些像素属于哪个对象。Segment Anything 模型 (SAM) 执行一项称为“分割”的任务,这是计算机视觉的基础,即计算机和机器人用来“查看”和理解周围世界的过程。除了新的 AI 模型外,Meta 还向外部研究人员开放了其训练数据集。

史蒂芬·平克 (Steven Pinker) 在 1994 年出版的《语言本能》一书中写道:“35 年的人工智能研究的主要教训是,难题很容易解决,容易的问题很难解决。”这个被称为莫拉维克悖论的悖论在 30 多年后仍然成立。像 GPT-4 这样的大型语言模型能够在几秒钟内生成读起来像人类写的文本,而机器人很难捡起形状奇特的积木——这项任务看似很简单,孩子们在一岁之前就为了好玩而做。

分割属于这种看似简单但技术上很难的类别。你可以看看你的桌子,立刻分辨出什么是电脑,什么是智能手机,什么是一堆纸,什么是揉成一团的纸巾。但对于处理 2D 图像的计算机来说(因为即使视频也只是一系列 2D 图像),一切都只是一堆具有不同值的像素。桌面在哪里结束,纸巾在哪里开始?

Meta 的新 SAM AI 试图以通用方式解决此问题,而不是使用专门设计用于识别某样事物(如面部或枪支)的模型。研究人员表示,“SAM 已经学会了什么是物体的一般概念,它可以为任何图像或视频中的任何物体生成蒙版,甚至包括训练期间未遇到的物体和图像类型。”换句话说,它不仅可以识别已学会识别的物体,还可以猜测不同的物体是什么。SAM 不需要展示数百张不同的揉皱纸巾来区分一张纸巾和你的办公桌,它对事物的一般感知就足够了。

[相关:Facebook 作为 Meta 的首批举措之一:教机器人触摸和感受]

您现在就可以在浏览器中使用自己的图像尝试 SAM。SAM 可以为您选中的任何对象生成蒙版,方法是用鼠标光标单击该对象或在它周围画一个框。它还可以为图像中检测到的每个对象创建蒙版。据研究人员称,SAM 还可以接受文本提示,例如:选择“猫”,但该功能尚未向公众发布。它在分割我们在PopSci上测试的图像方面做得相当不错。

Segment Anything 工具工作原理的可视化。Meta AI

虽然在网上很容易找到大量图像和视频,但高质量的分割数据却小众得多。为了让 SAM 达到这一点,Meta 必须开发一个新的训练数据库:Segment Anything 1-Billion 掩码数据集 (SA-1B)。它包含大约 1100 万张授权图像和超过 11 亿个分割掩码,“质量高、多样性强,在某些情况下甚至可与之前小得多、完全手动注释的数据集中的掩码相媲美”。为了“使分割民主化”,Meta 正在将其发布给其他研究人员。

新 AI 工具的一些行业应用。Meta AI

Meta 对其分割程序有着宏伟的计划。可靠的通用计算机视觉仍然是人工智能和机器人技术中尚未解决的问题——但它具有很大的潜力。Meta 表示,SAM 有朝一日可以识别通过增强现实 (AR) 眼镜看到的日常物品。该公司的另一个名为 Ego4D 的项目也计划通过不同的视角解决类似的问题。这两个项目有朝一日都可能成为一种工具,让用户可以按照说明和分步食谱进行操作,或者在狗碗上为伴侣留下虚拟便条。

更合理的解释是,SAM 在工业和研究领域也有很多潜在用途。Meta 建议用它来帮助农民统计奶牛数量,或者帮助生物学家在显微镜下追踪细胞——可能性无穷无尽。

<<:  “TikTok禁令”是TikTok之外的法律噩梦

>>:  量子计算机目前还不能传送物体

推荐阅读

来自网络角落里呐喊的博客对电影《Netoranmono #1》的评价和感想

《网络乱世者 THE MOVIE #1:在网络角落呐喊的博客》:描绘网络文化象征意义的动画杰作200...

Den-den 的 Cyber​​ Train:深入了解引人入胜的故事和角色

Denden 的电动火车 - Denden no Dennou Densha - 全方位评论和推荐概...

《厨师的波尔卡舞》:彻底解析大家的歌的经典歌曲!

《公鸡波尔卡》:NHK 经典动画重现1964年8月在NHK教育电视台(现为NHK E-Tele)播...

大声、快速地沟通可能会让你成为更有效的 Zoom 沟通者

一家在线辅导公司最近与语言研究人员合作,收集了世界上最大的双人虚拟对话公开数据集。BetterUp ...

下一部《星球大战》电影预告片来了,太空暴力场面丰富

几个小时前,在这个星系中,一部新的《星球大战》预告片出现在了渴望太空的大众面前。仍然陶醉于《星球大战...

回顾《魔法天使奶油真美长别离》的感人告别

魔法天使奶油妈妈漫长的告别——动人的结局和永恒的告别1985年6月5日以OVA形式发售的《魔法天使奶...

我们正在毁掉瓦尔登湖,就像我们毁掉世界上一切美好的事物一样

开车去瓦尔登湖的路比你想象的更有郊区的感觉。它仍然很古雅,特别是当你漫步穿过康科德市中心时,那里的商...

《橡果屋》评论:动人的故事和迷人的人物

Acorn House - Donguri Noie 的魅力与声誉1997年8月30日上映的电影《橡...

数码宝贝大冒险:重新评价怀旧经典

数码宝贝大冒险:新的冒险的开始2020年开始播出的《数码宝贝大冒险》是一部以数码世界和现实世界为背景...

《绘颜之花》:重新评价动人的民歌

《笑颜之花》——为大家献上一分钟动人歌曲《绘颜之花》是2010年6月在NHK教育电视台(现NHK E...

银河铁道:全面回顾太空之旅和动人故事

银河铁道物语的魅力与评价《银河铁道物语》是根据松本零士原作改编的原创动画,于2003年10月5日至2...

重大研究发现电子游戏不会损害或促进你的心理健康

牛津大学周三在《皇家学会开放科学》杂志上发表的一项研究发现,玩电子游戏的时间不太可能对健康产生重大影...

《我现在很幸福》:从大家的歌曲中学到幸福的真谛

《现在幸福大家的歌》全方位评价与推荐概述《现在很幸福,大家的歌》是一部两分钟的短篇动画作品,于 19...

这款车将取代悍马

除了坦克,美国陆军最具标志性的车辆莫过于高机动性多用途轮式车辆 (HMMVV),也就是人们所熟知的悍...

在哪里观看 Facebook F8 主题演讲直播

Facebook 已召集其软件开发人员和媒体来到加利福尼亚州旧金山参加 2016 年 F8 大会,该...