去年,随着疫情封锁限制措施在美国实施,新的鸟类爱好者纷纷涌向免费的 Merlin Bird ID 应用程序。这款由康奈尔鸟类学实验室开发的应用程序之前曾允许用户通过描述或照片来识别附近的神秘鸟类。今年夏初,它又增加了一项更酷的功能:能够根据鸟鸣、鸣叫或叫声的短音频片段来识别鸟类。 从 2020 年 3 月开始,Merlin 团队发现应用程序下载量有所上升,这一趋势一直持续。“我们不仅获得了更多的下载量,而且活跃用户的数量也在持续增长,”Merlin 的项目协调员德鲁·韦伯 (Drew Weber) 说。今年春天,有 120 万人(并且还在增加)使用 Merlin。“人们正在下载它,了解鸟类,尽管封锁等现实正在发生变化,但今年他们仍然对鸟类感兴趣,”他说。“它似乎激起了他们的兴趣,并保持了他们的兴趣。” 此时,鸟类新闻正在飞速传播,尤其是在纽约市,一些珍稀鸟类已经上升到名人地位。 《纽约时报》上刊登了横斑林鸮和雪鸮的报道,2018 年《纽约杂志》对鸳鸯进行了报道,仿佛它是下一个值得了解的鸟类影响者。 声音识别功能于 6 月在 Merlin 上首次亮相,并已收到观鸟界的积极响应。新的声音识别功能现在与基于机器学习的照片识别工具一起推出,该工具于 2015 年左右向用户推出。 “在声音识别发布之前,我认为我们收到的最大反馈是‘我以为你可以用这个应用程序通过声音识别鸟类!’或者‘鸟类的 Shazam 在哪里?’因此,真正将它提供给人们真的很酷,”韦伯说。 还有其他一些通过声音识别鸟类的方法,包括 Bird Genie、Song Sleuth 和 Smart Bird ID。许多方法都使用基于机器学习的算法,但由于背景噪音和鸟叫声的个体差异,结果的准确性可能会有所不同。 Merlin 已经是一款成熟的鸟类指南应用。除了更先进的工具外,它还提供了常规目测识别的演练流程,这对鸟类初学者来说很有用。 Merlin 声音 ID 的工作原理如下通过 Merlin,观鸟者可以打开手机的麦克风,让它聆听周围的环境。然后,该应用程序会提示鸟儿在唱歌或叫什么。该应用程序拾取的音频也会转换成视觉模式表示,即频谱图,它可以捕捉声音的振幅、频率和持续时间。 “一旦你有了树上真实鸟的图像或频谱图形式的音频特征,你就可以使用强大的计算机视觉工具开始构建模型来识别这些模式,”Merlin 项目首席研究员 Grant Van Horn 说。 除了声音识别外,使用该应用程序识别鸟类的其他方法还包括手动输入其身体特征和上传照片。 公民科学的巨大壮举人工智能系统需要数据,当然,数据首先需要存在。 在这种情况下,该项目需要一些严肃的公民科学。如果没有鸟类学实验室的麦考利图书馆数据库,照片 ID 功能和较新的声音 ID 选项就不可能实现,该数据库包含近 3000 万张存档和带注释的鸟类照片以及鸟类社区上传的 110 多万个声音片段。 随后,一个团队开始将媒体转化为有用的工具。他们于 2012 年开始构建 Merlin 照片 ID 组件,当时计算机视觉技术正在取得进步。“我们知道,如果我们能够收集数据,我们就可以利用这些工具构建一个非常有用的功能,让某人拍摄一张照片,然后让计算机告诉他们照片里有什么,”范霍恩说。到 2015 年,该实验室能够让公民科学家将照片和音频上传到不断增长的收藏中。自从照片 ID 组件在应用程序上推出以来,它不断得到改进,增加了更多照片样本,并扩大了南美、非洲、亚洲和欧洲新地区的物种覆盖范围。“只有当你拥有这个可以在其上构建的良好数据基础时,机器学习才能很好地发挥作用,”范霍恩解释说。 麦考利图书馆收集的音频和照片来源于实验室运行的另一个项目,即 2002 年启动的 eBird。eBird 应用程序允许世界各地的公民科学家和当地组织记录和分享鸟类观测情况,包括与研究和绘制鸟类种群的科学家分享。 “由于我们花了很长时间来收集这些数据,所以我们非常清楚,如果你在 7 月 19 日来到纽约,你可能会遇到哪些物种,”范霍恩说。“这类信息确实有助于我们进行声音识别和照片识别,因为它让我们能够立即解决 450 个物种的问题,即声音识别,8,000 个物种的问题,照片识别,并帮助我们将范围缩小到 40 个真正需要考虑的物种。” 音频识别组件的进展比图像识别要慢,“因为外出记录鸟叫声并不像外出拍照那么流行,”范霍恩说。“但可以肯定的是,在过去三年左右的时间里,北美已经相当密集地覆盖了音频记录。” 去年这个时候,该团队认为他们拥有足够的音频数据,可以开发和推出针对美国和加拿大流行物种的声音识别功能。他们开始梳理所有数据并挑选物种。 然而,背景噪音问题仍然是工程团队面临的挑战。为了解决这个问题,他们转向了现有的音频数据。这些音频数据集可能是交通场景、城市环境和机器噪音——不是鸟类发出的正常声音。“我们会将这些音频转换成声谱图,并将其用作‘这不是鸟;任何时候你看到这个,你都不应该报告鸟类’的反面例子,”范霍恩补充道。“这是一种平衡,既要建立高质量的鸟类数据集,又要加强非鸟类噪音的良好数据集,我们可以向机器展示并教它什么鸟听起来不像。” [相关:如何在美国任何城市开始观鸟] 接下来是更多的工作。由于项目的成功取决于数据集的高质量,这意味着韦伯和范霍恩必须组织和招募鸟类观察界的资深专家来帮助他们查看数据库中的原始音频文件并标记录音中的物种。 “在构建我们首次发布的数据集时,我想我们花了大约 2,000 个小时进行注释,绘制鸟儿鸣叫的位置以及各种鸟儿鸣叫的位置,”韦伯说。“这主要是由许多输入这些 eBird 数据和观察结果的人自愿完成的。” 2014 年,该应用程序首次推出时,只记录了美国和加拿大最常见的鸟类。2016 年,首批国际标签发布,首先是墨西哥和哥斯达黎加,然后扩展到欧洲、澳大利亚、新西兰、非洲和亚洲部分地区。“我们仍然看到,大约 75% 的新活跃用户来自美国和加拿大,”韦伯说,但世界各地记录的新物种数量正在不断增加。 随着全球用户继续向 eBird 数据库提交目击事件,新的目击事件被纳入 Merlin 应用程序,研究团队也因此了解了哪些物种何时何地出现。“我们不断更新应用程序中每种物种的照片和声音,以便不断改进 Merlin 展示的内容,”Weber 补充道。 [相关:看看鸟儿如何改变它们的曲调以适应周围环境] 韦伯指出,他们收到的一些最令人惊讶的反馈来自听力障碍的用户。“他们对实时视图和能够直观呈现鸟鸣声的频谱图感到非常兴奋,”他说。“无论是听力一直不佳的人,还是随着年龄增长而失去高音的人,很多人都对能够在某种程度上恢复部分听力损失感到非常兴奋。” 该团队仍在努力完善该应用程序并整合用户的反馈。通过与当地社区和组织合作,范霍恩认为他们可以构建各种有用的工具,帮助人们在户外获得更有趣的体验,尤其是与当地鸟类相处。“这是人类和机器成功的故事,”范霍恩说。“人类在这个拼图中扮演着重要的角色。” |
<<: 担心沉迷 Netflix 会毁了地球?现在你可以冷静一下了。
蜡笔小新:幽灵忍者 小风传 - 电影评论和详情影片概述《蜡笔小新:幽灵忍者小风传》是改编自臼井仪人的...
《矶部物语 第二季》的魅力与评价《Isobē Isobe Monogatari Season 2》是...
1964 年,格兰威特的 50 年单一麦芽苏格兰威士忌刚刚蒸馏出来,这种新酒的颜色非常清澈,尝起来...
电影《Go Go!面包超人:小金人和蓝色的眼泪》的魅力与评价“大胆试试吧!” 《面包超人:小金人和蓝...
单击即可启动图库。 ...
《小象游行》——《大家的歌》的历史作品《小象的游行》是1976年2月在NHK教育电视台(现NHK电子...
海底战争:两万里之爱概述《海底两万里》是改编自儒勒·凡尔纳的经典小说《海底两万里》的电视动画。该剧于...
Apple Music(macOS 应用程序,而非流媒体服务)是一款功能丰富的流行音乐收藏管理工具。...
近一百年来,新英格兰的灰海豹一直被悬赏缉拿。缅因州和马萨诸塞州付钱让人猎杀它们,因为它们耗尽了渔业资...
《小船夫》:NHK的永恒宝藏《小船夫》于1969年10月在NHK教育电视台(现为NHK E-Tel...
除了锻炼和均衡饮食外,良好的睡眠对强健的心脏也至关重要。周三,美国心脏协会 (AHA) 更新了其心血...
即使是经验丰富的宇航员也承认,他永远不想在太空中听到这些声音。8 月 31 日,波音星际客机的(并非...
好奇号火星探测器仍在忙着检查自己,在另一边拍了一张可爱的自拍照后,正在拍摄它的轮子和底盘。天sol。...
《基督山伯爵》:一个关于复仇和年轻人成长的伟大故事《基督山伯爵》是2004年至2005年在朝日电视台...
《忍者服部君+忍者帕曼怪兽吉普对奇迹之蛋》的魅力与评价1985年3月16日上映的《忍者服部君+帕尔...