无论如何,谁愿意看到你的孩子玩 iPad 的整整两分钟?计算机科学博士生赵斌声称他甚至从未看过自己的录像。“我的手机上有很多视频,但现实情况是,我几乎从未回头看过这些视频,”他告诉《大众科学》 。“主要原因是视频本身可能长达五到十分钟。” 赵和他的导师、卡内基梅隆大学的 Eric P. Xing 想出了一个有趣的解决方案。他们创建了一种算法,可以识别视频中无聊的部分并将其剪辑掉。最终产品就像是一个小小的精彩片段。用户甚至可以指定他们想要的片段长度——比如 30 秒。更容易理解。“我们的动机是人们不想看原始视频,”赵说。 赵和星并不是第一批尝试自动识别视频中有趣或重要部分的计算机科学家。许多研究人员和公司正在努力开发软件,以便在监控视频中发现正在发生的异常活动。至少有一家公司表示,它出售一种可以做到这一点的系统,但研究仍在进行中。一个重要场景识别程序也可能是社交媒体公司的福音:想象一下,能够制作精简、简洁的视频与你的互联网朋友分享。 “我们的动机是人们不想看原始视频。”新算法的工作原理是创建一个“字典”来解释它在处理视频时看到的内容。然后,它会时不时地问自己:“我能用我的字典解释现在发生的事情吗?”如果答案是否定的,这表明视频中正在发生一些新的、令人兴奋的事情,所以算法会记录下来。算法不需要看完整个视频就可以开始整理精彩片段。这与赵和星使用的编码技术一起,有助于算法更快地运行。 赵立坚表示,他的新算法速度异常快,在选择摘录场景方面与人类相似。它可以在一到两个小时内处理一段一小时的视频,而科学文献中发表的类似算法则需要 10 到 20 个小时。为了测试算法是否像人一样选择“有趣”的场景,赵立坚和杏要求三个人观看视频,并从视频中选择要突出显示的片段。然后,计算机科学家检查了人类和算法的选择有多接近。在 20 个个人视频中,有 18 个视频的赵立坚和杏的算法做出了比他们测试的其他三个竞争算法更像人类的选择。两人还检查了五个安全类型的视频,例如人们进入地铁站等场景。他们发现他们的算法和另一个算法的表现优于其他算法。赵立坚本周将在电气和电子工程师协会主办的一次会议上展示他们的研究结果。 赵先生现在计划创办一家名为 PanOptus 的初创公司,将他的软件商业化。PanOptus 的 iPhone 应用程序和 API 正在开发中。 看一下 Xing 儿子的视频中算法的具体工作原理: |
<<: 哈雷戴维森推出了一款真正的 LiveWire,也被称为其首款电动摩托车
Juusou Kikou Dancouga Nova 的全面评论和推荐■ 公共媒体电视动画系列■ 原...
1736 年,瑞士数学家莱昂哈德·欧拉 (Leonhard Euler) 绘制了一张图表,结束了普鲁...
如果你的猫是一只饥饿的小家伙,你把什么放在它面前,它就会吃什么,那么你就知道控制分量的重要性了。当然...
人与炸弹之间的最佳距离是“尽可能远”。拆弹小组并不总是能做出这样的选择,因为他们的工作本身就让他们置...
本周四,夏季第一轮满月将出现在天空。继续阅读,了解为什么有人称这轮满月为超级月亮、它的名字从何而来以...
神风怪盗贞德的全面评论与推荐概述《神风怪盗贞德》是一部改编自种村有奈原作的电视动画,于 1999 年...
过去两周,来自 17 个国家的 2,000 名士兵参加了在俄罗斯阿拉比诺军事基地举行的首届国际军事比...
有人说世界将灭亡于火海,有人说世界将灭亡于冰海。1939 年的科学家们想将“月球爆炸”和“巨型流星”...
这是关于机器人主要神话以及科幻小说在创造和传播这些神话中所扮演的角色的系列文章的第三篇。先前的主题:...
学习编程正日益成为 21 世纪教育的重要组成部分。在网络世界中,了解编程基础知识几乎与掌握 ABC ...
Pikachin Kit - 梦想与创意的世界■ 公共媒体电视动画系列■ 原创媒体动漫原创■ 播出时...
日本设计工作室 Takram 接到一项任务,为濒临灭绝的人类设计一个水瓶,但他们却做了另一件事:设计...
本周,全球领先的无人机制造商大疆宣布了一项新政策,取消了在禁飞区内执行“禁飞区”地理围栏的措施。这一...
蚂蚁社会的复杂性是自然界最迷人的现象之一:这些微小的生物是如何形成如此复杂的社交网络的?这些网络非常...
人类大脑的思考、理解和学习生物中心与数据中心有着惊人的相似之处,数据中心里有成排的先进处理单元。但与...