近年来,语音命令取得了巨大进步,尤其是在移动领域——谷歌已经在 Android 中实现了语音搜索和一些基本命令,现在苹果已经将语音命令应用程序 Siri 深深融入到 iPhone 的核心中。 不仅能与电脑对话,还能与电脑对话,这一直是一个诱人且充满未来感的想法——尤其是它有让应用程序更全面地为残障人士所用的巨大潜力。但昨天,当我们在 PopSci 总部讨论语音控制时,我们注意到了一件有趣的事情:虽然我们这些年轻的科技人士都没有经常使用当今的语音控制技术,但我们的父母似乎确实在使用它,而且经常使用它。这是为什么呢? 熟悉对我们来说,改变我们与电子产品互动的方式很容易。从鼠标到多点触控板?没问题。从硬件键盘到软件键盘,再到 Swype 等新系统?就像买新衣服一样自然。我们天生就喜欢适应电子产品,喜欢看熟悉的东西,探索新的东西,学习如何做以前可以做的事情,同时融入现在可以做到的新事物。 那么,语音命令?这不是什么新鲜事。它已经过时了。与设备对话是人们使用固定电话时会做的事情,而对我们来说,这有点像倒退。为什么要忘记我们闪电般快速的智能手机打字技能,只为了能够对着手机口述?我们已经超越了那个时代。宾汉姆顿大学教授扎霍里安博士的大部分职业生涯都在研究语音识别,他告诉我,他的同事也是语音识别专家,他向高中生演示了麻省理工学院最新最棒的系统。“我打字速度快多了,为什么要那样做?”高中生们的反应是。 但是,没有了我们大脑对电子设备的依赖,我们的父母必须从头开始适应每一种新的输入法,这可能很困难。他们往往会把事情弄得比实际更复杂,即使电子设备已经变得更简单了。语音命令很让人安心;它已经存在了一段时间,不像多点触控键盘那样需要长时间、复杂的滑动操作。感觉很简单:只要告诉你的手机该做什么,该死的! 挑剔年轻人回避语音命令的主要原因是它的繁琐。语音命令确实在不断改进,但即使是最现代、最先进的系统也会出现可笑的错误——或者更糟的是,输入速度很慢,而且由于我们精通几种标准文本输入形式,我们倾向于选择语音输入,仅仅是为了追求速度。关键示例:微软的 Kinect 是我们见过的最不可思议的小玩意之一,它的语音命令非常先进,可以识别不同的声音,甚至可以识别声音的来源方向。但执行简单的任务仍然有点慢。假设您正在 Xbox 360 上观看 Hulu。您想暂停它。您有两个选择:拿起遥控器并按下暂停按钮,或者说“Xbox”,然后如果第一次没有听到你的声音,也许可以稍微大声一点、更有力一点地说“XBOX”,然后等待播放菜单弹出,然后说“暂停。暂停”。从理论上讲,它很酷,而且当它顺利运行时(通常如此)速度也相当快,但我发现自己更多时候还是需要伸手去拿遥控器。 Google Voice 也使用语音识别技术,在这种情况下,它可以转录语音邮件,这样你就可以直接阅读而不是收听。这是个好主意!但它的效果非常糟糕,喜剧演员 Paul F. Tompkins 曾对“极不准确”的转录发表了一整段广受好评的评论。甚至 Zahorian 博士也指出,“标准系统往往效果不佳”,他只在“难以打字的情况下”使用它们,比如在车里。 (还有一个不小的因素,就是对着手机说话看起来有点傻乎乎的,很尴尬。毕竟我们不是《星际迷航》里的人物。但这并不能减轻傻乎乎的感觉。) 所以我们忽略了语音命令。这并不是说语音命令不好,而是当我们对所有不同类型的输入都同样熟悉时,我们自然倾向于选择最有效的输入方式。但这也象征着一种弱点,即无论如何都倾向于选择最快的输入方式。而我们的父母没有这种弱点,所以他们会选择看起来最舒服的方式——也就是与你的设备对话。 但这一切都可能改变,这得感谢苹果对 Siri 的重视。自然语言的使用是我们不应该忽视的:能够真正告诉手机你想要它做什么,而不必学习一种手机能理解的新语言,这是一个很大的进步。事实上,苹果已经证明了它可能比其他方法更快。比如说,在布鲁克林公园坡找到一家古巴餐馆需要点击很多次——你必须在你的应用程序中滑动才能找到 Yelp 应用程序,选择你想要的菜系、你想要的位置,然后根据评分排序。Siri 让这一切变得简单;只要说“帮我在布鲁克林公园坡找一家古巴餐馆”,它就会带你到最后一步。这很棒,它绝对有潜力最终让触摸命令对那些更习惯打字的人更有吸引力。 然而Siri 真正让我们感到兴奋的地方在于它的简洁性。简洁性,或者更准确地说,简洁的外观,是 Siri 能够为苹果所用的原因。Siri 不会像谷歌或微软的语音命令选项那样将您的声音转录为文本。它既能理解您在说什么,也能理解您要做什么。对于那些非常讨厌摆弄设置、应用程序和软件键盘的人来说,Siri 和未来类似的语音命令选项简直是天赐之物。终于,有了一种方法可以告诉您的手机您想做什么。 这不仅对那些不愿意摆弄手机技术元素的人有好处,而且对那些由于环境或残疾而无法摆弄手机技术元素的人也有好处。汽车是这种输入工具最明显的用途,因为法律规定你不能(实际上也不应该)在开车时盯着手机屏幕。对于那些无法操作触摸屏或由于视力障碍需要 Siri 读出命令的人来说,这种系统也是无价之宝——多年来一直有这样的无障碍解决方案,但没有一个能如此深入地探究手机的操作系统。 因此,即使对于我们这一代人来说,在某些情况下,向手机提问可能比打开应用输入问题更有效率。除了一些例外情况(比如在车里),用语音代替打字对年轻一代来说并不可行。但如果它确实更容易或更快,我们就会接受它——和我们的父母一样。我们是否接受我们的父母则无关紧要。 |
对着智能家居设备大声喊出命令应该比拨动物理开关更容易——你甚至不必从沙发上站起来。但是,整个体验往往...
密码以纯文本格式存储。Pixabay当公司要求您提供个人信息时,人们有理由期望其收集的私人信息将被安...
Chibinax 2.0 - 可爱小家伙的新冒险概述《ChibiNacks 2.0》是2007年4月...
先驱!!克罗马蒂高中——不同寻常的校园生活的魅力和深刻的世界观《先驱!!克罗马蒂高校》于2003年至...
随着夏季逐渐消退,美国部分地区蚊媒疾病病例逐渐增多。在其他地区,尽管疫苗不断推出,但疟疾威胁仍然是一...
Flip Flappers - 迷人的另一个世界和女孩们的冒险概述《Flip Flappers》是一...
《奥特曼》——动画奥特曼的全新挑战■ 公共媒体电视动画系列■ 原创媒体特殊效果■ 播出时间1979 ...
前一分钟,我还站在华盛顿特区市中心办公楼八楼的会议室里。片刻之后,我戴上遮住耳朵和眼睛的头套,来到了...
这个故事最初刊登在 Saveur 上。在阿拉斯加州库斯科奎姆山脉的阴影下,在一条蜿蜒的河流沿岸的山谷...
海鸥是相当勇敢的食腐动物。它们毫不犹豫地在我们的垃圾堆和垃圾填埋场中寻找食物残渣。但 12 月 27...
今天是珍珠港事件 71 周年纪念日,此次袭击事件将美国卷入了第二次世界大战。这次袭击是毁灭性的。超过...
1911 年,著名的挪威探险家罗尔德·阿蒙森 (Roald Amundsen) 的徒步队成为第一批到...
美国宇航局打算让旅行者号计划至少再继续几年,继续进行这项具有历史意义的探索。但经过近半个世纪和数十亿...
近年来,直接面向消费者的助听器市场发展迅速。针对轻度至中度听力损失人群的助听器尤其如此。典型的助听器...
杰弗里·蒙特斯站在泥地竞技场中央的梯子上,眯着眼睛看着这个看起来像是世界上最大的花瓶的圆形花瓶。对于...