语言很难;需要训练有素的耳朵才能分辨出语言中的措辞、惯用语、语气、地域趋势和不断变化的侮辱性语言,这些才能让人真正流利地使用语言。这就是为什么即使是最好的应用程序和谷歌翻译也无法破解它的原因之一。同样,需要训练有素的语言学家才能知道这些单词是如何从一个词根发展而来的,它们仍然会发展成无数种形式,所有形式都表示着同一件事。狡猾的计算机能像聪明的语言学家一样解决这个问题吗?在这种情况下,答案可能是肯定的。 一种新的机器学习算法可以利用声音规则找出不断变化的语言中最有可能的语音变化。所有单词都会随着时间和地点的变化而变化,但某些元音和发音的变化会比其他元音和发音更大——你说的是tomato,我说的是tomahtoe,加拿大人说的是“aboot”,等等。温哥华不列颠哥伦比亚大学的亚历山大·布沙尔-科特和同事开发了一种系统,可以提示单词在过去的发音方式,以及哪些声音最有可能发生变化。然后,他们将结果与人类专家的分析进行了比较,发现85%的计算机建议都在正确单词的一个字符之内。 他们研究了 637 种不同的南岛语,这些语言横跨从菲律宾到夏威夷的太平洋。例如,他们从“星星”这个词开始。在斐济语中,这个词是kalokalo 。在台湾原住民语言 Pazeh 中,它是mintol 。说婆罗洲语马兰瑙的人称之为biten ,说菲律宾方言伊纳巴克农的人称之为bitu'on 。所有这些语言的词根都是bituquen 。计算机正确地推断出了这一点。 问题在于,在计算机进行分析之前,需要完成大量的前端工作。语言学家必须输入给定语言中的单词列表及其含义,并生成一种语言的“生命之树”——一种显示每个单词与其他单词之间关系的系统发育图。(它在形式和功能上都类似于植物学家和生物学家用来显示生命如何关联的系统发育图。)但当它开始工作时,该算法是高效的。它可以识别语言中的同源词,即具有相同词根的词,然后找出可能的词根。 研究人员承认,还有更多高级工作要做,但他们希望这将给历史语言学家带来福音,就像遗传信息改变生物学一样。形态变化——观察一个事物并观察它如何变化或与其他事物进行比较——比观察基因要简单得多。该算法可以以类似的方式工作,通过计算研究单词和语言的词根,而不是使用经过特殊训练的耳朵。这篇论文本周发表在《美国国家科学院院刊》上。 |
苹果的 iOS 9 终于出现在你身边的 iPhone 上。新版软件适用于新款 iPhone 6S 和...
丽塔和其他东西——儿童动画的魅力和深刻寓意《丽塔和某某》于2010年11月1日至12月24日在NHK...
《Idaten Jump》全方位测评与推荐■ 公共媒体电视动画系列■ 原创媒体漫画■ 播出时间20...
对于 NASA 具有历史意义的阿波罗任务,事后看来并不十分准确。例如,阿波罗 12 号着陆器于 19...
虽然我们钦佩苹果致力于提供创新技术,但这是有代价的——从字面上讲。从象征意义上讲,他们的一些先进设备...
大约三分之一的美国成年人定期通过 YouTube 获取新闻。自 2020 年总统大选以来,该平台放松...
SF 西游记 Starzinger - 太空冒险和友谊的故事■ 公共媒体电视动画系列■ 原创媒体动漫...
昨天,澳大利亚最大的城市悉尼打破了 1950 年创下的 86.4 英寸(2,194 毫米)的年降雨量...
如今,我们身边到处都是窃听者——我指的不是窃听电话的美国国家安全局。我们的电子设备和小玩意儿越来越试...
沃夫熊 - 沃夫熊概述《沃夫熊》是根据神泽俊子和井上洋介的图画书改编的电视动画。该剧于2000年4月...
特工克里斯·特洛伊 (Chris Trojan) 将车停在皇后区欧松公园一家便利店的停车场,发现有六...
无论是美国企业号航空母舰的舰载计算机、蝙蝠计算机,还是 HAL,未来总是向我们承诺更聪明、更有帮助(...
与河童空一起度过暑假 - 一段情感之旅和家庭纽带■ 公共媒体剧院■ 原创媒体小说■ 发布日期2007...
《机动战士高达SEED特别版最终章:轰隆隆的天空》的魅力与评价《机动战士高达SEED 特别版最终章...
灶神星距离地球超过一百万英里,位于火星和木星之间的小行星带中,寒冷而黑暗。根据您使用的命名方案,...