全世界有 7,000 多种语言,其中近一半被认为濒临灭绝或灭绝。与此同时,只有相对较少的一部分语言得到了 Siri、Alexa 或 ChatGPT 等自然语言处理 (NLP) 人工智能程序的支持。非洲方言使用者尤其被忽视,他们长期以来与科技行业中其他边缘化群体一样面临系统性偏见。为了帮助解决影响数十亿人的不平等问题,非洲的一个研究小组正在努力制定一项行动计划,以更好地开发能够支持这些被忽视的语言的人工智能。 这些建议来自 Masakhane(在祖鲁语中大致翻译为“我们共同建设”)的成员,这是一个致力于推动非洲语言 NLP 研究的草根组织,旨在“为非洲人服务,由非洲人”开展研究。正如今天在《Patterns》杂志上发表的一篇新论文所详述的那样,该团队对讲非洲语言的语言学家、作家、编辑、软件工程师和商界领袖进行了调查,以确定在开发非洲 NLP 工具时需要考虑的五个主要主题。 [相关:人工智能抄袭检测器错误地标记了非英语母语人士。] 首先,该团队强调非洲是一个多语言社会(Masakhane 估计,世界上有超过 2,000 种语言起源于非洲大陆),这些语言对于文化认同和社会参与至关重要。例如,有超过 2 亿人讲斯瓦希里语,而有 4500 万人讲约鲁巴语。 其次,作者强调,开发对非洲内容创作的适当支持对于扩大访问权限至关重要,包括数字词典、拼写检查器和支持非洲语言的键盘等工具。 他们还提到,语言学家和计算机科学家之间的多学科合作是更好地设计工具的关键,并表示开发人员应该牢记数据收集、管理和使用所带来的道德义务。 “我认为针对非洲语言的人工智能工具有限,这很不合理。语言技术进步中的包容性和代表性不是你最后打的补丁,而是你事先考虑的事情,”该论文的第一作者、马萨卡纳基金会的人工智能研究员凯瑟琳·西米纽 (Kathleen Siminyu) 在周五的一份声明中表示。 [相关:研究表明,ChatGPT 的准确性变得更差了。] 该团队的其他建议包括提供额外的结构性支持,以开发内容审核工具,帮助遏制网络上基于非洲语言的错误信息的传播,以及为涉及非洲以外公司使用非洲语言数据的法律案件提供资金。 “我希望我们生活在这样一个世界,非洲人可以像英语、法语、普通话或其他语言流利的人一样拥有良好的生活质量,获得信息和机会,”Siminyu 继续说道。展望未来,该团队希望扩大他们的研究范围,让更多的参与者参与进来,并利用他们的研究成果帮助保护非洲土著语言。 《Patterns》科学编辑王婉英在本期的随刊社论中写道:“我们觉得这些挑战是可以而且必须面对的。”王婉英还希望更多的研究人员能够提交他们在非英语 NLP 领域的探索和进步。 王写道:“这不仅限于突破性的 NLP 技术进步和解决方案,也适用于使用这些或类似技术来突破语言和领域界限的研究论文。” |
>>: 在计算机上运行 Android 应用和游戏的 4 种方法
穿靴子的猫:冒险和友谊的故事■ 公共媒体剧院■ 原创媒体小说■ 发布日期1976 年 3 月 20 ...
有很多因素可以决定哪种玩具车最适合您的孩子。考虑您孩子的年龄、体型和技能水平。川崎这个故事最初出现在...
清爽的新生 - 大家的歌《写生少年》是1980年12月在NHK教育电视台(现NHK E-Tele)播...
《玻璃面具》:短篇动画的魅力及其背景《玻璃面具》是 2013 年播出的一部短篇动画系列,改编自三内铃...
Meta、TikTok 和 Google 等科技公司经常密切关注尽可能多的用户活动,这并不是什么秘密...
以下是动物王国中一些成员应对成年期转变的方式。顺便说一句,我们亲眼见证了青少年时代的诞生。1941 ...
2018 年并不是 iPhone 新品革命性的一年。然而,该系列中最便宜的 iPhone XR 却以...
1959 年 6 月 8 日,美国海军从巴贝罗号潜艇发射了一枚火箭,火箭上载有 3,000 封信件...
戴上锡箔帽,穿上特殊的反光明会内衣。最近在加利利海下发现了一个神秘的古代岩石结构,可能与巨石阵建于同...
在遗传学中,有时一加一等于零。基因本应协同工作,相互放大对方的效果,但有时却会相互抵消。《细胞出版社...
未来几十年,巨大的财富前景将成为太空探索的主要吸引力之一。一颗直径 650 英尺(大约平均)的小行星...
本周早些时候,一个名为“未来生命研究所”的组织发布了一封公开信,主题是为人工智能系统 (AI) 建立...
每年这个时候,人们都会买很多电视。2016 年,塔吉特在黑色星期五促销期间每分钟售出超过 3,200...
空间和时间的结构是皱巴巴的,扭曲的。引力会拉扯这种结构,造成凹陷和摆动——其中一些可以被人类观察到,...
Basis Band 是市场上最好的健身追踪器。它之所以是最好的,是因为它与你的生活息息相关,而不是...