本周,Meta 推出了一种名为 Sphere 的新型人工智能模型,旨在自动验证维基百科的引文。Sphere 的知识库来自 1.34 亿个网页。 Meta 表示,它并未与维基媒体(wikipedia.com 的所有者,该非营利组织)合作开展这个项目,该项目仍处于研究阶段,并未用于推送维基百科的实时更新。不过,维基媒体最近宣布,它正在其内容翻译工具中使用 Meta 的技术。 Meta 在一篇博客文章中表示,Sphere 是一个执行知识密集型自然语言处理的人工智能模型,当你问手机上的虚拟助手“谁获得了第一届诺贝尔物理学奖?”时,它所做的任务与此相同。然后,这些模型将挖掘存储库以找到匹配的答案。 Sphere 使用的是来自“非结构化”开放网络而非搜索引擎的信息。“由于 Sphere 可以访问比当今标准模型多得多的公共信息,因此它可以提供它们无法提供的有用信息,”Meta 研究人员在一篇博客文章中写道。此外,Meta 的系统使用自然语言理解来“估计从来源推断出某个主张的可能性”。该技术将句子或短语分解为数学表示,然后将表示集相互比较。 [相关: Meta 希望通过研究人类大脑来改进其人工智能] 描述 Sphere 的预印本可以在 arXiv 上找到,软件本身在 GitHub 上开源。Meta 还创建了一个名为 KILT 的基准测试,它将用它来评估 Sphere 和其他类似模型在事实核查、问答对话和插入相关链接等广泛任务上的表现。 到目前为止,这种能力只用于扫描和检查维基百科引文。“它提醒人们注意可疑的引文,让人类编辑能够评估最有可能存在缺陷的案例,而不必筛选数千条正确引用的陈述,”Meta 解释道。“如果引文似乎不相关,我们的模型将建议更适用的来源,甚至指向支持该主张的具体段落。” [相关:‘采用错别字’和其他编辑维基百科的方式] 最终,学习理解维基百科条目中的文本段落与其引用的链接之间的关系也将提高模型解析现实世界知识的能力,因为引文编辑需要牢牢掌握人类语言的理解和推理能力。 “这些模型是潜在编辑器的首批组成部分,可以帮助实时验证文档。除了提供引文之外,系统还会根据网络上的相关文档提供自动完成文本建议,并提供校对更正,”Meta 说道。“理想情况下,这些模型可以理解多种语言,并能够处理多种类型的媒体,包括视频、图像和数据表。” |
<<: 2022 年亚马逊 Prime 会员日最佳无人机优惠
今年夏天错过了出国旅行的机会?您可能无法乘坐飞机飞越半个地球,但您可以做其他同样有益的事情:学习一门...
平日里,美国大部分空气污染来自汽车和发电厂。然而,一旦发生野火,就会对附近的空气质量产生巨大影响——...
上周,80 岁的 Yuichiro Miura 成为登顶珠穆朗玛峰的最年长者。这令人惊叹,但其他人就...
8 月 10 日,国防承包商 Sierra Nevada 宣布将向英国提供高空气球,英国国防部将试验...
睡眠时间达不到建议的 7 小时?后果可能是毁灭性的。睡眠不足会破坏新陈代谢,并在未来几年改变基因行为...
周五的地震和海啸过后,日本的几座核电站,尤其是位于日本东北部的福岛内石核电站,出现了严重问题。如果你...
今年早些时候,一个专门针对狗狗观众的电视台在以色列开播,此前它在美国成功开播。但狗狗真的能看到电视上...
《漫画猿飞佐助》:这部历史动作动画的魅力及其背景1. 工作概述漫画《猿飞佐助》是一部动画系列,于 1...
如果阿尔弗雷德·希区柯克今天还在拍恐怖电影,他可能会考虑重拍他 1963 年的电影《群鸟》 ,故事背...
索尼在 PlayStation 5 上添加了新的硬件功能,这些功能增强了游戏的吸引力,并超越了传统的...
这是一个时代的标志,新的消费级、商用遥控无人机会不请自来地出现在我们的办公室,制造商会邀请我们试一试...
碳纤维是材料中的超人。它的强度是钢的五倍,重量却只是钢的一小部分,从网球拍、高尔夫球杆、自行车、风力...
如今,火星上的杰泽罗陨石坑是一个干旱贫瘠的洼地。但美国宇航局“毅力号”探测器拍摄的图像显示,数十亿年...
《北斋小姐》的号召力与评价《葛饰北斋》是一部 2015 年上映的动画电影,讲述了江户时代浮世绘艺术家...
近十年前,天文学家提出第九行星的存在,这是一颗位于太阳系遥远边缘的看不见的行星,但他们仍然没有就它是...