Meta 尝试一种新的、更具“包容性”的 AI 训练数据集

Meta 尝试一种新的、更具“包容性”的 AI 训练数据集

随着 OpenAI 的 ChatGPT 和谷歌的 Bard 等公司的出现,科技行业领导者正在继续向消费者推销他们的(有时是有争议的)人工智能系统以及人工智能集成产品。 不过,许多隐私权倡导者和技术专家仍然对用于训练此类程序的海量数据集感到担忧,尤其是涉及数据同意和用户补偿、信息准确性以及算法强制的种族和社会政治偏见等问题。

Meta 希望通过周四发布的 Casual Conversations v2(其 2021 年 AI 视听训练数据集的更新)来帮助缓解其中的一些担忧。根据该公司的声明,在 11 月公开的文献综述的指导下,该数据对不同地理、文化、种族和身体人口统计数据中的人类受试者进行了更细致的分析。

[相关:不,人工智能聊天机器人(仍然)不具备感知能力。]

Meta states v2 是“一个更具包容性的公平性衡量数据集”,它来自七个国家/地区录制的 26,467 个视频独白,由来自巴西、印度、印度尼西亚、墨西哥、越南、菲律宾和美国的 5,567 名付费参与者提供,他们还提供了年龄、性别和外貌等自我识别属性。尽管 Casual Conversations 的初始版本包含超过 45,000 个视频,但这些视频仅来自居住在美国的 3,000 多名个人,他们通过较少的指标进行自我识别。

解决人工智能中的算法偏见是该行业面临的一个关键障碍,因为该行业长期受到人工智能产品提供种族主义、性别歧视和其他不准确答案的困扰。 这很大程度上取决于算法是如何创建、培育和提供给开发人员的。

尽管 Meta 称 Casual Conversations v2 是向前迈出的重要一步,专家们仍然保持谨慎乐观的态度,并敦促继续审查硅谷似乎一头扎进人工智能生态系统的行为。

西北大学计算机科学教授、该校机器智能安全促进中心主任克里斯蒂安·哈蒙德 (Kristian Hammond) 在给PopSci的电子邮件中写道:“这是一个几乎一切都在进步的领域。”哈蒙德认为,Meta 更新后的数据集是该公司“坚实的一步”——尤其是考虑到过去的隐私争议——并认为其对用户同意和研究参与者劳动报酬的重视尤为重要。

“但改进并不是完整的解决方案。只是一步而已,”他警告说。

对于哈蒙德来说,一个主要问题仍然是,研究人员究竟是如何招募参与者参与第二版休闲对话的。“性别和种族多样性很好,但你还必须考虑收入和社会地位以及种族的更细微方面的影响,”他写道,并补充道,“任何自我选择的人群都可能存在偏见。”

[相关:联邦贸易委员会密切关注人工智能诈骗者。]

当被问及如何选择参与者时,Meta 人工智能通信团队的 Nisha Deo 通过电子邮件告诉PopSci ,“我可以告诉你,我们根据自己的要求聘请了外部供应商来招募参与者”,而这些供应商“根据当地数据收集的市场价值”来确定补偿率。

当被要求提供有关工资率的具体数字时,Meta 表示“不可能扩大到超出我们已经分享的范围”。

然而,Deo 还表示,Meta 有意在数据培养的每个步骤中融入了“负责任的机制”,包括与香港科技大学的学术合作伙伴合作对现有数据集方法进行全面的文献综述,以及为注释者提供全面的指南。“负责任的人工智能在构建这个系统时考虑到了道德考虑和公民权利,并将其作为资源开源,以增加人工智能的包容性,”她继续说道。

对于像哈蒙德这样的行业观察家来说,像 Casual Conversations v2 这样的改进是值得欢迎的,但还需要做更多的工作,尤其是当世界上最大的科技公司似乎正在进入人工智能军备竞赛的时候。“每个人都应该明白,这不是一个完整的解决方案。只是一些初步措施,”他写道。“我们必须确保我们不会过于关注这个非常明显的步骤……我们停止督促组织确保他们没有在未经同意的情况下收集数据。”

<<:  方程式赛车计划如何利用更可持续的燃料为赛车提供动力

>>:  解决计算机运行缓慢的 5 种简单方法

推荐阅读

太空学校的考验与折磨

将人类送入太空总是需要坦率地评估他们的缺陷,在早期,问题在于找到没有任何缺陷的人。首先是战斗机飞行员...

如何保存所有旧的 Instagram 故事和帖子

我们把生活中的很多事情都放在 Instagram 上——特殊场合、特殊人物,或许还有一两个特别的表情...

使用这款特价便携式显示器改善您的 WFH 设置

投资一台额外的显示器可能是您为居家办公或任何工作环境所能做的最好的事情之一。它不仅能让您更轻松地在多...

人工智能首次驾驶 U-2 侦察机

执行此次 U-2 任务的空军飞行员的呼号为“Vudu”。Luis A. Ruiz-Vazquez /...

象海豹和你一样讨厌打斗——节奏就是它们最好的防御手段

时间已经过去很久了,但你永远忘不了那个声音。那是你高中时的死对头——在荷尔蒙最旺盛的时候,你和他竞争...

macOS 14 Sonoma 公测版中 6 个新功能你必须尝试

macOS 14 Sonoma 直到今年晚些时候才会完成并正式发布,但目前已推出公开测试版。这意味着...

Steamboy:蒸汽冒险的全面回顾

蒸汽男孩:科学与冒险的史诗交响曲《蒸汽男孩》是一部以 19 世纪英国为背景的科学和冒险史诗故事。该作...

《机甲乌德》的号召与评价:赛博朋克的新前沿

“机甲乌德”:未来科技与年轻人的邂逅《机甲乌手》于2024年10月4日至12月20日播出,是一部为电...

你能用智能手机执行月球任务吗?

许多经历过首次登月的年龄较大的人会清楚地记得尼尔·阿姆斯特朗说出那句名言时的感受:“这对一个人来说是...

洛杉矶山火附近,驾驶假卡车的假消防员被捕

训练有素的专业消防员(比如那些正在与洛杉矶野火搏斗的消防员)对于拯救生命和减轻灾难至关重要——但消防...

如果气候变化影响了你生孩子的愿望,你并不孤单

这可能是无子女人士最焦虑的问题之一,经常在家庭聚会上被远房亲戚或催促的父母问到。自从问出这个刺探性的...

如何学习飞行

这个故事最初刊登在《飞行》上。点击此处查看更多有关如何学习飞行的指南。飞行学校(又称航空培训机构 (...

使用此套餐可获得更便宜的航班、语言学习课程和旅行技巧

目前,旅行似乎没有什么吸引力。机场挤满了沮丧的旅客,航班时不时延误,航空公司的服务质量低劣,机票价格...

《DD北斗神拳》评论:传奇动作与新吸引力的融合

DD 北斗之拳—D.D.北斗神拳 - 全面评论与推荐概述《DD北斗之拳》是2013年在东京电视台播出...

Adobe 的新 AI 可以将 2D 照片变成 3D 场景

今天,在公司年度创意大会 Adob​​e MAX 上,Adobe 将预览一项名为“Beyond th...