以下是我们如何预防下一个种族主义聊天机器人

以下是我们如何预防下一个种族主义聊天机器人

微软的人工智能聊天机器人 Tay 只用了不到 24 小时的时间,就发出了 9 万条推文,开始在 Twitter 上发布种族主义、种族灭绝的回复。该机器人现已停止发推文,我们可以认为 Tay 是一个失败的实验。

微软发言人在给《大众科学》的声明中写道,Tay 的回应是“一些用户协同滥用 Tay 的评论技能”造成的。

/

这个没有意识的机器人显然是从一些训练数据中学会了这些话的。据报道,Tay 确实有“跟我复述”的功能,但一些最色情的推文是在 Tay 的传递性思维中生成的。

Tay 之后的生活

然而,Tay 并不是最后一个在互联网上亮相的聊天机器人。人工智能要想完全实现,就需要像人类一样学习约束和社会界限。

佐治亚理工学院的人工智能研究员马克·里德尔 (Mark Riedl) 认为故事可以给出答案。

“当人类写故事时,他们往往体现了他们文化的精华,”里德尔告诉《大众科学》。“如果你能读完一个文化创作的所有故事,主角们所做的事情就会浮出水面。”

里德尔认为,通过训练人工智能系统阅读以正直的主角为主角的故事,我们可以让机器进行粗略的道德推理。

Riedl 发明了一种名为“Quixote”的技术,它为故事中符合社会规范的行为赋予了可量化的价值。这种奖励系统会强化良好行为,并惩罚不良行为,而这由人工智能算法模拟。

这一切都是为了让人工智能算法像书中的主角,甚至是善良的普通人一样。

在 Tay 的案例中,聊天机器人可以学习有关谈论性别、种族、政治或历史的社会准则。通过模仿虚构人物,我们实际上可以将道德融入机器的决策方式中。当然,这可以双向发挥作用。理论上,有人也可以制造恶意的机器人,但 Riedl 表示,在大多数出版的小说中,反派都会受到惩罚,因此这项任务会更困难一些。

Riedl 的论文在 AAAI 人工智能大会上发表,提出了这样一种场景:机器人必须在药店购买处方药。对于机器人来说,阻力最小的路径是识别并偷走药物。但是,在对一系列故事进行训练后,算法会了解到排队、开处方、付款、离开是更好的选择。需要注意的是,这项研究还处于起步阶段,并未应用于真正的机器人,而是在模拟中运行。

在 Tay.ai 部署等场景中,微软希望创建一个友好的对话机器人。

“我认为很明显 Tay 不明白自己在说什么,”里德尔说。“这已经超出了脏话词典的范畴了。”

里德尔很乐观,他认为,随着我们通过预先而不是事后引入伦理或道德来完善这些系统,它们将随着对人性的了解而变得更好,而不是变得更糟。

“所有人工智能系统都可能被用于邪恶目的,”他说。“但我认为现在更容易了,因为人工智能不理解价值观或人类文化。”

亮出底牌

尽管任何在公开场合生成言论的算法都有可能出现失误,但研究自动新闻机器人和新闻算法的马里兰大学助理教授尼古拉斯·迪亚科普洛斯 (Nicholas Diakopoulos) 表示,微软本可以通过更加开放其训练数据和方法论来减轻反应。

“对这些事情保持透明可能会减轻他们受到的一些打击,”迪亚科普洛斯在接受采访时说。“因此,那些认为存在种族偏见的人可以深入了解机器人背后的细节,稍微躲到幕后。”

迪亚科普洛斯将此称为“算法透明度”。但他也指出,算法并不像人们普遍认为的那样自主。虽然 Tay 被迫说出这些种族主义、性别歧视的言论,但有一些机制将这些话语串联起来。这些机制的创造者是人类。

“人们期望自动化是公正的。自动化的几乎每个步骤背后都有人为。对于机器人的每一个小错误或失误,也许你可以尝试追溯,”Diakopoulos 说。

泰伊的脏话该归咎于谁?

对 Tay 的言论进行指责是一个很复杂的问题。

人工智能研究员 Alex Champandard 负责神经网络绘制 Twitterbot @DeepForger,他表示,你可以让大多数回复机器人生成煽动性推文,而主人无法控制会发生什么。他自己的机器人是基于图像的,这比阻止某些短语或单词要复杂得多。

至于 Tay,Champandard 表示微软很幼稚,在制定技术解决方案时没有考虑人们可以提交什么。他说,这揭示了机器学习聊天机器人普遍存在的一个问题。

“我相信大多数回复机器人现在和将来都容易受到旨在发表政治言论的攻击,”Champandard 在 Twitter DM 中写道。“这种行为反映了 Twitter 的总体氛围,即使只有 0.05% 的时间也会发生这种情况。”

不过,他也不认为将脏话列入黑名单是解决问题的办法。

“没有一个有限的关键词禁用列表可以帮助解决这些问题。”他写道。“你可以建立一个白名单,列出特定的允许回复,但这违背了机器人的目的;它之所以有趣,是因为它潜在的随机性。”

这种随机性是 Twitter 本身的体现;“这是我们观察当今社会的镜头,”Champandard 说道。推文有好有坏——推文可以是直言不讳的,也可以是冷酷无情的。

如果微软的人工智能 Twitter 机器人 Tay 的经验教会了我们什么的话,那就是我们还有很长的路要走——无论是在人工智能编程方面,还是在使人类社会更加人性化和文明方面。

/

<<:  2016 年瞪羚拉力赛正在进行中

>>:  Hulu VR 与 Netflix VR:应用对比

推荐阅读

天宫站将如何让中国在太空竞赛中成为一股力量

在冷战最激烈的时期,大规模的地球外探索成为美国和苏联在后核时代权力斗争的戏剧舞台。这种紧张的气氛推动...

《爱的旅程》:重新评价大家动人的歌曲

《爱的旅程》:NHK经典歌曲在动画中重现1989年12月在NHK教育电视台(现NHK电子电视台)播出...

三星新款 Gear S3 智能手表始终显示时间

三星今天发布了其可穿戴产品线的第七款智能手表:Gear S3,有两种型号:Gear S3 Class...

晕动症的原因是什么?以及如何避免

19 世纪末,一些寻求刺激的人会乘坐所谓的“鬼屋秋千”来寻求刺激。这看起来像是一个普通的房间,配有桌...

詹姆斯·韦伯太空望远镜拍摄的新照片显示海王星的暗淡光环闪烁

说到有光环的行星,土星通常以其标志性的冰螺旋而独占鳌头。但土星并不是太阳系中唯一一颗有宇宙光环的行星...

谷歌 Chrome 浏览器迎来 10 周年大改版,并推出新功能

我们生活在浏览器里,在工作时(或“工作”)点击标签。但就像您可以选择购买哪台电脑或使用哪款电子邮件服...

Neuralink 承认患者大脑植入物部分“缩回”

本周早些时候,Neuralink 悄悄发布了有关首位接受实验性脑机接口 (BCI) 的患者的最新进展...

NordicTrack 的联网健身自行车专注于与自己竞争

疫情让去健身房变得复杂。安全法规的不确定性和重新开放的不确定性导致家庭健身器材在美国大受欢迎,尽管我...

《Komporakid》的魅力与评价:动漫迷必读的评论

《Komporakid》:一部讲述未来机电一体化时代的搞笑喜剧动画■作品概要《Kompora Kid...

激光和 3D 打印让 New Balance 的新款运动鞋焕发活力

看看新百伦周五推出的一款名为 FuelCell Echo Triple 的新型跑鞋,你会发现前脚掌(...

LIGO 发现第三次黑洞合并

当先进激光干涉引力波天文台(LIGO)首次探测到引力波(来自 13 亿光年外的黑洞合并)时,全世界的...

极其罕见的黄色红雀飞进密歇根州的后院

就在圣诞节前,密歇根州的两位后院观鸟爱好者迎来了终极惊喜——一只黄色的北美红雀。阿琳和约翰·麦克丹尼...

这可能是让你的电脑起死回生的最简单方法

新年新气象可能并不适用于您的 PC,因此我们必须问您一个问题——您上次升级是什么时候?如果您花了超过...

黑色星期五 AeroGarden 促销活动将全年种植绿色蔬菜和香草

AeroGarden 是一款自带生长灯的独立式台面水培花园,是送给家庭厨师、有园艺天赋的朋友或任何想...

Oura Ring Gen3 健康追踪器评测:这是一种复杂的关系

市场上充斥着用于追踪健康状况的设备,其中大多数都佩戴在佩戴者的手腕上。不过,健康追踪领域相对较新的是...