以下是我们如何预防下一个种族主义聊天机器人

微软的人工智能聊天机器人 Tay 只用了不到 24 小时的时间，就发出了 9 万条推文，开始在 Twitter 上发布种族主义、种族灭绝的回复。该机器人现已停止发推文，我们可以认为 Tay 是一个失败的实验。

微软发言人在给《大众科学》的声明中写道，Tay 的回应是“一些用户协同滥用 Tay 的评论技能”造成的。

这个没有意识的机器人显然是从一些训练数据中学会了这些话的。据报道，Tay 确实有“跟我复述”的功能，但一些最色情的推文是在 Tay 的传递性思维中生成的。

Tay 之后的生活

然而，Tay 并不是最后一个在互联网上亮相的聊天机器人。人工智能要想完全实现，就需要像人类一样学习约束和社会界限。

佐治亚理工学院的人工智能研究员马克·里德尔 (Mark Riedl) 认为故事可以给出答案。

“当人类写故事时，他们往往体现了他们文化的精华，”里德尔告诉《大众科学》。“如果你能读完一个文化创作的所有故事，主角们所做的事情就会浮出水面。”

里德尔认为，通过训练人工智能系统阅读以正直的主角为主角的故事，我们可以让机器进行粗略的道德推理。

Riedl 发明了一种名为“Quixote”的技术，它为故事中符合社会规范的行为赋予了可量化的价值。这种奖励系统会强化良好行为，并惩罚不良行为，而这由人工智能算法模拟。

这一切都是为了让人工智能算法像书中的主角，甚至是善良的普通人一样。

在 Tay 的案例中，聊天机器人可以学习有关谈论性别、种族、政治或历史的社会准则。通过模仿虚构人物，我们实际上可以将道德融入机器的决策方式中。当然，这可以双向发挥作用。理论上，有人也可以制造恶意的机器人，但 Riedl 表示，在大多数出版的小说中，反派都会受到惩罚，因此这项任务会更困难一些。

Riedl 的论文在 AAAI 人工智能大会上发表，提出了这样一种场景：机器人必须在药店购买处方药。对于机器人来说，阻力最小的路径是识别并偷走药物。但是，在对一系列故事进行训练后，算法会了解到排队、开处方、付款、离开是更好的选择。需要注意的是，这项研究还处于起步阶段，并未应用于真正的机器人，而是在模拟中运行。

在 Tay.ai 部署等场景中，微软希望创建一个友好的对话机器人。

“我认为很明显 Tay 不明白自己在说什么，”里德尔说。“这已经超出了脏话词典的范畴了。”

里德尔很乐观，他认为，随着我们通过预先而不是事后引入伦理或道德来完善这些系统，它们将随着对人性的了解而变得更好，而不是变得更糟。

“所有人工智能系统都可能被用于邪恶目的，”他说。“但我认为现在更容易了，因为人工智能不理解价值观或人类文化。”