OpenAI 推出 ChatGPT 语音,完全不是“模仿斯嘉丽·约翰逊”

OpenAI 推出 ChatGPT 语音,完全不是“模仿斯嘉丽·约翰逊”

更新:2024 年 5 月 20 日,美国东部时间晚上 8:28 :斯嘉丽约翰逊的公关人员向多家新闻媒体发表声明,称她的法律团队“给奥特曼先生和 OpenAI 写了两封信,阐述了他们所做的事情,并要求他们详细说明他们创造‘天空’声音的具体过程。因此,OpenAI 勉强同意删除‘天空’声音。”

约翰逊透露,奥特曼曾于 2023 年 9 月寻求使用她的声音的许可,但被她拒绝了。

约翰逊写道:“在我们都在努力应对深度伪造和保护自己的肖像、自己的作品、自己的身份的时代,我认为这些问题值得绝对明确。我期待以透明的形式解决问题,并通过适当的立法,以帮助确保个人权利得到保护。”


OpenAI 上周发布的新 GPT-4o 系统受到了广泛的反响。但大多数观看过该多模态生成式 AI 系统实际运行的人至少可以同意一件事——它的默认语音“Sky”听起来确实“更挑逗”,因为没有更舒服的词来形容。

Sky 升级版首次亮相后不到一周,OpenAI 宣布正在“努力暂停”其可用性,同时“解决”互联网上关于该声音的疑问。顺便说一句,它完全“不是斯嘉丽·约翰逊的模仿”,也不是她在 2013 年科幻电影《她》中扮演的有自我意识的人工智能助手的表演。

去年年底,当 OpenAI 公开推出 ChatGPT 的新声音时,大多数用户似乎并不介意,甚至没有注意到 Sky 与流行文化的任何潜在相似之处。但随着 GPT-4o 更具表现力的升级,这一切都在一夜之间发生了改变。一位 CNN 评论员将 GPT-4o 的 Sky 声音描述为“令人震惊”和“令人毛骨悚然”,而Ars Technica则表示它现在听起来“栩栩如生”。就连《每日秀》也注意到了这一点。

“这显然是为了满足男人的虚荣心而设计的。你真的可以看出这项技术是男人发明的,”节目记者 Desi Lydic 上周将其描述为“淫荡的机器人婴儿声音”。

但它与她的相似之处 这些内容占据了 GPT-4o 的大部分报道。斯派克·琼斯 (Spike Jonze) 的这部电影于 2013 年上映,讲述了一个孤独的男人爱上了(并剧透:他为此心碎)他越来越具有自我意识的 AI 电话助理,该助理由约翰森配音。OpenAI 首席技术官米拉·穆拉蒂 (Mira Murati) 在上周的一次采访中否认从约翰森的主角角色中汲取了任何有意的灵感,尽管暂停了 Sky 的可用性,但该公司在新博客文章中再次强调了这一说法。据 OpenAI 称,Sky 和 ​​ChatGPT 的另外四个声音是数月精心策划和考虑的结果,任何与约翰森的相似之处纯属偶然——别介意首席执行官萨姆·奥特曼 (Sam Altman) 曾经说过《她是他最喜欢的电影》——两周前,ChatGPT 将于 2023 年 9 月推出声音。并在上周 GPT-4o 发布后不久发了一条推文“她”。

OpenAI 如何选择其“永恒”的聊天机器人声音

在 5 月 19 日的帖子中,OpenAI 简要介绍了它如何选择 GPT 的语音选项。据报道,除了 Sky 之外,Breeze、Cove、Ember 和 Juniper 角色的设计也经过了五个月与演员、人才经纪公司、行业顾问和选角导演的磋商。然后,该公司确定了一份标准清单,每个声音都需要满足这些标准,以创造出他们认为最具吸引力、最普遍的选择。这些特点包括需要多元化、多语言的演员,能够进行富有魅力、平易近人、令人信任的表演——同时也需要“一种让人感觉永恒的声音”,尽管目前尚不清楚是什么决定了这种品质。

[相关: OpenAI 解散了其致力于防止流氓人工智能的团队。]

设计师于 2023 年 5 月发出了选角通知,据报道收到了 400 多份参赛作品。每位参赛者的作品都包含预先录制的、脚本化的 ChatGPT 回答,内容包括“回答有关正念的问题、集思广益制定旅行计划,甚至参与用户一天的对话”。该团队随后采访了 14 名决赛选手,询问他们“人机语音交互的愿景”,同时讨论了该技术的“能力、局限性和风险”,以及所谓的 OpenAI 正在进行的“保障措施”。(目前尚不清楚这些保障措施聊天是否包括现已完全解散的超级联盟团队,该团队的联合负责人上周公开辞职,理由是对“公司的核心优先事项”表示担忧。)

最后选定的五位演员于去年 6 月和 7 月飞往旧金山进行录音和面对面会议,随后 OpenAI 于 2023 年 9 月公开推出了 ChatGPT 的新声音。在接下来的七个月里,大多数用户似乎并不介意,甚至没有注意到任何 AI 声音与流行文化的潜在相似性,但随着 GPT-4o 更具表现力的升级,这种情况在一夜之间发生了改变。

通过调侃和通过摄像头输入解读面部表情的能力,GPT 的声音获得了新的个性化特征和情感能力——以及最近的约翰森比较。目前尚不清楚该公司计划花多长时间来调整 Sky 的声音,以及改版后的版本听起来会是什么样子。

OpenAI 尚未透露潜在的法律威胁是否是幕后因素,并且在撰写本文时没有对PopSci做出回应。

<<:  观看西班牙和葡萄牙上空令人惊叹的流星灯光秀

>>:  Genesis 如何在 GV80 SUV 中使用火山岩和再生报纸

推荐阅读

仅供参考:有什么东西能比光移动得更快吗?

是的,宇宙本身最终会超越光速。但具体如何实现这一点有点复杂,所以我们从头说起:大爆炸。大约 140 ...

海浪下的钟摆可以防止海滩侵蚀

气候变化给我们带来了更强大、更具破坏性的海浪,这反过来又加剧了本已严重的海岸侵蚀问题。考虑到这一点,...

在亚马逊以低价购买苹果新款 15 英寸 M2 MacBook Air

自从苹果改用自有品牌的 M 系列硅芯片以来,MacBook Air 就被推荐为大多数人的最佳笔记本电...

历经 95 年风雨,迪士尼终于将“汽船”米老鼠回归公共领域

迪士尼标志性的米老鼠形象——曾是美国版权争论中的头号反派——在经过 95 年漫长的岁月后正式进入公共...

这只 1.2 亿年前的鸟可能是最早抖动尾羽的鸟类之一

当需要给潜在伴侣留下深刻印象时,许多鸟类都会依靠其令人惊艳的羽毛。有些展示过于奢华,实际上反而成为一...

俄罗斯的新型隐形战斗机物美价廉,堪比邦德反派

周六,一架新型俄罗斯战机被防水布包裹,出现在公众视野中。俄罗斯国防巨头 Rostec 在本周的 MA...

催眠麦克风 -Division Rap Battle- Rhyme Anima 第二季的魅力与评价

催眠麦克风 -Division Rap Battle- Rhyme Anima + 评论《催眠麦克风...

美国宇航局(未)审查的月球漫步者

登月计划的一大重点是向公众推销该计划。NASA 不仅需要获得对阿波罗计划的支持,而且如果向为该计划买...

《黎明踏浪者进行曲》的魅力与评价:大家都喜欢的动漫歌曲

《Dekkai Tot March》~大家的歌的代表作回顾《黎明踏浪者进行曲》是1980年8月在NH...

Triumph 推出 2019 款 Rocket 3 TFC,搭载 2,500cc 发动机

.embed-container { position: relative; padding-bot...

吃海鲜比吃红肉更可持续、更健康

人类自古以来就一直食用肉类,但近年来肉类消费量呈爆炸式增长。2018 年全球肉类产量达到约 3.75...

《千花千天》:透过大家的歌声看到动人的世界

《千花千天》:NHK动画短片描绘的美丽世界2005年10月,NHK教育电视台(现为NHK E-Tel...

野火烧毁了美国西部的积雪

本文最初刊登于《High Country News》。 2021 年 6 月,研究员斯蒂芬妮·坎普走...

ClassicaLoid 第二季:音乐与故事的融合

ClassicaLoid 第二系列 - ClassicaLoid 第二系列概述ClassicaLoi...

2017 年日全食的最佳照片

2017 年 8 月 21 日,美国东西海岸的人们都兴奋不已——这完全是情有可原。今天下午,月亮从太...