Dall-E Mini 图像生成器的荒谬性可能是它的主要吸引力

Dall-E Mini 图像生成器的荒谬性可能是它的主要吸引力

萨尔瓦多·达利是 1904 年出生的西班牙艺术家,他以超现实主义绘画而闻名:融化的钟表、腿细如昆虫的大象、扭曲的人脸和四肢。Dall-E(发音类似 Dalí)Mini 是一款于 6 月初首次亮相的新 AI 程序,它很快被公认为超现实主义艺术的另一个来源,它通过用户生成的请求生成图像,例如一瓶牧场酱在法庭上作证、wikihow 上关于如何吃锤子的说明,以及电影《寂静岭》中吃披萨的护士。

这些图像很有趣,该程序因其有趣的艺术作品在网上获得了关注。用户可以输入一个短语——任何短语——然后看到他们编写的人工智能生成的图像突然出现。Dall-E Mini 是一个开源项目,基于人工智能研究实验室 OpenAI 的原始 Dall-E 技术,该技术可以从文本生成逼真的图像和艺术作品。Dall-E Mini 制作的许多艺术作品都受到了人们的嘲笑。但随着这些技术变得越来越完善和广泛使用,滥用的风险也在增加——这可不是开玩笑的事。

Dall-E Mini 是继 OpenAI 于 2022 年 4 月正式发布的 Dall-E 2 之后推出的。Dall-E 2 的运作方式是建立数十亿张在线图像与其随附描述之间的关联。Dall-E Mini 的运作方式类似,但规模要小得多。该项目由 Boris Dayma 领导,使用了来自三个数据集的约 1500 万张图像来为其模型提供信息,其规模大约是 OpenAI 最初的 Dall-E 程序的 1/27。Dall-E Mini 由 Hugging Face 托管,该公司提供机器学习模型和工具,并表示他们的使命是“使良好的机器学习民主化”。

用户几乎可以制作任何他们想要的图像,尽管结果更倾向于滑稽而非准确。技术安全公司 F5 的前人工智能负责人 Shuman Ghosemajumder 表示,喜剧性和吸引力的一部分来自于意想不到的缺陷。“它之所以有趣,部分原因是图像并不完美,”Ghosemajumder 说。“有印象派图像,有噩梦般的图像,有疯狂的图像。所有这些都很有趣,而且分享起来也很有趣。”

Ghosemajumder 表示,他可以预见这种技术在公众眼中会经历几个不同的阶段。起初,人们对这种程序可能具有的能力感到好奇。随着人们探索他们所能创造的东西的复杂性,人们会感到惊奇和学习——正如网上已经展示的那样。然后,他说第二阶段更像是从纯粹的娱乐过渡到人们理解他们所能创造的东西的价值。

“你可以为特定目的生成基本的插图,并且可以更好地了解技术的当前状态,以便可以开始制定计划,规划未来如何使用这项技术的更先进版本,”Ghosemajumder 说。

展望未来,他认为这些技术被认知的第三阶段将是它们如何为未来更先进的创新奠定基础,例如高质量的合成视频。

但随着这些创新变得越来越好,危险和误导性图像的风险也随之增加。

[相关:让 Craiyon(前身为 Dall-E mini)屈服于你的意志的 5 种方法]

Ghosemajumder 表示,目前 Dall-E Mini 的图像“质量”很低,用户通常知道这些图像是人工智能生成的,不一定是实际拍摄的照片,比如一瓶牧场酒在法庭上作证的照片。但当越来越难以辨别某样东西是在人工智能平台上制作的还是在非数字世界中拍摄的时,人们将更容易制作图像,为网上的虚假信息活动提供素材。

“人们可以创造的不仅仅是图帕克或达斯·维达的印象派版本,”Ghosemajumder 说。“相反,它会让人觉得,‘哇,这看起来像是一个真实的人在做某事。’我可以创造一个政客做他们从未做过的事情的形象,最终创造一个完整的故事情节,并用它来传播虚假信息。”

目前,Dall-E 2 尚未向公众开放,而 OpenAI 的开发人员正在努力应对滥用的潜在风险。(Dall-E Mini 是类似但公开生产的开源版本。)同样,谷歌的文本转图像程序 Imagen 尚未发布对其平台的访问权限。在这两种情况下,这两家公司都聘请了研究人员和艺术家来测试程序并改进操作和训练数据,确保安全,并使艺术变得更好。Ghosemajumder 说,在全面发布之前进行有限发布是“广泛接受的软件原则”,他认为随着技术变得越来越复杂,这将变得越来越重要。

最终,Ghosemajumder 表示,Dall-E Mini 等技术的最大优势之一是,它们将使更多人能够比现在更轻松地看到事物。他认为这是高质量内容的民主化。

“它释放了人们的创造力,让人们能够更有效地沟通,”Ghosemajumder 说。“这有可能让人们更高效、更有效地生成他们想要可视化的不同概念的插图和照片。”

至于 Ghosemajumder,他的 Dall-E Mini 创作是一系列图像,描绘了 Chewbacca 如果有一份办公室工作的话会如何度过一天。

<<:  RIP Internet Explorer,感谢所有的表情包

>>:  7 个技巧让你的 Mac 上文件更容易找到

推荐阅读

机器人能为餐厅做什么,不能做什么

本周早些时候,总部位于加州的 Miso Robotics 公司宣布将与 Panera Bread 合...

美国宇航局需要你的帮助识别云层

花上一整天躺在户外看云。这很有帮助。真的。只需在仰望天空时在手机屏幕或平板电脑上轻点几下,您就可以为...

购买这些具有助听功能的无线耳机可节省 20 多美元

根据美国国家耳聋和其他交流障碍研究所的数据,大约 15%(即 3750 万)的 18 岁以上的美国人...

使用这款高评价套装提升你的 ASL 技能,现价 20 美元

无论您是想与聋人社区建立联系、拓展职业机会还是获得一项新的丰富技能,一体化美国手语 (ASL) 套装...

CES 2013:Razer Edge 游戏平板电脑实测

我们已经知道 Razer Edge 一段时间了,这是一款专为游戏而设计的 Windows 8 平板电...

实时查看绕地球运行的所有卫星和太空垃圾

从地面上看,太空看起来就像一片空旷的原始空间。但地球轨道上实际上挤满了大量物质,从人造卫星到许多以危...

雄性猕猴同性交配可帮助它们更成功地繁殖

有记录显示,从线虫到企鹅再到牛,有超过 1,000 种动物存在同性性行为。尽管在整个动物界中,只有极...

您现在可以直接在 Google 日历上与客人聊天。操作方法如下。

当您举办虚拟或现实生活中的活动时,您可能希望与来宾取得联系,比如在会议前分享链接或要求他们戴上帽子做...

这些动物的屁股上有乳头,但这并不是它们最迷人的地方

如果说有哪种动物能比恐龙活得更久,你大概猜不到会是这个长得像小鼩鼱的家伙。看看它,眼睛很小,鼻子几乎...

删除你的搜索历史并成为数字幽灵

本文已更新。最初于 2018 年 4 月 19 日发布。每次你在网上搜索时,你拥有帐户的网站都会记录...

Bakugan Battle Brawlers 新 Vestroia:深入了解第二系列

Bakugan Battle Brawlers 新版 Vestroia:战斗方式更进化,故事情节更丰...

《大肚腩》:为大家透彻解析这首歌的魅力与情感

“大肚子”——《大家的歌》的魅力及其背景《大肚子》是一部短篇动画电影,于 2016 年 6 月作为 ...

龙珠:神龙传说的全面回顾——重新发现传说的力量

《龙珠:神龙传说》——传说的起源及其魅力■ 公共媒体剧院■ 原创媒体漫画■ 发布日期1986年12月...

Boaty McBoatface 是一位非常忙碌的科学探险家

远程自动潜艇 Boaty 已经服役一年了。它曾到南极冰层下进行过一次旅行,并成功返回。不久之后,它又...

Switch 的下一款《马里奥赛车》游戏将有一辆真正的汽车在你的客厅里飞驰

任天堂可以将廉价的马里奥赛车品牌贴到几乎任何东西上,并借此赚取数百万美元。这是一个深受喜爱的系列游戏...