周三,谷歌宣布推出 Gemini,这是该公司 AI 部门 DeepMind 从头开始构建的全新多模态大型语言模型。Gemini 的众多功能之一是它将为 Google Bard 提供支持,而 Google Bard 此前一直难以摆脱聊天机器人先驱 OpenAI 的 ChatGPT 的阴影。 根据谷歌首席执行官 Sundar Pichai 和 DeepMind 联合创始人兼首席执行官 Demis Hassabis 12 月 6 日发表的一篇博客文章,LLM 有三个版本,分别是 Gemini Ultra、Pro 和 Nano,适用于各种应用。经过“微调”的 Gemini Pro 目前是 Bard 的基础,而 Nano 版本将出现在 Pixel Pro 智能手机等产品中。Gemini 版本也将在未来几个月内推出,用于谷歌搜索、广告和 Chrome,不过 Ultra 要到 2024 年才会向公众开放。 与许多 AI 竞争对手不同,Gemini 从发布之初就被训练成“多模式”机器人,这意味着它已经可以处理文本、音频和基于图像的提示。在附带的视频演示中,Gemini 被要求通过口头识别摆在它面前的东西(一张纸),然后实时正确识别用户画的鸭子草图。其他能力似乎还包括推断视频暂停后接下来会发生什么、根据视觉提示生成音乐以及评估儿童的家庭作业——通常带有一点俏皮、喜欢玩弄双关语的个性。然而,值得注意的是,视频描述中包含免责声明:“为了演示的目的,延迟已减少,Gemini 的输出已缩短以简洁。” 在后续的博客文章中,谷歌证实 Gemini 实际上只对静止图像和书面用户提示的组合做出响应,并且他们的演示视频经过编辑,以呈现更流畅的音频功能交互。 Gemini 随附的技术报告表明,LLM 最强大的版本 Ultra“在 32 个广泛用于 [LLM] 研究和开发的学术基准中,有 30 个超过了目前最先进的结果”。尽管如此,改进似乎有些温和——Gemini Ultra 正确回答多学科问题的比例为 90%,而 ChatGPT 为 86.4%。然而,无论统计结果如何,结果表明 ChatGPT 可能与 Gemini 存在真正的竞争。 [相关:ChatGPT 等人工智能聊天机器人背后的逻辑非常简单。] 不出所料,谷歌在周三的公告中警告称,其新推出的明星人工智能远非完美,仍然容易出现困扰新兴技术的行业范围内的“幻觉”——即法学硕士偶尔会随机编造错误或无意义的答案。谷歌还对 Gemini 进行了“谷歌人工智能模型中最全面的安全评估”,谷歌 DeepMind 产品副总裁 Eli Collins 在 12 月 6 日的发布会上表示。其中包括让 Gemini 接受“真实的毒性提示”,这是艾伦人工智能研究所开发的一项测试,涉及超过 100,000 个有问题的输入,旨在评估大型语言模型的潜在政治和人口偏见。 未来几个月,Gemini 将继续融入 Google 的产品套件,同时进行一系列封闭测试阶段。如果一切按计划进行,Gemini Ultra 驱动的 Bard Advanced 将于明年某个时候向公众推出——但正如目前已经确定的那样,正在进行的 AI 军备竞赛往往很难预测。 当被问及它是否由 Gemini 提供支持时,Bard 告诉PopSci ,它“不幸”无法访问“有关 Google 内部项目”的信息。 “如果你有兴趣了解更多关于‘双子座’的信息,我建议你通过谷歌官方渠道搜索信息,或者联系公司内部有权访问此类信息的人,”巴德在给PopSci的信中写道。“我很抱歉给你带来不便,希望这些信息对你有帮助。” 更新 12/08/23 11:53AM:谷歌于 12 月 6 日发布了一篇博文,澄清了其 Gemini 上手视频以及该程序的多模式功能。尽管演示可能看起来 Gemini 响应了移动图像和语音命令,但谷歌提供了静态图像和书面提示的组合。随后对视频进行了编辑,以减少延迟和简化流程。此后,本文的文本已进行编辑以反映这一点。 |
在 iOS 18 推出的一系列新功能中,Apple Maps 中保存地点的工具得到了改进。其中包括一...
Windows 10 在许多方面都令人印象深刻,例如语音控制与 Cortana 的紧密集成,以及软件...
《欺凌:来自 14 岁少年的讯息》:一夜之间讲述青春痛苦与希望的故事《欺凌:来自 14 岁少年的信息...
我一直热切地期待着《权力的游戏》的最后一季,它把虚构的中世纪英国、超自然怪物和色情内容奇妙地融合在一...
没人说蝙蝠漂亮。但它最丑陋的特征——装饰奇特的耳朵和错综复杂的皱褶嘴巴——在这种动物追踪猎物的神奇能...
有一颗行星距离我们仅 4 光年,它绕着一颗恒星旋转,距离恰到好处——不太近,也不太远——以至于它的表...
随着将士兵培养成“超级士兵”的迫切需要,一些颇具超级英雄风范的技术改进已成为现实世界国防部门的追求,...
作为全球最大的社交网络,Facebook 可以监控全球约三分之一的人口。无论您是每天访问该社交网络(...
一群奥林匹亚牡蛎。图片由 Matthew Gray (CC BY-SA 2.0) 提供太平洋牡蛎可以...
您是否知道有人在创意项目中苦苦挣扎于配色?Nix Mini 2 配色传感器可能是他们正在寻找的解决方...
百宝箱英雄传说 - 美好旧时光的经典动漫1934年上映的《百变狸猫传》是JO Studio制作的原创...
未检测到扭曲特征!#StarTrekDiscovery pic.twitter.com/680SWh...
Ring 是亚马逊旗下的一家智能家居安防公司,该公司经常在客户不知情的情况下与当地警方共享客户的视频...
《大众科学》Play版现已面向所有人开放。立即阅读,无需应用程序或信用卡。运动员在自己的主场往往表...
10 月 10 日,皇家海军辅助舰队在泰晤士河上举行了一场仪式,为一艘名为“Proteus”的船只举...