山谷巨人的人工智能聊天机器人Google Bard在最初发布时,表现得相当不尽人意。在谷歌Bard与ChatGPT的比较中,该聊天机器人甚至剽窃了我们的内容,事情看起来很糟糕。然而,在谷歌I/O 2023年开发大会上,该公司已经通过现在的谷歌Bard人工智能的许多新功能,对其对手进行了短期工作。但所有这些惊人的新改进是什么呢?让我们来看看下面的内容。
- 谷歌Bard由PaLM 2驱动
- 谷歌Bard现在可以读取图片
- 内置图像生成器
- Bard变得更加直观
- 谷歌服务整合
- 谷歌Bard工具(插件)
- Bard AI也能够写代码
- Google Bard提供多个草稿
- 支持扩展语言
- 一键导出Bard聊天记录
- Bard AI提供暗黑模式
1. 谷歌Bard由PaLM 2驱动
此前,Google Bard由LaMDA的一小部分驱动,LaMDA是该公司的另一个大型语言模型(LLM)。然而,现在情况完全改变了,因为谷歌Bard现在由该公司的下一代语言模型PaLM 2驱动。这个相对较新的LLM现在得到了改进,并带有升级的推理和编码变化。
PaLM 2的加入为Google Bard提供了以前无法实现的新功能。谷歌在其博客文章中提到,新的LLMs广泛的数据集包括科学论文和数学表达。这使得它更善于处理复杂的逻辑推理和数学问题。PaLM 2的速度也比以前的型号快,所以从现在开始期待Bard的更快回复。新的LLM还包含了很多其他的进步。
2. 谷歌Bard现在可以读取图片
虽然Bard不像OpenAI最新的GPT-4 LLM那样是多模态的,但它现在将能够智能地阅读图像并作出回应。这将通过将Google Lens直接整合到Bard中来实现。对于那些不了解的人来说,Google Lens是该公司的一项图像识别技术。这种整合应该使Bard有可能阅读所有类型的图像并起草回复。
谷歌在向Bard提供一张两只狗的照片时也展示了这一点。然后人工智能被要求 “write a funny caption about these two”。在短短几秒钟内,谷歌Bard分析了这张图片,并写出了一些创造性的标题,准备使用。虽然该公司没有展示其他使用案例,但谷歌Bard的图像识别绝对是该机器人的最佳功能之一。
3. 内置图像生成器
像微软这样的公司通过将像Bing AI Image Creator这样的原生服务带到他们的投资组合中,获得了巨大的运气。与最佳AI图像生成器相结合,这些工具几乎不可能没有。虽然Bard在这个特定方面一直落后,但这很快就会改变。很快开始,谷歌将把一个内置的图像生成器带入机器人,所以用户可以无缝地创建AI艺术而不离开标签。
这是由Adobe Firefly实现的,”一个创造性的生成式AI模型系列”,可以在飞行中生成高质量的图像(双关语)。谷歌很快将把Firefly的模型直接整合到Bard中,以方便用户使用该服务。这意味着用户将能够通过提示请求Bard提供图像,并将通过Adobe Firefly获得图像输出。
你甚至将能够进一步编辑这些图像,或将它们拉入Adobe Express进行更多编辑。随着像Midjourney这样的AI图像生成工具迅速成为常态,一个内置的图像生成器是谷歌Bard的一个受欢迎的功能。
4. Bard变得更加直观
当微软必应AI聊天向所有人开放时,它宣布了相当多的新功能,包括用图像进行回复的能力。谷歌已经效仿其竞争对手,为Bard提供了视觉回复功能。很快,当被问及不同的查询时,Bard将智能地使用谷歌搜索,并与文本结果一起提供有用的视觉背景。
它将在聊天本身中直接显示这些综合结果,以便于访问。根据谷歌的说法,这些图像应该让用户对他们的结果有更好的感觉,我们同意。虽然现在还没有上线,但在未来几周内,用户应该可以在Bard中插入图片。它也将随着新的 “生成式AI” 功能出现在谷歌搜索中。
5. Google服务集成
除了谷歌Bard是一个聊天机器人外,该公司正慢慢计划通过将其他服务整合到其聊天机器人中来进一步增强该机器人。为了简化工作流程,谷歌正在创建Bard和其他服务之间的无缝连接,如谷歌表格、文件,甚至地图。这将使所有这些服务能够协同工作,并为Google Bard注入更多新功能。
该公司最近在其主题演讲中展示了其中一个例子。Bard的总经理Sissie Hsiao展示了同样的情况,她要求机器人根据她的兴趣找到不同的大学课程。一旦Bard完成了结果,Sissie要求Bard在地图上显示它们,人工智能立即使用谷歌地图显示它们。
然而,她随后要求它在一个整洁的表格中创建结果,其中充满了大学名称、地点、学位等不同的栏目。一旦完成了这个表格,Bard就能把整个表格导出到谷歌表格,同时保持格式不变。这是Bard帮助人们跨平台协作的一大步。虽然现在还没有全部上线,但谷歌正计划很快将上述功能引入Bard。
6. 谷歌Bard工具(插件)
那么,服务整合并不以谷歌产品为终点,因为来自其他公司的扩展也将有助于使Bard AI方式更加有用。如果你最近一直在关注人工智能的发展,你可能记得,OpenAI的ChatGPT现在支持插件。这被誉为人工智能的一大步,因为机器人现在可以获得更多的经验。那么,谷歌也没有被落下。除了Adobe Firefly的加入,Bard正在通过合作伙伴公司获得自己的插件体验。
很快,谷歌将与Kayak、Spotify、OpenTable、ZipRecruiter、Instacart、Wolfram和Khan Academy等服务合作,为Bard带来选择性的体验。这将有助于包括更多的谷歌Bard功能,并将为教育、生产力、休闲和更多的东西提供可能性。结合谷歌与自身服务的整合,即将推出的Bard工具将使人工智能机器人能够做得更多。
7. Bard AI也能够写代码
以前,当我们将谷歌Bard与ChatGPT进行比较时,我们发现前者不能提供任何编码请求。甚至Bard AI当时的FAQ页面也证实,该公司还没有增加这方面的支持。虽然机器人仍然可以呈现出基本的HTML响应,但代码有时是不正确的,不能被依赖。然而,Google I/O 2023现在透露,Google Bard人工智能正在获得编程功能。
谷歌Bard可以执行大量的编码功能,包括生成、调试和解释代码的能力,没有问题。在I/O大会上进行演示时,Bard AI能使用Python无缝生成了 “Scholar’s Mate move in Chess”,甚至为代码提供了深入的解释。谷歌Bard甚至会提供渲染代码的引证,以便进行双重检查。
一旦完成输出,用户将能够把代码输出到谷歌Collab或Replit,以产生结果。Google Bard将支持20多种编程语言,包括HTML/CSS、Java、C、C++、Dart、Kotlin等。这对刚接触编码的人和以前用ChatGPT学习如何写代码的用户来说,将是一个很大的帮助。
8. Google Bard提供多个回答
虽然ChatGPT可以快速地盘出优秀的答复,但它提供的答案有限,有时会感到重复。然而,谷歌Bard已经并仍然拥有草案形式的最佳功能之一。简单地说,谷歌Bard的回答草稿让用户可以选择从给人工智能聊天机器人的同一个询问中获得多个回应。每个输出的回应都与其他的不同,因此可能会根据提示有不同的看法。
默认情况下,Google Bard会写出同一个答案的三个不同版本。这让人们可以自由选择最适合他们询问的答案。你可以选择一个或混合搭配它们,以获得你所希望的答案。此外,草稿不需要特殊步骤,因为人工智能机器人会自动为你创建这些答案。因此,对于那些寻找人工智能给出的不同答案的人来说,草案功能是谷歌Bard中一个受欢迎的功能。
9. 支持扩展语言
尽管OpenAI的GPT-4 LLM配备了大量的功能,包括多模态响应,但它仍然只限于26种以上的语言。虽然这是一个相当大的数字,但它甚至没有开始涵盖全球范围内提供的广泛的语言。当谷歌昨晚宣布Bard将很快获得对40多种语言的支持时,让所有人大吃一惊。
这个新功能大大增加了人工智能机器人的范围,因为它应该很快就能用用户选择的语言与全球的用户进行充分交流。这40种语言将包括所有广泛使用的语言,以获得更大的支持。此外,谷歌提到,用户现在将能够用日语和韩语与Bard交谈。一旦全面铺开,扩展的多语言支持将成为Bard的最佳功能之一。
10. 一键导出Bard聊天记录
如果你关注过我们关于如何保存和分享ChatGPT对话的教程,你已经知道从人工智能聊天机器人复制和粘贴文本到其他应用程序和服务是多么令人讨厌。虽然谷歌现在为其编码输出提供了一个输出按钮,但在分享和使用输出方面,该公司正在采取进一步措施。
从现在开始,你将能够把你的Google Bard对话直接导出到Google Docs和Gmail等服务。这适用于Bard的所有种类的信息。谷歌提到这些一键式选项应该可以简化工作流程,使整个人工智能输出过程更加快速。
新的导出聊天功能是无缝的,因为当Bard被要求将电子邮件格式导出到Gmail上时,它会迅速打开一个新窗口并粘贴输出,以便立即提交。这与Google Docs的情况相同。正在寻找快速导出聊天记录的用户会在这个功能中找到慰藉。
11. Bard AI提供黑暗模式
虽然有些用户可能觉得这个功能有点太小了,但请相信我们,在谷歌I/O大会上,众人并不这么认为。从现在开始,Google Bard可以使用,嗯,一个全新的黑暗模式。正如它与黑暗模式一样,它是不同色调的黑暗和灰色的良好混合和匹配,看起来很吸引人。
要切换到新的黑暗模式,人们需要做的就是点击左下角侧边栏上方便的黑暗主题按钮,他们就可以开始了。因此,继续启用谷歌Bard最受欢迎和最好的功能之一。
评论留言