您最喜欢的人工智能聊天机器人- ChatGPT、Claude 和 Gemini -最近通过与其他应用程序集成,增强了自己的能力。这一进步使这些人工智能模型能与各种应用程序无缝互动,直接帮助完成代码编辑、数据检索等任务。这样,无需在标签页之间切换或下载额外的应用程序,就能轻松实现多任务处理。值得注意的是,ChatGPT 和 Claude 在其桌面应用程序中提供了这些功能,而 Gemini 则将这些功能集成到了其网页界面中。在本文中,我们将探讨如何通过 ChatGPT、Claude 和 Gemini 聊天机器人访问应用程序,并研究它们的独特方法。
如何在ChatGPT上使用Works with Apps
ChatGPT 现在推出了 “Work with Apps”功能,允许它读取并直接编辑外部应用程序中的内容。目前,ChatGPT 可以访问 macOS 上的集成开发环境(IDE)、终端和文本编辑器等编码工具。这种集成使 ChatGPT 能够提供上下文感知帮助、简化编码工作流程并提高工作效率。目前,Plus、Pro 和 Team 用户可以使用该功能,未来计划扩展到Free、Enterprise 和 Edu 用户。
以下是如何在 MacBook 的外部应用程序上使用 ChatGPT。
- 启动 ChatGPT:在 MacOS 设备上打开 ChatGPT 桌面应用程序。
- 访问设置:导航至设置菜单,启用“Works with Apps”功能。
- 管理应用程序集成: 进入 Settings > Work with Apps > Manage Apps,查看兼容的应用程序及其集成要求。
- 启用可访问权限: 对于大多数兼容的应用程序,ChatGPT 需要 macOS 辅助功能权限才能访问内容。确保在系统设置中为 ChatGPT 授予了这些权限。
- 安装必要的扩展: 某些应用程序(如 VS Code)需要特定的扩展才能集成。根据需要按照提示安装这些扩展。
- 使用应用程序激活ChatGPT:按 Option + 空格键或单击 ChatGPT 菜单栏图标打开聊天栏。如果 ChatGPT 检测到一个激活的兼容应用程序,它将显示一个横幅,说明正在使用的应用程序和识别的内容。
- 互动和确认操作:输入提示时,ChatGPT 会将应用程序的内容作为上下文。对于代码编辑等操作,ChatGPT 会在应用更改前生成差异供您查看。您可以选择自动或手动应用这些编辑。
通过这些步骤,ChatGPT 可以有效地与您的编码环境集成,提供量身定制的帮助并简化您的工作流程。下面的演示将向您展示它是如何工作的。
如何在Claude上访问外部应用程序
Anthropic 于 2024 年开发了“模型上下文协议”(MCP),以规范外部应用程序向大型语言模型(LLM)提供上下文的方式。这是一个开源协议,可促进人工智能系统与各种数据源之间的无缝集成,从而实现更准确、更符合语境的交互。
利用 MCP,Anthropic 首次推出了“Computer Use”功能,允许克劳德在一定程度上控制个人设备,自主完成输入文本、创建文件、截图等任务。
最近,该公司建立了一个名为“Fleur”的新应用商店,让聊天机器人可以访问大量外部应用程序。这一增强功能让 Claude 可以高效地执行创建 GitHub 仓库和管理拉取请求等任务。它增强了聊天机器人的功能,尤其是对于需要将生产力工具和其他实用工具集成到聊天界面的用户。
以下是在 Claude 聊天机器人界面中集成和调用外部应用程序的方法。
- 下载Fleur:首先下载 Fleur 安装程序。
- 安装Fleur:将 Fleur 应用程序拖入 Claude。
- 初始化通信:打开 Claude 并输入“Hello Fleur”以启动连接。
- 列出可用的应用程序:然后输入“Open Fleur”,显示可集成的应用程序列表。
- 选择并配置:单击要使用的应用程序,然后根据提示设置所需的 API 密钥或配置。
- 重新启动Claude:设置完成后,重新启动 Claude,用新的 MCP 集成进行更新。
- 监控集成:你会发现提示框右下方有一个计数器,显示已安装的 MCP 工具数量。
- 授权应用程序访问:当 Claude 尝试使用集成的应用程序时,它会请求您的许可。在这里,你可以授予单个提示或整个会话的访问权限。
下面的视频演示了如何安装 Fleur 并使用它来增强 Claude 的功能。
如何在Gemini上访问Google应用程序
Gemini 已将各种谷歌服务集成到其人工智能聊天机器人中,允许用户直接在其网页界面上访问 YouTube、地图和搜索等应用程序。这种集成简化了任务,如检索信息、导航位置和访问多媒体内容,而无需离开聊天环境。对 Google 应用程序套件的无缝访问通过提供快速高效的互动增强了用户体验。最近,这种集成已扩展到其他工具,如 YouTube Music 和 Google Workplace 应用程序(如 Gmail、Google Calendar 和 Docs),进一步增加了其应用范围。
请按照以下步骤开始在 Gemini 聊天机器人的网页界面上使用 Google 应用程序:
- 启动应用程序访问:在 Gemini 聊天界面上,在提示框中输入“@”符号,显示可访问的谷歌应用程序列表
- 选择一个应用程序:从列表中选择所需的 Google 应用程序(如 YouTube 或 Google 地图),授予 Gemini 访问权限。请注意,某些应用程序(如 Google 航班、Google 酒店、Google 地图和 YouTube)是默认启用的。
- 启用其他应用程序:要访问其他可用的应用程序,请转到 Settings >Apps,然后切换所需的 Google 应用程序以启用它们。
- 配置权限:某些应用程序可能需要额外的权限或验证。在这种情况下,请按照提示授予必要的访问权限。
- 使用集成的应用程序:启用后,您可以在 Gemini 聊天界面中直接与这些 Google 应用程序互动。通过这些集成,您可以使用聊天机器人完成写邮件、看视频、搜索航班等任务。
ChatGPT与Claude和Gemini的外部应用程序使用情况对比
以下是 ChatGPT、Claude 和 Gemini 整合外部应用程序的比较。
功能 | ChatGPT | Claude | Gemini |
平台可用性 | 桌面(macOS) | 所有操作系统上的桌面(通过 Fleur 安装) | Web 界面 |
可访问应用 | IDE、终端和文本编辑器 | 各种外部应用程序,如 Slack、Notion、Salesforce 等。 (via API key 配置) | Google Flights、Hotels、Maps、YouTube(默认)以及其他 Google 应用程序(通过设置) |
用户权限 | 每个提示明确确认 | 每条提示的权限请求,可选择整个会话批准 | 通过提示符“@”直接访问,并可通过设置进行切换 |
目标用户 | Plus、Pro 和 Team 用户(计划扩展) | 寻求集成生产力工具的用户 | 需要快速访问 Google 服务的普通网络用户 |
AI聊天机器人使用APP的未来前景
外部应用程序集成到人工智能聊天机器人中的出现标志着它们的运行方式发生了重大转变。通过使这些工具能够访问和处理来自外部应用程序的数据,我们正在见证其代理人工智能能力的早期阶段。这意味着在不久的将来,人工智能聊天机器人可能会在多个平台上自主执行复杂的任务–从编码和数据分析到管理日程和旅行计划。
MCP 的引入进一步扩大了这些可能性。有了 MCP,聊天机器人可以回忆过去的对话,参考外部数据源,并通过更深入的上下文理解来执行多步骤任务。这种转变使人工智能驱动的自动化不仅功能更强大,而且更直观、更个性化。
有趣的是,所有主要的人工智能公司都在短时间内推出了这些集成。这不禁让人怀疑,它们是否早已准备好了测试版,只是在等待合适的时机或来自其他版本的竞争压力。这种同时推出的情况表明,整个行业都认识到了对更深入、更能感知上下文的人工智能集成的需求。
随着这些功能的发展,我们可以预期它们将进一步扩展到更广泛的应用和更复杂的交互。将外部应用程序与 LLM 集成,可以彻底改变专业和个人环境中的工作效率、数字协作和用户体验。
小结
通过 MCP 和其他技术整合应用程序标志着 ChatGPT、Claude 和 Gemini 等人工智能聊天机器人能力的飞跃。ChatGPT 的“Work with Apps”功能、Claude 的“Computer Use”功能和 Gemini 与谷歌应用程序的集成–这些都显示了人工智能代理在日常聊天机器人中迈出的第一步。这些创新不仅提高了工作效率,还预示着人工智能代理可以自主执行各种任务的未来。这些平台几乎同时发布,进一步凸显了人工智能和外部应用生态系统的快速发展和融合。有了这些随时可用的功能,您一定要亲自尝试一下,看看它们如何让您的生活变得更轻松。
评论留言