OpenAI 在 ChatGPT 中引入了突破性的视觉功能(GPT-4V)。现在,您可以在 ChatGPT 中上传和分析图像。过去,ChatGPT 上已经有了代码解释器和连接互联网等强大功能。有了新的 “用图像聊天” 功能,ChatGPT 对用户来说变得更加多功能和实用。从本质上讲,GPT-4 型号现在可以轻松地看、听甚至说话。因此,如果您想尝试 ChatGPT 的新图像分析功能,请按照我们下面的教程进行操作。
注:要使用 ChatGPT 的新图像分析功能,您必须订阅每月 20 美元的 ChatGPT Plus。其知识截止日期为 2021 年 9 月,与 GPT-4 相同。
在网页端上使用 ChatGPT 的图像分析功能
1. 打开 ChatGPT(访问)并登录您的账户。
2. 接下来,转到 “GPT-4” 模型。
3. 将鼠标悬停在 “GPT-4” 上,会出现一个下拉菜单。确保您处于 “Default” 模式。
4. 现在,如下图所示,信息框左下方会出现 “Chat with images” 选项。
5. 点击 “image” 按钮并上传图像。现在,就图片向 ChatGPT 提问。
6. 例如,我上传了一个硬盘的图像,并要求它查找接口名称,以及是否可以使用固态硬盘代替。它正确识别了接口,并告诉我可以用哪种固态硬盘代替。
7. 还有一次,我给了它一份字迹难以辨认的历史文献,它很好地破译了其中的文字。它还详细指出了文件的重要意义。GPT-4 的视觉功能有很多不可思议的应用案例,您可以尽情探索。
在 Android 和 iOS 上使用 ChatGPT 的图片功能
ChatGPT 的图片功能不仅限于桌面网站。您还可以使用官方 ChatGPT 应用程序轻松上传图片和提问。具体操作如下:
1. 在您的智能手机上安装 ChatGPT 应用程序(Android 和 iOS,免费,有内购)。
2. 接着,使用 OpenAI 账户登录,然后移到 “GPT-4” 模型。
3. 在这里,您会发现左下角有一个 “+” 按钮。点击它。
4. 然后,您可以点击 “camera” 图标立即拍摄实时照片,或者点击 “image” 图标从您的相册上传照片。
5. 我拍摄了一张汽车轮胎的实时照片,并要求 ChatGPT 解释更换轮胎的过程。
6. GPT-4V 模型提供了如何更换轮胎的清晰的分步说明,以及完成这项任务所需的工具。
7. 接下来,我向 ChatGPT 上传了一张图片,并要求它解释医疗报告。它识别了文本并正确解释了结果。尽管如此,请不要依赖 ChatGPT 进行医疗诊断,而应咨询医生。
这就是如何在电脑和智能手机上使用 ChatGPT 的图像分析功能。我发现 GPT-4 的 “视觉” 模型非常强大,而且不像 Bard 的图像处理功能那样容易产生幻觉。在某些情况下,它无法识别流行书籍中的文本,这很可能是由于版权问题。您可以在 GPT-4V 的技术论文中了解视觉功能的不足之处。尽管如此,ChatGPT 的 “图像聊天” 功能还是非常出色的,您一定要试试。
评论留言