谷歌最近结束了 Cloud Next 2024 活动,作为公开预览的一部分,搜索巨头向所有用户提供了 Gemini 1.5 Pro。与此同时,谷歌还向所有用户开放了 Gemini 1.5 Pro 模型的 API 访问权限。早些时候,谷歌发布了Gemini 1.0 Pro 的 API 访问权限,但开发者们一直在等待这款极具潜力的机型。目前,API 是免费使用的,并将持续到 2024 年 5 月 1 日。因此,如果你想访问并使用 Gemini 1.5 Pro API 密钥来评估该模型,请按照我们下面的指南进行操作。
获取 Gemini 1.5 Pro 的 API 密钥
- 前往 aistudio.google.com/app/apikey 并使用 Google 账户登录。
- 点击 “Create API key“并选择其中一个项目。
- 现在,点击 “Create API key in existing project” 。
- 就这样!Gemini 1.5 Pro API 密钥将立即生成。复制并安全保存。
如何使用 Gemini 1.5 Pro API 密钥
我将用 Pyth 演示一些示例,说明如何在文本和图像示例中使用 Gemini 1.5 Pro API 密钥。具体步骤如下。
- 首先,确保在电脑上安装了 Python 和 Pip。
- 然后,启动终端并运行以下命令来安装 Gemini 的依赖项和处理图像的 Pillow。
pip install -q -U google-generativeai pip install Pillow
- 完成上述操作后,打开您选择的代码编辑器,如Notepad++或 Sublime。您也可以打开 Visual Studio Code,以获得更好的集成开发环境。
- 然后,将下面的代码复制并粘贴到代码编辑器中。
import google.generativeai as genai genai.configure(api_key='XXXXXXXXXXXXXXXXXXXX') model = genai.GenerativeModel('gemini-1.5-pro-latest') response = model.generate_content("explain moore's law like I am 5") print(response.text)
- 在这里,我将模型定义为 gemini-1.5-pro-latest,并使用了自己的 API 密钥。在下一行,你可以设置你的问题。
- 现在,保存扩展名为
.py
的文件,并在终端运行该文件。正如你所看到的,Gemini 1.5 Pro 按照我的要求正确解释了这一概念。
- 由于 Gemini 1.5 Pro 是一个多模态模型,因此您也可以用下面的代码传递图像来检查其视觉能力。
import google.generativeai as genai import PIL.Image img = PIL.Image.open("image.png") genai.configure(api_key='XXXXXXXXXXXXXXXXXXX') model = genai.GenerativeModel('gemini-1.5-pro-latest') response = model.generate_content(["what do you see in this image", img]) print(response.text)
- 在这里,我指向与 Python 文件在同一目录下的本地 “image.png” 文件,并提出下面的问题。
gemini-1.5-pro-latest
在一个模型中支持文本和图像输入。
- 现在,只需运行代码,就可以了!它将分析图像并输出结果。我发现它在处理图像时相当准确。
这就是如何访问 Gemini 1.5 Pro 的 API 密钥并用 Python 进行测试的方法。顺便说一句,Google 尚未发布 Gemini 1.5 Pro 模型的详细文档。当 Google 更新其资源时,我们将在本文中添加更多编码示例。总之,这就是我们的全部内容。如果您遇到任何问题,请在下面的评论区告诉我们。
评论留言