Google Gemini API 文档
  1. 图片生成
Google Gemini API 文档
  • 获取 API 密钥
  • API 版本说明
  • 下载内容
  • 在Google Cloud上运行Gemini
  • 模型功能
    • 概览
    • 长上下文
    • 数据化输出
    • 文档理解
    • 图片理解
    • 视频理解
    • 音频理解
    • 文本生成
      • 文字输入
      • 图片输入
      • 流式输出
      • 多轮对话
      • 多轮对话(流式)
      • 配置参数
    • 图片生成
      • 使用 Gemini 生成图片
        POST
      • 使用 Gemini 编辑图片
        POST
      • 使用 Imagen 3 生成图片
        POST
    • Gemini 思考
      • 使用思维模型
      • 为思考模型设置预算
    • 函数调用
      • 使用 Gemini API 进行函数调用
  • 模型
    • 所有模型
    • 价格
    • 速率限制
    • 账单信息
  • 安全
    • 安全设置
    • 安全指导
  1. 图片生成

使用 Imagen 3 生成图片

开发中
正式环境
https://generativelanguage.googleapis.com
正式环境
https://generativelanguage.googleapis.com
POST
https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict
Gemini API 提供对 Imagen 3 的访问权限,该模型是 Google 质量最高的文本转图像模型,具有许多新功能和改进功能。Imagen 3 可以执行以下操作:
与之前的模型相比,生成的图片细节更丰富、光线更丰富,干扰性伪影更少
理解用自然语言编写的提示
生成各种格式和风格的图片
比之前的模型更有效地渲染文本
注意: Imagen 3 仅适用于付费层级,并且始终包含 SynthID 水印。

后续步骤#

如需详细了解如何为 Imagen 编写提示,请参阅 Imagen 提示指南。
如需详细了解 Gemini 2.0 模型,请参阅 Gemini 模型和实验性模型。
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location -g --request POST 'https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=' \
--header 'Content-Type: application/json' \
--data-raw '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
响应示例响应示例
{}

请求参数

Query 参数
key
string 
必需
示例值:
{{GEMINI_API_KEY}}
Header 参数
Content-Type
string 
必需
示例值:
application/json
Body 参数application/json
instances
array [object {1}] 
必需
prompt
string 
可选
parameters
object 
必需
sampleCount
integer 
必需
示例

返回响应

🟢200成功
application/json
Body
object {0}
上一页
使用 Gemini 编辑图片
下一页
使用思维模型
Built with