使用 Imagen 3 生成图片

开发中

正式环境

https://generativelanguage.googleapis.com

POST

https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict

Gemini API 提供对 Imagen 3 的访问权限，该模型是 Google 质量最高的文本转图像模型，具有许多新功能和改进功能。Imagen 3 可以执行以下操作：

与之前的模型相比，生成的图片细节更丰富、光线更丰富，干扰性伪影更少

理解用自然语言编写的提示

生成各种格式和风格的图片

比之前的模型更有效地渲染文本

注意： Imagen 3 仅适用于付费层级，并且始终包含 SynthID 水印。

后续步骤

如需详细了解如何为 Imagen 编写提示，请参阅 Imagen 提示指南。

如需详细了解 Gemini 2.0 模型，请参阅 Gemini 模型和实验性模型。

请求示例

Shell

JavaScript

Java

Swift

curl --location -g --request POST 'https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=' \
--header 'Content-Type: application/json' \
--data-raw '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

响应示例

{}

请求参数

Query 参数

key

string

必需

示例值:

Header 参数

Content-Type

string

必需

示例值:

application/json

Body 参数application/json

instances

array [object {1}]

必需

prompt

string

可选

parameters

object

必需

sampleCount

integer

必需

示例

返回响应

🟢200成功

application/json

Body

object {0}

修改于 2025-04-23 06:12:42

使用 Gemini 编辑图片

使用思维模型

使用 Imagen 3 生成图片

后续步骤#

请求参数

返回响应

后续步骤