跳转至

MaaS_GP_image

请求协议

http

参数名 类型 描述
anthorization string 鉴权

能力地图

能力 Image Generation Image Edit
文生图 -
图片编辑 -
多图输入 - ✓ (最多16张)
遮罩编辑 -
流式输出
多种输出格式

一、接口及请求参数

图片生成接口 (Image Generation)

POST
https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations

根据文本提示词生成图片。

请求参数

属性名 类型 是否必需 描述
prompt string 描述期望图片的文本提示词。
background
string

背景行为。可选值:transparent(透明/image2.0不支持)、opaque(不透明)、auto(自动)。
moderation string 内容审核级别。可选值:lowauto
n integer 生成的图片数量。默认:1。
output_compression number jpegwebp格式输出的压缩级别(0-100)。不支持PNG
output_format string 输出图片格式。可选值:pngjpegwebp
quality string 输出图片质量。可选值:lowmediumhighauto
size string 输出图片尺寸。可选值:auto1024x10241536x10241024x1536
stream boolean 是否流式返回。默认false。设为true开启流式输出。
partial_images number 仅流式可用。流式响应时的部分图片数量(0-3)。
user string 终端用户唯一标识符,用于监控和检测滥用。

请求示例

curl -X POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
  "prompt": "A beautiful sunset over mountains with vibrant colors",
  "model": "gpt-image-1",
  "quality": "high",
  "size": "1024x1024",
  "n": 1
}'

透明背景示例(image2.0不支持

curl -X POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
  "prompt": "A cute cat sitting, isolated on transparent background",
  "model": "gpt-image-1",
  "background": "transparent",
  "output_format": "png"
}'

流式输出示例

curl -X POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
  "prompt": "A futuristic cityscape at night",
  "model": "gpt-image-1",
  "stream": true,
  "partial_images": 2
}'

图片编辑接口 (Image Edit)

POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/edits

根据提示词编辑或扩展现有图片。

请求参数

属性名 类型 是否必需 描述
image
file
上传文件。文件格式需要为jpg或者png,文件不超过50MB
prompt string
描述期望图片编辑效果的文本提示词。
input_fidelity
string
对原始输入图片的保真度。可选值:highlow
mask string 遮罩图片引用,用于指定编辑区域。PNG, 不超过4MB。
model string 使用的模型。
n number 生成的编辑图片数量。
partial_images number 仅流式可用。流式响应时的部分图片数量(0-3)。设为0时单个事件返回完整图片。
quality string 输出质量。可选值:lowmediumhighauto
size string 输出尺寸。可选值:auto1024x10241536x10241024x1536
stream boolean 是否流式返回。默认false。设为true开启流式输出。
user string 终端用户唯一标识符。

请求示例

{
curl 
--location --request POST 'https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/edits' \
--header 'Authorization: Bearer $API_KEY' \
--form 'image[]=@"F:\\projects\\AiModels\\images\\1111111111111.png"' \
--form 'prompt="将人物缩减为2个"'
}

二、响应格式

非流式响应

响应示例

{
  "created": 1709312456,
  "background": "opaque",
  "output_format": "png",
  "quality": "high",
  "size": "1024x1024",
  "data": [
    {
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
    }
  ],
  "usage": {
    "input_tokens": 1250,
    "input_tokens_details": {
      "image_tokens": 1100,
      "text_tokens": 150
    },
    "output_tokens": 4096,
    "output_tokens_details": {
      "image_tokens": 4000,
      "text_tokens": 96
    },
    "total_tokens": 5346
  }
}

响应字段说明

字段 类型 说明
created number 图片创建的Unix时间戳(秒)
background string 使用的背景参数。可选值:transparentopaque
output_format string 输出格式。可选值:pngwebpjpeg
quality string 生成图片的质量。可选值:lowmediumhigh
size string 生成图片的尺寸
data array 生成的图片列表
data[].b64_json string Base64编码的图片数据
usage object Token使用信息
usage.input_tokens number 输入Token数(图片+文本)
usage.input_tokens_details object 输入Token明细
usage.output_tokens number 输出Token数
usage.output_tokens_details object 输出Token明细
usage.total_tokens number 总Token数

流式响应

响应示例

event: {operation_type}.partial_image
data: {
  "type": "{operation_type}.partial_image",
  "partial_image_index": 0,
  "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
}

event: {operation_type}.partial_image
data: {
  "type": "{operation_type}.partial_image",
  "partial_image_index": 1,
  "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
}

event: {operation_type}.completed
data: {
  "type": "{operation_type}.completed",
  "created": 1709312456,
  "usage": {
    "input_tokens": 1250,
    "output_tokens": 4096,
    "total_tokens": 5346
  }
}
data: [DONE]

流式响应事件说明

事件类型 说明
{operation_type}.partial_image 返回部分渲染的图片。partial_image_index表示当前是第几个部分图片(从0开始)。部分图片数量由请求参数partial_images控制(0-3)。
{operation_type}.completed 所有图片生成完成,返回最终的usage信息。这是流式响应的最后一个事件。

{operation_type}的值根据请求接口的不同可以是:

image_generation: /images/generations

image_edit: /images/edits

流式参数说明

  • stream: true - 开启流式输出模式

  • partial_images: 0-3 - 控制返回的部分图片数量

  • 0: 不返回部分图片,直接返回完整图片

  • 1-3: 返回1-3张渐进式渲染的部分图片,然后返回完整图片

注意事项

  • 完整图片可能在所有部分图片返回之前就生成完成

三、错误响应

错误响应示例

{
  "error": {
    "code": "invalid_api_key",
    "message": "Incorrect API key provided",
    "type": "invalid_request_error"
  }
}

常见错误码

错误码 说明
invalid_api_key API密钥无效
invalid_request_error 请求参数错误
rate_limit_exceeded 超出速率限制
content_policy_violation 内容违反政策
server_error 服务器内部错误

四、附表

Image-2 Image-1.5 Image-1 Image-1-Mini
优势 最适合高分辨率和 4K 生成、改进的图像编辑和广泛的纵横比支持 最佳选择:现实主义、指令遵循、多模态上下文,以及提升了的速度和成本。 最适合现实主义、执行指令和多模态上下文 最适合快速原型制作、批量生成或成本敏感的用例
输入/输出形式和格式 接受 文本 + 图像 输入;仅输出 base64 中的图像(无 URL 选项)。
图像大小/分辨率 任意分辨率:两个边缘必须是 16 像素的倍数;长边缘高达 3,840 像素 (4K):纵横比高达 3:1;像素计数 655,360–8,294,400 1024×1024、1024×1536、1536×1024
质量选项 改进后的质量控制:lowmediumhighlow针对延迟敏感的用例进行了优化 low mediumhigh(默认值 = 高) low mediumhigh(默认值 = 高) low、( mediumhigh 默认值 = 中等)
每个请求的图像数 每个请求 1-10 个图像(n 参数) 每个请求 1-10 个图像(n 参数) 每个请求 1-10 个图像(n 参数) 每个请求 1-10 个图像(n 参数)
编辑(剪写/变体) ✅ 改进了使用内绘和变体的编辑性能 ✅ 支持掩码和变体 + 提示 ✅ 支持通过掩码和提示进行图像修补及变体生成 ✅ 支持通过掩码和提示进行修复和变体
人脸保留 ✅先进的人脸保真,确保真实且一致的结果 ✅用于实现真实且一致效果的高级人脸保真 ✅用于逼真、一致结果的高级人脸保真 ❌ 没有专门的人脸保留;更适合非人像/普通创意图像
性能与成本 高保真、 现实主义优化 模型;更高的延迟和成本 高保真、 现实主义优化 模型;改进了 GPT-Image-1 的效率和延迟 高保真、 现实主义优化 模型;更高的延迟和成本 大规模或迭代生成的成本高效且更快