MaaS_GP_image

请求协议

http

参数名	类型	描述
anthorization	string	鉴权

能力地图

能力	Image Generation	Image Edit
文生图	✓	-
图片编辑	-	✓
多图输入	-	✓ (最多16张)
遮罩编辑	-	✓
流式输出	✓	✓
多种输出格式	✓	✓

一、接口及请求参数

图片生成接口 (Image Generation)

POST
https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations

根据文本提示词生成图片。

请求参数

属性名	类型	是否必需	描述
prompt	string	是	描述期望图片的文本提示词。
background	string	否	背景行为。可选值：`transparent`(透明/image2.0不支持)、`opaque`(不透明)、`auto`(自动)。
moderation	string	否	内容审核级别。可选值：`low`、`auto`。
n	integer	否	生成的图片数量。默认：1。
output_compression	number	否	`jpeg`或`webp`格式输出的压缩级别(0-100)。不支持`PNG`
output_format	string	否	输出图片格式。可选值：`png`、`jpeg`、`webp`。
quality	string	否	输出图片质量。可选值：`low`、`medium`、`high`、`auto`。
size	string	否	输出图片尺寸。可选值：`auto`、`1024x1024`、`1536x1024`、`1024x1536`。
stream	boolean	否	是否流式返回。默认false。设为true开启流式输出。
partial_images	number	否	仅流式可用。流式响应时的部分图片数量(0-3)。
user	string	否	终端用户唯一标识符，用于监控和检测滥用。

请求示例

curl -X POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
  "prompt": "A beautiful sunset over mountains with vibrant colors",
  "model": "gpt-image-1",
  "quality": "high",
  "size": "1024x1024",
  "n": 1
}'

透明背景示例（image2.0不支持）

curl -X POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
  "prompt": "A cute cat sitting, isolated on transparent background",
  "model": "gpt-image-1",
  "background": "transparent",
  "output_format": "png"
}'

流式输出示例

curl -X POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/generations \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_KEY" \
-d '{
  "prompt": "A futuristic cityscape at night",
  "model": "gpt-image-1",
  "stream": true,
  "partial_images": 2
}'

图片编辑接口 (Image Edit)

POST https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/edits

根据提示词编辑或扩展现有图片。

请求参数

属性名	类型	是否必需	描述
image	file	是	上传文件。文件格式需要为jpg或者png，文件不超过50MB
prompt	string	是	描述期望图片编辑效果的文本提示词。
input_fidelity	string	否	对原始输入图片的保真度。可选值：`high`、`low`。
mask	string	否	遮罩图片引用，用于指定编辑区域。PNG, 不超过4MB。
model	string	否	使用的模型。
n	number	否	生成的编辑图片数量。
partial_images	number	否	仅流式可用。流式响应时的部分图片数量(0-3)。设为0时单个事件返回完整图片。
quality	string	否	输出质量。可选值：`low`、`medium`、`high`、`auto`。
size	string	否	输出尺寸。可选值：`auto`、`1024x1024`、`1536x1024`、`1024x1536`。
stream	boolean	否	是否流式返回。默认false。设为true开启流式输出。
user	string	否	终端用户唯一标识符。

请求示例

{
curl 
--location --request POST 'https://genaiapi.cloudsway.net/v1/ai/{endpointPath}/images/edits' \
--header 'Authorization: Bearer $API_KEY' \
--form 'image[]=@"F:\\projects\\AiModels\\images\\1111111111111.png"' \
--form 'prompt="将人物缩减为2个"'
}

二、响应格式

非流式响应

响应示例

{
  "created": 1709312456,
  "background": "opaque",
  "output_format": "png",
  "quality": "high",
  "size": "1024x1024",
  "data": [
    {
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
    }
  ],
  "usage": {
    "input_tokens": 1250,
    "input_tokens_details": {
      "image_tokens": 1100,
      "text_tokens": 150
    },
    "output_tokens": 4096,
    "output_tokens_details": {
      "image_tokens": 4000,
      "text_tokens": 96
    },
    "total_tokens": 5346
  }
}

响应字段说明

字段	类型	说明
created	number	图片创建的Unix时间戳（秒）
background	string	使用的背景参数。可选值：`transparent`、`opaque`
output_format	string	输出格式。可选值：`png`、`webp`、`jpeg`
quality	string	生成图片的质量。可选值：`low`、`medium`、`high`
size	string	生成图片的尺寸
data	array	生成的图片列表
data[].b64_json	string	Base64编码的图片数据
usage	object	Token使用信息
usage.input_tokens	number	输入Token数（图片+文本）
usage.input_tokens_details	object	输入Token明细
usage.output_tokens	number	输出Token数
usage.output_tokens_details	object	输出Token明细
usage.total_tokens	number	总Token数

流式响应

响应示例

event: {operation_type}.partial_image
data: {
  "type": "{operation_type}.partial_image",
  "partial_image_index": 0,
  "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
}

event: {operation_type}.partial_image
data: {
  "type": "{operation_type}.partial_image",
  "partial_image_index": 1,
  "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."
}

event: {operation_type}.completed
data: {
  "type": "{operation_type}.completed",
  "created": 1709312456,
  "usage": {
    "input_tokens": 1250,
    "output_tokens": 4096,
    "total_tokens": 5346
  }
}
data: [DONE]

流式响应事件说明

事件类型	说明
`{operation_type}.partial_image`	返回部分渲染的图片。`partial_image_index`表示当前是第几个部分图片（从0开始）。部分图片数量由请求参数`partial_images`控制（0-3）。
`{operation_type}.completed`	所有图片生成完成，返回最终的usage信息。这是流式响应的最后一个事件。

{operation_type}的值根据请求接口的不同可以是：

image_generation: /images/generations

image_edit: /images/edits

流式参数说明

stream: true - 开启流式输出模式
partial_images: 0-3 - 控制返回的部分图片数量
0: 不返回部分图片，直接返回完整图片
1-3: 返回1-3张渐进式渲染的部分图片，然后返回完整图片

注意事项

完整图片可能在所有部分图片返回之前就生成完成

三、错误响应

错误响应示例

{
  "error": {
    "code": "invalid_api_key",
    "message": "Incorrect API key provided",
    "type": "invalid_request_error"
  }
}

常见错误码

错误码	说明
invalid_api_key	API密钥无效
invalid_request_error	请求参数错误
rate_limit_exceeded	超出速率限制
content_policy_violation	内容违反政策
server_error	服务器内部错误

四、附表

	Image-2	Image-1.5	Image-1	Image-1-Mini
优势	最适合高分辨率和 4K 生成、改进的图像编辑和广泛的纵横比支持	最佳选择：现实主义、指令遵循、多模态上下文，以及提升了的速度和成本。	最适合现实主义、执行指令和多模态上下文	最适合快速原型制作、批量生成或成本敏感的用例
输入/输出形式和格式	接受文本 + 图像输入;仅输出 base64 中的图像（无 URL 选项）。
图像大小/分辨率	任意分辨率：两个边缘必须是 16 像素的倍数;长边缘高达 3,840 像素（4K）：纵横比高达 3：1;像素计数 655,360–8,294,400	1024×1024、1024×1536、1536×1024
质量选项	改进后的质量控制：`low`、`medium`、`high`；`low`针对延迟敏感的用例进行了优化	`low` `medium` 、`high`（默认值 = 高）	`low` `medium` 、`high`（默认值 = 高）	`low`、（ `mediumhigh` 默认值 = 中等）
每个请求的图像数	每个请求 1-10 个图像（`n` 参数）	每个请求 1-10 个图像（`n` 参数）	每个请求 1-10 个图像（`n` 参数）	每个请求 1-10 个图像（`n` 参数）
编辑（剪写/变体）	✅ 改进了使用内绘和变体的编辑性能	✅ 支持掩码和变体 + 提示	✅ 支持通过掩码和提示进行图像修补及变体生成	✅ 支持通过掩码和提示进行修复和变体
人脸保留	✅先进的人脸保真，确保真实且一致的结果	✅用于实现真实且一致效果的高级人脸保真	✅用于逼真、一致结果的高级人脸保真	❌ 没有专门的人脸保留；更适合非人像/普通创意图像
性能与成本	高保真、现实主义优化模型;更高的延迟和成本	高保真、现实主义优化模型;改进了 GPT-Image-1 的效率和延迟	高保真、现实主义优化模型;更高的延迟和成本	大规模或迭代生成的成本高效且更快

MaaS_GP_image

请求协议

Header

能力地图

一、接口及请求参数

图片生成接口 (Image Generation)

请求参数

请求示例

透明背景示例（image2.0不支持）

流式输出示例

图片编辑接口 (Image Edit)

请求参数

请求示例

二、响应格式

非流式响应

响应示例

响应字段说明

流式响应

响应示例

流式响应事件说明

流式参数说明

注意事项

三、错误响应

错误响应示例

常见错误码

四、附表