GPT-4o Image 完整解析(Markdown)

返回模型解析页

GPT-4o Image API 模型解析指南

快速结论

  • 支持 prompt 文生图,适合营销、电商和创意视觉生产。
  • 支持 reference_images(最多 5 张)进行图生图与风格约束。
  • 支持 mask_url 做局部编辑,便于精修和定向修改。

核心能力

  • 高质量文生图:通过统一接口快速生成可交付图像素材。
  • 参考图一致性:通过 reference_images 提升风格和构图稳定性。
  • 局部编辑能力:通过 mask_url 对指定区域进行细粒度改图。

适用场景

  • 需要快速生成商品图、广告图、活动视觉等素材。
  • 需要在已有图片基础上做风格统一或局部重绘。

不适用场景

  • 需要长视频生成或时间序列镜头控制时。
  • 需要复杂多轮逻辑推理对话时。

运行特性

  • 统一走图片生成接口,结果通常以异步任务形式返回并通过任务状态查询。
  • reference_images 最多 5 张,单张文件大小与格式需满足文档约束。
  • mask_url 可选,用于局部编辑和替换。

最小请求示例

{
  "model": "gpt-4o-image",
  "prompt": "高质感产品广告图,柔和主光,极简背景,商业摄影风格",
  "size": "1:1",
  "n": 1
}

最小响应示例

{
  "id": "task_img_xxxxxxxx",
  "object": "generation.task",
  "model": "gpt-4o-image",
  "status": "queued",
  "progress": 0,
  "created_at": 1703884800,
  "metadata": {}
}

关键参数

参数类型必填默认值范围说明
modelstringgpt-4o-image-模型标识,必须使用 ToAPIs 提供值。
promptstring--图片描述文本。
sizestring1:11:12:3
ninteger11-4单次请求生成张数。
reference_imagesfile[]-max 5参考图片数组,用于图生图与风格控制。
mask_urlstring--遮罩图 URL,用于局部编辑。

常见错误

HTTPCode触发条件修复建议重试策略
400invalid_request_error字段缺失、类型错误或参数取值不在允许范围。校验 model/prompt/size/n/reference_images/mask_url 参数。修正请求体后重试。
401authentication_errorAPI Key 缺失或无效。确认 Authorization 头和密钥权限。修复鉴权后重试。
429rate_limit_exceeded请求频率、并发或当前额度命中上游限流策略。先做指数退避重试,并检查当前请求节奏、并发设置和额度使用情况。建议 1s/2s/4s + 抖动;连续触发时再收紧提交节奏。

FAQ

  1. GPT-4o Image 适合什么场景?
    适合高频创意出图、品牌视觉扩展、以及在已有素材上进行局部编辑。
  2. 为什么图生图效果不稳定?
    请检查 reference_images 质量与数量,并在 prompt 中明确保留元素和风格约束。
  3. 图像视频模型报错:invalid apitype: -1
    这类错误通常说明接口走错了。图像和视频模型一般不走 chat 接口,而是按对应文档发起 HTTP 任务请求,并通过任务状态接口轮询结果。排查时建议先看用户的实际请求代码、请求地址和请求体。
  4. 用户进行生成图片/视频的任务时出现任务失败,但是扣款
    先让用户提供任务日志或截图,重点看是否出现了输入或输出 token 统计。如果有这类 token 记录,大概率是用户把图片/视频模型走成了 chat 接口;这不是正确用法。图片和视频模型通常是异步任务接口,需要通过 HTTP 请求先提交任务,再拿到任务 ID 轮询状态,详细以对应文档为准。

相关 API