模型总览

所有模型（图像、视频与音频）统一通过 POST /v1/tasks 调用，用 model 字段选择模型，参数放在 input 里。各模型的 input 字段见对应模型页。

价格统一查看实时定价页。

图片模型 10 个模型 视频模型 4 个模型 音频模型 即将上线

图片模型

文生图、图生图、参考图编辑与写实图像生成。

10 个模型

GPT Image 2 文生图

可用

精准文字渲染、版式排布的文生图。

gpt-image-2

查看详情

GPT Image 2 Pro 文生图

可用

更高规格文生图，适合英文提示词、品牌视觉和 2K 输出。

gpt-image-2-pro

查看详情

GPT Image 2 图生图

可用

基于一张或多张参考图生成新图。

gpt-image-2-image-to-image

查看详情

GPT Image 2 Pro 图生图

可用

Pro 参考图编辑与重绘，支持 1-5 张参考图和 2K 输出。

gpt-image-2-image-to-image-pro

查看详情

GPT Image 2 Beta

Beta

抢先体验图像生成模型，用于早期测试。

gpt-image-2-beta

查看详情

Nano Banana

可用

出图快、提示词容错高，适合快速迭代。

Nano-Banana

查看详情

Nano Banana 2

可用

均衡图像模型，支持可选参考图和 1K / 2K / 4K 输出。

Nano-Banana-2

查看详情

Nano Banana Pro

可用

品牌级视觉、参考图编辑与高分辨率输出。

Nano-Banana-Pro

查看详情

FLUX 1.1 Pro

可用

写实风格图像生成，可选参考图引导。

flux-1.1-pro

查看详情

Qwen Image 2.0

可用

低成本图像模型，中文提示词和中文文字渲染表现突出。

qwen-image-2.0

查看详情

视频模型

文生视频、图生视频、参考媒体与短视频生成。

4 个模型

Seedance 2.0

可用

支持参考图片、视频与音频，可选生成同步音频。

seedance-2-0

查看详情

Wan 2.7 文生视频

可用

文生视频，支持尺寸、时长、提示词扩写与镜头控制。

wan2.7-t2v

查看详情

Wan 2.7 图生视频

可用

让首帧图片动起来，可选尾帧、驱动音频或首段视频。

wan2.7-i2v

查看详情

HappyHorse 1.0

可用

短文生视频，3-15 秒，支持 720p / 1080p。

happyhorse-1-0

查看详情

音频模型

音频生成模型上线后会在这里补充。

即将上线

音频模型

即将上线

暂未开放公开音频 model ID；上线后会同步更新文档。

暂无 model ID

查看状态