跳转到内容
中文

模型总览

所有模型(图像、视频与音频)统一通过 POST /v1/tasks 调用,用 model 字段选择模型,参数放在 input 里。各模型的 input 字段见对应模型页。

价格统一查看实时定价页

图片模型

文生图、图生图、参考图编辑与写实图像生成。

10 个模型

GPT Image 2 文生图

可用

精准文字渲染、版式排布的文生图。

gpt-image-2

GPT Image 2 Pro 文生图

可用

更高规格文生图,适合英文提示词、品牌视觉和 2K 输出。

gpt-image-2-pro

GPT Image 2 图生图

可用

基于一张或多张参考图生成新图。

gpt-image-2-image-to-image

GPT Image 2 Pro 图生图

可用

Pro 参考图编辑与重绘,支持 1-5 张参考图和 2K 输出。

gpt-image-2-image-to-image-pro

GPT Image 2 Beta

Beta

抢先体验图像生成模型,用于早期测试。

gpt-image-2-beta

Nano Banana

可用

出图快、提示词容错高,适合快速迭代。

Nano-Banana

Nano Banana 2

可用

均衡图像模型,支持可选参考图和 1K / 2K / 4K 输出。

Nano-Banana-2

Nano Banana Pro

可用

品牌级视觉、参考图编辑与高分辨率输出。

Nano-Banana-Pro

FLUX 1.1 Pro

可用

写实风格图像生成,可选参考图引导。

flux-1.1-pro

Qwen Image 2.0

可用

低成本图像模型,中文提示词和中文文字渲染表现突出。

qwen-image-2.0

视频模型

文生视频、图生视频、参考媒体与短视频生成。

4 个模型

Seedance 2.0

可用

支持参考图片、视频与音频,可选生成同步音频。

seedance-2-0

Wan 2.7 文生视频

可用

文生视频,支持尺寸、时长、提示词扩写与镜头控制。

wan2.7-t2v

Wan 2.7 图生视频

可用

让首帧图片动起来,可选尾帧、驱动音频或首段视频。

wan2.7-i2v

HappyHorse 1.0

可用

短文生视频,3-15 秒,支持 720p / 1080p。

happyhorse-1-0

音频模型

音频生成模型上线后会在这里补充。

即将上线

音频模型

即将上线

暂未开放公开音频 model ID;上线后会同步更新文档。

暂无 model ID